基于自建语料库的彝语基础学习模式设计与平台实现

发布时间:2024-03-21 18:21
  语料库的发展从1.0、2.0到大数据推动下的3.0时代,给语言研究及语言应用研究带来了革命性变化,尤其是在机器翻译、语音识别等应用的大趋势下,语料库成为了一切自然语言处理的基础。民族语料库构建工作可追溯至上世纪八九十年代,以蒙、维、藏等几个少数民族语为突出代表,无论是在语料库构建还是基于语料库的语言研究、语言教学或语音识别、机器翻译等方面的应用研究都取得了重大突破。相较而言,彝语语料库的构建及其应用研究还存在巨大空缺,已建彝语语料库主要为彝汉或彝汉英平行语料库以及方言语料库,用于彝汉机器翻译以及语音识别等应用研究。同时,随着教育信息化建设在民族地区的飞速发展,彝语的社会使用功能以及彝文研究价值的逐年提升,彝区也掀起一股学习彝语的热潮。如何实现彝语学习的信息化,发展彝语言自身的教育信息化成为了亟待解决的问题。因此,本文构建彝语基础学习语料库,增补对准语言学习的彝语语料资源;以语料驱动学习指导彝语基础学习资源设计,同时将字源识字法引入彝语的学习中,挖掘彝文字的文化内涵并借助多媒体等现代化手段加以呈现;进一步设计开发彝语基础学习平台,促进彝语资源数字化和学习信息化。主要研究工作和成果如下:(...

【文章页数】:110 页

【学位级别】:硕士

【部分图文】:

图2.2语音采集软件(发音人信息采集)

图2.2语音采集软件(发音人信息采集)

第2章彝语语料库的构建20图2.2语音采集软件(发音人信息采集)图2.3语音采集软件(语音采集界面)由于彝语词汇数据较多,默认语料采集类型为彝语词汇,采集过程中发音人可点击“其他录音”选择语料类型,如字、日常会话、尔比、诗词、歌词、影视等分类下的语料,如图2.4所示。为及时对采集....


图2.3语音采集软件(语音采集界面)

图2.3语音采集软件(语音采集界面)

第2章彝语语料库的构建20图2.2语音采集软件(发音人信息采集)图2.3语音采集软件(语音采集界面)由于彝语词汇数据较多,默认语料采集类型为彝语词汇,采集过程中发音人可点击“其他录音”选择语料类型,如字、日常会话、尔比、诗词、歌词、影视等分类下的语料,如图2.4所示。为及时对采集....


图2.4语音采集软件(语料选择界面)

图2.4语音采集软件(语料选择界面)

第2章彝语语料库的构建20图2.2语音采集软件(发音人信息采集)图2.3语音采集软件(语音采集界面)由于彝语词汇数据较多,默认语料采集类型为彝语词汇,采集过程中发音人可点击“其他录音”选择语料类型,如字、日常会话、尔比、诗词、歌词、影视等分类下的语料,如图2.4所示。为及时对采集....


图2.5语音采集软件(管理员语音库界面)

图2.5语音采集软件(管理员语音库界面)

第2章彝语语料库的构建20图2.2语音采集软件(发音人信息采集)图2.3语音采集软件(语音采集界面)由于彝语词汇数据较多,默认语料采集类型为彝语词汇,采集过程中发音人可点击“其他录音”选择语料类型,如字、日常会话、尔比、诗词、歌词、影视等分类下的语料,如图2.4所示。为及时对采集....



本文编号:3933962

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3933962.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户20597***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]