和元多媒体语料库系统的设计与实现
发布时间:2021-03-08 14:19
随着互联网技术的飞速发展,不同国家、不同文化、不同语言的人之间越来越渴望能拥有一种新的语言形式来进行更加方便快捷的交流沟通。西北大学小露珠团队提出了基于网络的语言——“和”,旨在方便人们进行跨文化、跨语种、跨地域的的交流。语料库是语言研究的重要手段。但是现有的网络语言研究多是针对文字或者单纯的网络表情,而现有的多媒体语料库研究多是针对单个的多媒体语料,没有把多媒体语料与聊天语言进行有机的结合。因此,为了更好的推进“和”语言的研究和使用,研究基于“和”语言的多媒体语料库势在必行。本文在对传统多媒体语料库以及网络语言的研究现状进行总结和分析基础上,首先根据“和”语言的特点,提出了基于网络聊天活动的语料概念模型,该语料模型对网络聊天活动进行抽象并划分为活动者的角度、活动的角度以及系统的角度进行研究;其次,为了解决基于网络聊天的多媒体语料的处理问题,给出了多媒体语料分层处理模型,该模型从语料物理层、语料语义层以及整体语段、篇章处理层逐层说明了多媒体语料的处理过程;最后在多媒体语料库模型的基础上,提出相关需求,进一步设计和实现了基于“和”语言的多媒体语料库系统——和元(Harmony Multi...
【文章来源】:西北大学陕西省 211工程院校
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
“和”语言及其相关系统间的关系
西北大学硕士专业学位论文个语料添加一个或多个标签;第二阶段为评审阶段,由多位标注者从标注阶段获得的标签中选出最认可的部分标签,这些标注者分别从给定语料和其对应的标签集合中选择一个或多个自己认为最满意的标签,系统后台会对用户的投票计数,并按投票数把所有标签从高到低排列,保留用户认可度最高的标签作为该语料的标签,将该标签作为语料的语义。荷棠在标注完成后把标注好的语义返回到语料库中。图 2 为荷棠的众包标注模型图。
SpringBoot的配置
【参考文献】:
期刊论文
[1]面向聊天记录的语义分析研究[J]. 王媛媛,范潮钦,苏玉海. 信息网络安全. 2017(09)
[2]新媒体时代网络语言的传播研究[J]. 范娟华. 新媒体研究. 2017(07)
[3]面向海量高清视频数据的高性能分布式存储系统[J]. 操顺德,华宇,冯丹,孙园园,左鹏飞. 软件学报. 2017(08)
[4]谈话节目语料库的构建与会话结构分析[J]. 王珊,刘锐. 中文信息学报. 2016(06)
[5]汉语网络语言研究现状分析——关于建立“汉语网络语言语料库”的设想[J]. 苌淑君. 现代语文(语言研究版). 2016(07)
[6]基于隐马尔可夫模型的主观句识别[J]. 刘培玉,荀静,费绍栋,朱振方. 中文信息学报. 2016(04)
[7]汉语网络语言语料库:研制与应用[J]. 曹进,赵鸿章,王灏. 兰州文理学院学报(社会科学版). 2015(05)
[8]谈汉语中介语语料库的建设标准[J]. 张宝林,崔希亮. 语言文字应用. 2015(02)
[9]中文分词与词性标注研究[J]. 梁喜涛,顾磊. 计算机技术与发展. 2015(02)
[10]关于《地书》[J]. 徐冰. 雪莲. 2014(08)
硕士论文
[1]语料库众包工具—荷裳的设计与实现[D]. 阿宇.西北大学 2018
[2]和音即时通讯工具的设计与实现[D]. 张国庆.西北大学 2017
本文编号:3071196
【文章来源】:西北大学陕西省 211工程院校
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
“和”语言及其相关系统间的关系
西北大学硕士专业学位论文个语料添加一个或多个标签;第二阶段为评审阶段,由多位标注者从标注阶段获得的标签中选出最认可的部分标签,这些标注者分别从给定语料和其对应的标签集合中选择一个或多个自己认为最满意的标签,系统后台会对用户的投票计数,并按投票数把所有标签从高到低排列,保留用户认可度最高的标签作为该语料的标签,将该标签作为语料的语义。荷棠在标注完成后把标注好的语义返回到语料库中。图 2 为荷棠的众包标注模型图。
SpringBoot的配置
【参考文献】:
期刊论文
[1]面向聊天记录的语义分析研究[J]. 王媛媛,范潮钦,苏玉海. 信息网络安全. 2017(09)
[2]新媒体时代网络语言的传播研究[J]. 范娟华. 新媒体研究. 2017(07)
[3]面向海量高清视频数据的高性能分布式存储系统[J]. 操顺德,华宇,冯丹,孙园园,左鹏飞. 软件学报. 2017(08)
[4]谈话节目语料库的构建与会话结构分析[J]. 王珊,刘锐. 中文信息学报. 2016(06)
[5]汉语网络语言研究现状分析——关于建立“汉语网络语言语料库”的设想[J]. 苌淑君. 现代语文(语言研究版). 2016(07)
[6]基于隐马尔可夫模型的主观句识别[J]. 刘培玉,荀静,费绍栋,朱振方. 中文信息学报. 2016(04)
[7]汉语网络语言语料库:研制与应用[J]. 曹进,赵鸿章,王灏. 兰州文理学院学报(社会科学版). 2015(05)
[8]谈汉语中介语语料库的建设标准[J]. 张宝林,崔希亮. 语言文字应用. 2015(02)
[9]中文分词与词性标注研究[J]. 梁喜涛,顾磊. 计算机技术与发展. 2015(02)
[10]关于《地书》[J]. 徐冰. 雪莲. 2014(08)
硕士论文
[1]语料库众包工具—荷裳的设计与实现[D]. 阿宇.西北大学 2018
[2]和音即时通讯工具的设计与实现[D]. 张国庆.西北大学 2017
本文编号:3071196
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3071196.html