当前位置:主页 > 外语论文 > 外语文化论文 >

中国英语新词语料库构建技术研究

发布时间:2021-08-25 10:59
  随着中国英语新词大量出现,缺少中国英语新词语料库成为研究中国英语的主要障碍,新词识别是建设语料库主要的技术问题。针对现有的点互信息和邻接熵新词识别算法中的词内部凝聚度低,及点互信息单阈值设置存在较多高阈值无效词组,且低阈值新词组无法识别的问题,提出了改进多字点互信息和邻接熵中国英语新词识别算法。利用多字点互信息以及点互信息双阈值的设定来识别新词。实验结果表明,相同数据和实验环境下,该方法提高了准确率、召回率和F值,对语料库建设是有效可行的。 

【文章来源】:计算机工程与应用. 2020,56(16)北大核心CSCD

【文章页数】:4 页

【参考文献】:
期刊论文
[1]近十五年国内英语词汇学习策略的文献计量分析[J]. 郑已东,郭艳珍.  兵团教育学院学报. 2018(03)
[2]基于改进互信息和邻接熵的微博新词发现方法[J]. 夭荣朋,许国艳,宋健.  计算机应用. 2016(10)
[3]A novel unsupervised method for new word extraction[J]. Lili MEI,Heyan HUANG,Xiaochi WEI,Xianling MAO.  Science China(Information Sciences). 2016(09)
[4]中文植物物种多样性描述文本的信息抽取研究[J]. 段宇锋,黄思思.  现代图书情报技术. 2016(01)
[5]基于词内部结合度和边界自由度的新词发现[J]. 李文坤,张仰森,陈若愚.  计算机应用研究. 2015(08)
[6]顺应论视角下的“中国英语词汇”[J]. 李瑞棉,承红.  海外英语. 2015(02)
[7]Geliable Lexical Borrowings in China English on the Internet[J]. 付雪芬,程金花.  海外英语. 2012(21)
[8]面向术语抽取的双阈值互信息过滤方法[J]. 陈士超,郁滨.  计算机应用. 2011(04)
[9]英语全球化、本土化视野中的中国英语[J]. 李少华.  宁夏大学学报(人文社会科学版). 2005(04)

硕士论文
[1]中文新词检测与分析[D]. 崔世起.中国科学院研究生院(计算技术研究所) 2006



本文编号:3361989

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/waiguoyuyanwenhua/3361989.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户655b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com