当前位置:主页 > 文艺论文 > 汉语言论文 >

先秦文献《孟子》自动分词方法研究

发布时间:2017-09-28 02:10

  本文关键词:先秦文献《孟子》自动分词方法研究


  更多相关文章: 先秦文献 《孟子》 自动分词 条件随机场 注疏文献


【摘要】:自动分词是中文信息处理重要的基础课题。文章主要探讨了先秦文献《孟子》基于条件随机场统计模型的自动分词方法和利用相关注疏文献的自动分词方法等自动分词技术。自动分词实验结果表明,这两种分词方法效果显著,词语F值和小句F值均达到了较高的水平。在用不同的方法对《孟子》进行自动分词时,在词语F值的统计指标外,首次尝试引入了小句F值这一统计指标。
【作者单位】: 南京师范大学国际文化教育学院;南京师范大学文学院;
【关键词】先秦文献 《孟子》 自动分词 条件随机场 注疏文献
【基金】:江苏省教育厅高校哲学社会科学基金项目(编号:2011SJB740010) 教育部人文社会科学研究项目(编号:12YJCZH121) 江苏高校重点研究基地重大项目(编号:2010JDXM023) “江苏高校优势学科建设工程资助项目”资助
【分类号】:H141
【正文快照】: 自动分词作为中文信息处理的基础课题之一,在近二十年来取得了长足进步,多个成熟的自动分词系统被设计和使用[1]。实际上,一个较为成熟的自动分词系统既可以为继续深入研究语言提供基础和数据支持,也是构建句法分析、机器翻译、文献检索等复杂系统的必要前提。从这层意义上来

【参考文献】

中国期刊全文数据库 前5条

1 石民;李斌;陈小荷;;基于CRF的先秦汉语分词标注一体化研究[J];中文信息学报;2010年02期

2 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[J];中文信息学报;2012年02期

3 邱冰;皇甫娟;;基于中文信息处理的古代汉语分词研究[J];微计算机信息;2008年24期

4 宗成庆;曹右琦;俞士汶;;中文信息处理60年[J];语言文字应用;2009年04期

5 沈达阳,孙茂松,黄昌宁;基于统计的汉语分词模型及实现方法[J];中文信息;1998年Z1期

【共引文献】

中国期刊全文数据库 前10条

1 葛宇;梁静;陈晓敏;;搜索引擎系统中热点问题的探讨[J];成都电子机械高等专科学校学报;2009年04期

2 赫琳;张榴琳;;副词“才”的语义指向及其计算机识别研究[J];长江学术;2012年01期

3 徐紫云;徐雪松;;从自动分词角度看先秦与现代汉语词汇区别[J];华东交通大学学报;2009年06期

4 陈其晖,应志伟,柴佩琪;基于歧义二叉树的汉语分词方法[J];计算机辅助工程;1999年04期

5 曹倩,丁艳,王超,潘金贵;汉语自动分词研究及其在信息检索中的应用[J];计算机应用研究;2004年05期

6 石民;李斌;陈小荷;;基于CRF的先秦汉语分词标注一体化研究[J];中文信息学报;2010年02期

7 陈顺强;;彝文自动分词技术研究[J];中文信息学报;2011年03期

8 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[J];中文信息学报;2012年02期

9 张颖杰;李斌;陈家骏;陈小荷;;基于词典信息的先秦汉语全文词义标注方法研究[J];中文信息学报;2012年03期

10 彭炜明;宋继华;王宁;康明吉;;汉语传统语法及其在中文信息处理中的应用展望[J];中文信息学报;2012年04期

中国重要会议论文全文数据库 前4条

1 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 张颖杰;李斌;陈家骏;陈小荷;;基于词典的半指导学习古汉语全文词义标注[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 石民;陈小荷;于丽丽;李斌;;基于CRF的古汉语分词标注一体化研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

4 康生巧;白宇;韩亚冬;蔡东风;;基于句子相似的古今句子检索[A];第六届全国信息检索学术会议论文集[C];2010年

中国博士学位论文全文数据库 前3条

1 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年

2 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年

3 王迈;语言形式化原理[D];上海外国语大学;2011年

中国硕士学位论文全文数据库 前10条

1 柴艳丽;复音同义词检索与分析系统的设计与研究[D];广西民族大学;2010年

2 郭剑;语义检索在出版社网站中的应用研究[D];北京印刷学院;2010年

3 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年

4 李长进;基于中文带权关键词树的受限领域问答系统研究[D];山东经济学院;2011年

5 刘冬雪;搜索引擎检索结果聚类系统的研究与实现[D];北京邮电大学;2011年

6 李海光;基于位置和语义特征的中文命名实体关系抽取研究[D];合肥工业大学;2011年

7 苏燕;现代汉语标题结构类型的计算机自动分析[D];广西民族大学;2011年

8 陈利东;宁波市数字图书馆若干关键技术的研究与应用[D];浙江工业大学;2010年

9 杜尔斌;基于改进KNN的文本分类算法的设计与实现[D];上海交通大学;2010年

10 康生巧;中医药知识检索系统的研究与实现[D];沈阳航空航天大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 俞士汶;;语言随计算齐飞——特邀编审的话[J];当代语言学;2009年02期

2 尉迟治平;计算机技术和汉语史研究[J];古汉语研究;2000年03期

3 陈肇雄;SC文法功能体系[J];计算机学报;1992年11期

4 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期

5 常娥;侯汉清;曹玲;;古籍自动校勘的研究和实现[J];中文信息学报;2007年02期

6 俞士汶;;建设综合型语言知识库的理念与成果的价值[J];中文信息学报;2007年06期

7 石民;李斌;陈小荷;;基于CRF的先秦汉语分词标注一体化研究[J];中文信息学报;2010年02期

8 肖磊;陈小荷;;古籍版本异文的自动发现[J];中文信息学报;2010年05期

9 刘挺,吴岩,王开铸;串频统计和词形匹配相结合的汉语自动分词系统[J];中文信息学报;1998年01期

10 宋彦;蔡东风;张桂平;赵海;;一种基于字词联合解码的中文分词方法[J];软件学报;2009年09期

【相似文献】

中国期刊全文数据库 前10条

1 宋永泽;《孟子》代词综考[J];山西师大学报(社会科学版);1998年02期

2 路飞飞;《孟子》假设复句初探[J];中北大学学报(社会科学版);2005年01期

3 孙尊章;徐凌;梁任芝;;《论语》《孟子》时间副词比较研究[J];重庆职业技术学院学报;2007年02期

4 刘春娟;;《孟子》中的“焉”[J];安徽文学(下半月);2009年12期

5 熊浩莉;《孟子》词句类比喻论析[J];重庆师范大学学报(哲学社会科学版);2005年04期

6 白雁南;;《世说新语》语气副词继承中的发展[J];语文学刊;2007年09期

7 韩慧鸽;;《颜氏家训》语气副词继承中的发展[J];现代语文(语言研究版);2010年05期

8 张琳琳;;浅析《孟子》中状语的语义指向——从语义平面研究归纳《孟子》状中结构中状语的语义指向规律[J];黔南民族师范学院学报;2010年02期

9 敏春芳;《孟子》标注献疑——《古代汉语》教学札记[J];丝绸之路;2004年S2期

10 王静静;;《孟子》否定副词研究[J];襄樊职业技术学院学报;2009年06期

中国重要会议论文全文数据库 前10条

1 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 李小明;王亚莉;易立夫;杨静;孙金城;;自动分词中的单字虚词处理[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年

3 高璐;陈琪;李永宏;于洪志;;藏语语音合成中本文分析的若干问题研究[A];第九届中国语音学学术会议论文集[C];2010年

4 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

5 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年

6 郑家恒;李文花;;新词语自动识别方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

7 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

8 吾守尔·斯拉木;;前言[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

9 陈玉忠;李保利;俞士汶;兰措吉;;基于格助词和接续特征的藏文自动分词方案[A];第一届学生计算语言学研讨会论文集[C];2002年

10 罗江文;;由古文字谈儒家忠孝观[A];孔学研究(第五辑)——云南孔子学术研究会第五次学术研讨会暨海峡两岸第三次孔学研讨会论文集[C];1998年

中国重要报纸全文数据库 前10条

1 顾农;《孟子》里的一处标点[N];中华读书报;2009年

2 王們;说“巨擘”[N];语言文字周报;2011年

3 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年

4 心言;文字的删繁就简[N];楚雄日报(汉);2005年

5 贾作林;谈谈方言的保护问题[N];学习时报;2008年

6 教育部语信司;国家语言资源监测与研究中心召开2007数据发布专题研讨会[N];语言文字周报;2008年

7 于亭;现代语言学形态视野中的甲骨刻辞语法学研究[N];中华读书报;2004年

8 仁乐水;搜罗全备的古汉语通假字工具书[N];中华读书报;2007年

9 南京大学中国思想家研究中心 许苏民;汉语不如德语富于思辨性吗[N];光明日报;2009年

10 学者 王立群;汉字要稳定,不要折腾[N];中华读书报;2009年

中国博士学位论文全文数据库 前6条

1 周文德;《孟子》单音节实词同义词研究[D];四川大学;2002年

2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年

3 焦毓梅;《十诵律》常用动作语义场词汇研究[D];四川大学;2007年

4 龙丹;魏晋核心词研究[D];华中科技大学;2008年

5 朱湘云;《梁书》词语研究[D];厦门大学;2008年

6 施真珍;《后汉书》核心词研究[D];华中科技大学;2009年

中国硕士学位论文全文数据库 前10条

1 刘化平;《孟子》中的排比研究[D];湖北师范学院;2013年

2 陆从兰;出土先秦文献中的“也”“只”及相关字研究[D];安徽大学;2011年

3 孔亚飞;《孟子》修辞研究[D];曲阜师范大学;2011年

4 张琳娜;顺应—关联模式下《孟子》中的隐喻构建与理解[D];广西师范大学;2011年

5 李海燕;评价理论视角下的《孟子》话语分析[D];曲阜师范大学;2012年

6 雷淑娟;《孟子》类比[D];黑龙江大学;2001年

7 王晶晶;《孟子》的介词“以”[D];辽宁师范大学;2010年

8 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年

9 于飞;《论语》《孟子》述宾结构语义关系综合考察[D];黑龙江大学;2013年

10 郭萍;《孟子》复音词研究[D];厦门大学;2002年



本文编号:933190

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/933190.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户974bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com