基于条件随机场的兼语结构自动识别
本文选题:兼语结构 + 条件随机场 ; 参考:《情报科学》2012年03期
【摘要】:本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计算机自动识别提供语言学支持。基于这些特征建立模板,从而构建条件随机场模型,对兼语结构进行自动识别。在开放训练中,F值最高可达85.71%,这个结果表明条件随机场在兼语结构识别中已经接近应用水平,可以作为兼语结构识别的有效方法。
[Abstract]:The object of this study is the complex conjunctive structure in Chinese. The internal and external linguistic features are analyzed by observing the distribution of the conjunctive structure in the large-scale corpus. One is to provide data support for the structural research from a quantitative point of view, the other is to provide linguistic support for computer automatic recognition. Based on these features, the template is established, and the conditional random field model is constructed to recognize the conjunctive structure automatically. In open training, the maximum F value can reach 85.71. The result shows that conditional random field is close to the application level in conjunctive structure recognition, and can be used as an effective method for conjunctive structure recognition.
【作者单位】: 南京大学信息管理系;南京医科大学图书馆;
【基金】:2010年国家社科基金(10BTQ005) 国家863项目(2009AA01A339) 南京大学研究生科研创新基金资助项目(2010CW02)
【分类号】:H08
【参考文献】
相关期刊论文 前2条
1 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
2 詹卫东,常宝宝,俞士汶;汉语短语结构定界歧义类型分析及分布统计[J];中文信息学报;1999年03期
相关硕士学位论文 前1条
1 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
【共引文献】
相关期刊论文 前7条
1 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
2 党政法,周强;短语树到依存树的自动转换研究[J];中文信息学报;2005年03期
3 李幸;宗成庆;;引入标点处理的层次化汉语长句句法分析方法[J];中文信息学报;2006年04期
4 张政;机器翻译难点所在[J];外语研究;2005年05期
5 杨泉;冯志伟;;机用现代汉语“n+n”结构歧义研究[J];语言研究;2005年04期
6 杨泉,冯志伟;面向中文信息处理的现代汉语“v+v”结构歧义问题研究[J];语言文字应用;2005年01期
7 罗慧慧;;需求分析辅助生成系统的探讨与构建[J];仲恺农业技术学院学报;2006年04期
相关会议论文 前10条
1 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 郑旭玲;李堂秋;杨晓峰;陈毅东;;基于语义规则的汉语短语结构分析排歧初探[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 陆俭明;王黎;;句处理中排歧问题补议[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 戴胜海;杨波;颜伟;;现代汉语“名+名”组合的统计考察[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 杨泉;;机用现代汉语a+a结构消歧研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 李向阳;张亚非;;一种基于语义的汉语短语识别方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
8 满正行;高璐;;藏语单语料库分析及标注探讨[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 卢俊之;陈小荷;曲维光;王东波;陈锋;丁德鑫;;基于语法功能匹配的汉语句法分析算法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 王锦;陈群秀;;现代汉语语义资源用于短语歧义模式消歧研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
相关博士学位论文 前5条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 WANG Jiayue;[D];广东外语外贸大学;2003年
3 黎意;汉藏语述补结构研究[D];中央民族大学;2004年
4 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
5 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
相关硕士学位论文 前8条
1 杨晓峰;汉英机器翻译系统中的一种语义排岐模型研究[D];厦门大学;2001年
2 郑旭玲;面向机器翻译的汉语短语语义模式规则研究[D];厦门大学;2002年
3 许林杰;中文文本分词研究[D];山东师范大学;2003年
4 陈宣荣;[D];电子科技大学;2003年
5 袁煜;汉语短语歧义结构受限消歧策略探讨[D];西南交通大学;2004年
6 李海军;基于语义的汉语短语结构歧义研究与实现[D];西北大学;2006年
7 刘杰;基于唐诗语料词的提取与统计分析的研究[D];吉林大学;2006年
8 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年
【二级参考文献】
相关期刊论文 前10条
1 陈小英;带兼语的“使”与“让”之比较[J];广西社会科学;2005年02期
2 游汝杰;现代汉语兼语句的句法和语义特征[J];汉语学习;2002年06期
3 赵军,黄昌宁;结合句法组成模板识别汉语基本名词短语的概率模型[J];计算机研究与发展;1999年11期
4 曲维光,陈小荷,吉根林;基于框架的词语搭配自动抽取方法[J];计算机工程;2004年23期
5 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
6 李剑锋,胡国平,王仁华;基于最大熵模型的韵律短语边界预测[J];中文信息学报;2004年05期
7 干俊伟,黄德根;汉语介词短语的自动识别[J];中文信息学报;2005年04期
8 罗振声,,郑碧霞;汉语句型自动分析和分布统计算法与策略的研究[J];中文信息学报;1994年02期
9 冯志伟;论歧义结构的潜在性[J];中文信息学报;1995年04期
10 赵军,黄昌宁;基于转换的汉语基本名词短语识别模型[J];中文信息学报;1999年02期
相关会议论文 前1条
1 周强;;汉语句法知识的自动获取研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
相关硕士学位论文 前2条
1 马德全;论现代汉语兼语句[D];内蒙古师范大学;2003年
2 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
【相似文献】
相关期刊论文 前10条
1 傅书灵;;也谈“N之V”结构[J];语言研究;2011年03期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前1条
1 张祝玉;任飞亮;朱靖波;;基于条件随机场的中文命名实体识别特征比较研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
相关博士学位论文 前2条
1 汤勤;《史记》与《战国策》语言比较研究[D];华中科技大学;2006年
2 张旺喜;汉语句法的认知结构研究[D];上海师范大学;2004年
相关硕士学位论文 前10条
1 段虹宇;《金瓶梅词话》“教、叫、交”兼语结构研究[D];山东师范大学;2010年
2 林琳;上古使令类兼语动词的演进和发展[D];暨南大学;2010年
3 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
4 刘辉;从生成语法看汉语动词同宾结构的句法归属[D];华东师范大学;2005年
5 洪鹿平;汉语复句关系自动判定研究[D];南京师范大学;2008年
6 程月;现代汉语动宾搭配多角度考察及其自动识别[D];南京师范大学;2008年
7 张英;“有+NP+VP”结构探析[D];暨南大学;2009年
8 杨高建;《三国志》兼语句研究[D];新疆大学;2010年
9 卢桂芝;汉语“给”与泰语“(?)”的对比研究[D];暨南大学;2011年
10 卢骄杰;《现代汉语词典》动词释义模式元语言研究[D];华东师范大学;2007年
本文编号:1954569
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/1954569.html