基于模式学习的中文问答系统答案抽取方法
本文选题:计算机软件 + 问答系统 ; 参考:《吉林大学学报(工学版)》2008年01期
【摘要】:答案抽取是中文问答系统的关键,而通常答案是借助于问题的答案句子模式抽取得到,由于答案句子模式是语言专家根据语言规则提炼获得,因此非常依赖于专家经验。针对这一局限性,提出了一种利用模式学习来获得中文答案句子模式的方法,该方法利用搜索引擎从互连网上检索相关问题文本,人工提取包含答案的句子段,并标注问题类型及答案,形成各种问题类型的问答训练语料。通过统计学习,提取候选答案句子模式,计算候选句子模式权重,并根据权重获得相应问题类型的答案句子模式。基于事实的问题答案抽取结果表明,提出的基于模式学习的方法有很好的效果,实验答案提取准确率值达到了0.28,学习方法获得的模式基本上覆盖了常规答案句子模式。
[Abstract]:Answer extraction is the key of the Chinese question answering system, but the answer is usually obtained by the answer sentence pattern of the question. Because the answer sentence pattern is extracted by the language expert according to the language rules, it is very dependent on the expert experience. Aiming at this limitation, this paper proposes a method of obtaining sentence pattern of Chinese answer by using pattern learning. The method uses search engine to retrieve the relevant question text from the Internet, and manually extracts sentence segments containing the answers. The question types and answers are marked to form question-answering training corpus of various question types. Through statistical learning, the candidate sentence pattern is extracted, the weight of candidate sentence pattern is calculated, and the answer sentence pattern of the corresponding question type is obtained according to the weight. The results of fact-based answer extraction show that the proposed model learning method has a good effect, the accuracy value of experimental answer extraction reaches 0.28, and the pattern obtained by the learning method basically covers the conventional sentence pattern.
【作者单位】: 昆明理工大学信息工程与自动化学院 昆明理工大学信息工程与自动化学院 昆明理工大学信息工程与自动化学院 昆明理工大学信息工程与自动化学院 昆明理工大学信息工程与自动化学院
【基金】:国家自然科学基金项目(60663004) 高等学校博士学科点专项科研基金项目(20050007023) 云南省中青年学术和技术带头人后备人才基金项目(2007PY01-11) 云南省教育厅基金项目(07Z11139) 昆明理工大学博士基金项目(2006-12)
【分类号】:TP311.52
【参考文献】
相关期刊论文 前4条
1 余正涛,樊孝忠,郭剑毅;基于支持向量机的汉语问句分类[J];华南理工大学学报(自然科学版);2005年09期
2 余正涛;樊孝忠;宋丽哲;高盛祥;;汉语问答系统答案提取方法研究[J];计算机工程;2006年03期
3 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
4 张宇,刘挺,文勖;基于改进贝叶斯模型的问题分类[J];中文信息学报;2005年02期
【共引文献】
相关期刊论文 前10条
1 乌庆敏;方少卿;谢亮亮;;一种加权的KNN中文问句分类方法研究[J];安徽广播电视大学学报;2010年03期
2 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
3 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
4 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
5 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
6 刘小明;樊孝忠;李方方;;一种结合本体和焦点的问题分类方法[J];北京理工大学学报;2012年05期
7 秦超;;远程教学平台中开放式综合答疑系统研究[J];中国远程教育;2006年10期
8 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期
9 黄明;王慧;梁旭;;最大熵模型的语义句法分析在陪护机器人中的应用[J];大连交通大学学报;2011年05期
10 张雪芬;李德玉;王素格;南瑞贤;;基于统计方法的面向旅游问句分类实验研究[J];电脑开发与应用;2009年01期
相关会议论文 前10条
1 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
2 于娟;武港山;;面向政府公文领域的中文问题分类[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
3 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 吴晨;张全;;基于HNC的自然语言问答处理系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 文勖;张宇;刘挺;;类别主特征结合句法特征的中文问题层次分类[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
7 张希娟;朱靖波;;主动学习中后验概率尖锐现象的平滑处理[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 高俊杰;李茹;李双红;;基于领域本体的自动问答系统关键技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 缪有栋;邱锡鹏;黄萱菁;;基于主动学习的中文问题类别标注研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
相关博士学位论文 前10条
1 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
2 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
3 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
4 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
5 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
6 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
7 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
8 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
9 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
10 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
相关硕士学位论文 前10条
1 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
2 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
3 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
4 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
5 李英伟;基于增量改进贝叶斯领域问句分类研究[D];昆明理工大学;2009年
6 赵全;基于半监督学习的中文问句分类研究[D];昆明理工大学;2010年
7 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
8 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
9 李欢;基于多Agent及元搜索技术的中文问答系统的研究和应用[D];石家庄铁道学院;2009年
10 刘智慧;基于搜索引擎的自动问答系统[D];西安电子科技大学;2010年
【二级参考文献】
相关期刊论文 前4条
1 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
2 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
3 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
4 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
相关硕士学位论文 前1条
1 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
【相似文献】
相关期刊论文 前10条
1 田卫东;祖永亮;;基于答案模式和语义特征融合的答案抽取方法[J];计算机工程与应用;2011年13期
2 余正涛;毛存礼;邓锦辉;章程;郭剑毅;;基于模式学习的中文问答系统答案抽取方法[J];吉林大学学报(工学版);2008年01期
3 李鹏;乔佩利;王晓龙;王宝勋;;基于模式学习的形式化答案抽取技术与置信度评价方法[J];电子学报;2008年12期
4 李季;一个标准中文问答系统的研究与实现[J];计算机系统应用;2004年06期
5 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
6 王慧慧;;中文自动问答系统研究[J];科技信息(学术研究);2007年29期
7 刘宁锋;史晓东;;中文问答系统中答案抽取的研究[J];电脑知识与技术;2011年12期
8 唐娟;杜亚军;王可亮;;一种基于形式概念分析的问答系统答案抽取的研究[J];计算机应用;2007年03期
9 王宇;战学刚;蔡建山;;基于网络的中文问答系统的研究[J];计算机工程与应用;2006年07期
10 曹志娟;李祖枢;刘朝涛;;自动问答系统中的问题理解研究[J];计算机科学;2005年11期
相关会议论文 前10条
1 赵兴;余正涛;邹俊杰;郭剑毅;毛存礼;;结合依存句法与实体的领域答案句模学习方法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
2 何靖;陈,
本文编号:1945916
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1945916.html