当前位置:主页 > 科技论文 > 软件论文 >

基于TFIDF的社区问答系统问句相似度改进算法

发布时间:2018-05-02 21:08

  本文选题:向量空间模型 + TFIDF算法 ; 参考:《北京理工大学学报》2017年09期


【摘要】:针对社区问答系统问句相似度计算问题,提出了一种改进的TFIDF算法.按照用户的查询意图对问句进行分类,根据特征词在类别中的分布对权值进行调整;将问句的主题词归入特征项进行TFIDF计算.实验结果表明,本文改进的TFIDF算法的P@3比传统的TFIDF算法提高了7.66%,比TFIDF-IG算法提高了5.31%,而且P@5和P@10也有不同程度的提高,与传统TFIDF算法和参考改进算法相比,该算法明显提高了检索性能.
[Abstract]:An improved TFIDF algorithm is proposed to calculate the similarity of question sentences in community question answering system. According to the user's query intention, the question sentence is classified, the weight value is adjusted according to the distribution of the feature words in the category, and the subject words of the question sentence are classified into the feature items for TFIDF calculation. The experimental results show that compared with the traditional TFIDF algorithm, the improved TFIDF algorithm has 7.66% higher than the traditional TFIDF algorithm, 5.31% higher than the TFIDF-IG algorithm, and also has a different degree of improvement compared with the traditional TFIDF algorithm and the improved reference algorithm. This algorithm improves the retrieval performance obviously.
【作者单位】: 北京理工大学信息与电子学院;
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 王树西;赵星秋;潘硕;;问答系统在教学中的应用[J];中国教育信息化;2007年07期

2 卢志坚,张冬茉;中文问答系统中的问句理解[J];计算机工程;2004年18期

3 林晓庆;;问答系统中基于列表类问题的研究[J];电脑知识与技术(学术交流);2007年07期

4 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期

5 贾君枝;毛海飞;;汉语框架网络问答系统问句处理研究[J];图书情报工作;2008年10期

6 胡小华;刘轩;刘丹;陆伟;;基于冗余的仿真问答系统的轻量级局部文本分析[J];图书情报知识;2009年01期

7 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期

8 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期

9 陈玉;;基于关键词距离的中文问答系统研究[J];电脑开发与应用;2011年01期

10 刘宁锋;史晓东;;中文问答系统中答案抽取的研究[J];电脑知识与技术;2011年12期

相关会议论文 前10条

1 何靖;陈,

本文编号:1835508


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1835508.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4bb82***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com