基于百度百科的查询意图分类
[Abstract]:Most web pages in the World wide Web are based on the HTML language. With the number of web pages increasing dramatically, search engines become more difficult to search. If the search engine can automatically identify the query intention, the result will be returned to classify the intention, and the user will find the corresponding query results in the intention category, which will greatly improve the user satisfaction. In the actual query, the user input query words may contain multiple query intentions, and the search engine may predict the user's query intention by analyzing the user's browsing behavior. If the search engine can automatically identify the user's query intention and sort the query results effectively, a good return result is very useful to the user. Therefore, it is the key of future search behavior that the search engine actively predicts the user's query intention. If the user input query term is short and the query information requirement is insufficient, most of the query results returned by the general search engine do not meet the query requirements of the user. In view of the inaccuracy of the query results, can search engine classify the query results according to the query intention? However, there is also a great challenge to query the classification of intention, which includes intention representation, intention scope and sentence representation. The main method of this paper is based on Baidu Encyclopedia query intention classification, encyclopedia contains many concepts and categories, and most of the concepts have specific domain keywords, each concept is composed of an article. The users input the new query words and the concepts in encyclopedia to calculate the sentence similarity, walk randomly under the most similar category, and finally get the satisfactory query results. The experimental results show that the proposed method has good experimental results.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3
【共引文献】
相关期刊论文 前7条
1 赵火军;温有奎;;基于引文链的知识元挖掘研究[J];情报杂志;2009年03期
2 李玉红;柴林燕;张琪;;结合分词技术与语句相似度的主观题自动判分算法[J];计算机工程与设计;2010年11期
3 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期
4 李伟;杨思春;纪滨;;自动答疑系统中问题的聚类分析[J];计算机技术与发展;2012年03期
5 肖明;曾莉;;基于实例的机器翻译系统的模型设计[J];西南民族大学学报(自然科学版);2009年04期
6 谭新星;江华;;基于Petri网的机器翻译研究[J];译林(学术版);2011年Z1期
7 周群芳;;相似专利检测研究[J];现代图书情报技术;2012年11期
相关硕士学位论文 前10条
1 陈继祥;基于J2EE的网络考试系统的研究与实现[D];南昌大学;2010年
2 李海光;基于位置和语义特征的中文命名实体关系抽取研究[D];合肥工业大学;2011年
3 何亚;主观题辅助评分方法的研究与应用[D];中南大学;2010年
4 李洋;基于本体的智能电网知识检索系统[D];北京理工大学;2011年
5 钱跃;基于文本挖掘的学者简历自动生成[D];大连理工大学;2011年
6 王继远;一种用于软件作业评判系统的程序结构分析算法的设计与实现[D];北京邮电大学;2007年
7 张鹏;C程序相似代码识别方法的研究与实现[D];大连理工大学;2008年
8 刘利军;云南省大型科学仪器共用网业务系统关键技术研究[D];昆明理工大学;2008年
9 王清;基于Globish的规范子集英汉翻译系统研究[D];上海师范大学;2008年
10 宋振秋;基于短语模板的机器翻译研究[D];大连理工大学;2008年
本文编号:2353481
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2353481.html