当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于SVM的旅游网站页面判别模型探讨

发布时间:2018-05-19 18:31

  本文选题:旅游网站 + 搜索引擎 ; 参考:《地理空间信息》2015年01期


【摘要】:新疆旅游网站中存在大量页面本身为空或页面为导航页面、新闻动态及政策法规等用户关注度相对较低的页面。而用户在使用搜索引擎进行旅游信息查询时,这些页面却经常显示在搜索结果的前面,从而带来用户获取信息不畅、用户体验差等问题。为解决上述问题,提出基于支持向量机(SVM)原理构建旅游网站自动判别模型的方法,并结合9000张训练样本语料和3 000张测试样本语料,对该模型进行测试研究。结果表明,基于该模型构建的分类器,具有良好的判别效果。当特征词超过120个,该模型的准确率、召回率及F1值均趋于收敛,达到98%。
[Abstract]:There are a large number of pages in Xinjiang tourism website which are empty or navigation pages, news dynamic, policies and regulations and so on users pay relatively low attention to the pages. However, when users use search engines to query travel information, these pages are often displayed in front of search results, resulting in problems such as poor access to information and poor user experience. In order to solve the above problems, an automatic discriminant model based on support vector machine (SVM) is proposed, and 9000 training samples and 3 000 test samples are used to test the model. The results show that the classifier based on this model has good discriminant effect. When the number of feature words exceeds 120, the accuracy, recall rate and F1 value of the model tend to converge to 98.
【作者单位】: 新疆大学资源与环境科学学院;新疆大学旅游学院;
【基金】:国家自然科学基金资助项目(41130531) 新疆维吾尔自治区旅游局资助项目(XJLY2012-1) 新疆大学2012年精品课程建设资金资助项目
【分类号】:TP393.092;TP18

【参考文献】

相关期刊论文 前6条

1 李蓉;全朝晖;董亚苹;;旅游业在线搜索引擎评价体系的建立及分析[J];重庆邮电大学学报(社会科学版);2011年02期

2 单松巍,冯是聪,李晓明;几种典型特征选取方法在中文网页分类上的效果比较[J];计算机工程与应用;2003年22期

3 罗龙艳;窦厚玺;;基于AHP的旅游搜索引擎评价分析[J];科技管理研究;2011年09期

4 王专;;旅游网站的搜索引擎优化[J];旅游学刊;2007年06期

5 孙晓琳;郝俊卿;;西安旅游网站建设的对比评价研究[J];统计与信息论坛;2008年08期

6 周文霞;;现代文本分类技术研究[J];武警学院学报;2007年12期

【共引文献】

相关期刊论文 前10条

1 王雪;;内蒙古4A级景区网站运营状况研究[J];北方经济;2009年24期

2 高博;朱东华;韩士雄;;一种智能化的信息采集系统的研究与实现[J];兵工学报;2009年S1期

3 李玉擰;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期

4 付雪峰;刘邱云;;不确定性推理在文本分类上的应用研究[J];江西师范大学学报(自然科学版);2007年04期

5 郭淼霞;;中文网页分类研究综述[J];赤峰学院学报(自然科学版);2011年12期

6 包金龙;朱剑刚;;基于长三角地区的苏州旅游网站评价研究[J];产业与科技论坛;2010年04期

7 樊兴华;王鹏;;基于两步策略的中文短文本分类研究[J];大连海事大学学报;2008年03期

8 江祥奎,原思聪;中文网页分类中的网页特征提取方法[J];电脑开发与应用;2005年10期

9 阮群锟;许灿;吕劲松;;超文本的集成分类算法研究[J];电脑与信息技术;2010年02期

10 张东娜;刘博;;一个基于加权和组合降维的web文本分类系统[J];电脑知识与技术;2008年07期

相关会议论文 前4条

1 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年

2 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

3 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

4 袁志坚;贾焰;;基于误差反馈的高速Web文本流快速近似分类[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

相关博士学位论文 前10条

1 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年

2 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年

3 韩毅;社会网络分析与挖掘的若干关键问题研究[D];国防科学技术大学;2011年

4 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年

5 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年

6 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年

7 田永鸿;基于上下文的统计关系学习研究[D];中国科学院研究生院(计算技术研究所);2005年

8 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年

9 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年

10 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年

相关硕士学位论文 前10条

1 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年

2 王林平;基于内容的电子邮件过滤系统的研究[D];电子科技大学;2010年

3 陶小波;电子就业文本挖掘系统关键技术研究与应用[D];浙江工商大学;2011年

4 曹亚辉;非结构文本最佳近似匹配系统的研究与实现[D];东华大学;2011年

5 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年

6 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年

7 杜俊卫;基于聚类的文本迁移学习算法研究及应用[D];山西财经大学;2011年

8 陈晓雨;基于用户体验的网站优化研究[D];云南艺术学院;2011年

9 张春燕;基于自然语言处理的文本分类分析与研究[D];江西理工大学;2011年

10 郭力;Web正文信息抽取与面向层次结构的分类技术研究[D];华南理工大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 方英;陈京民;;旅游业搜索引擎营销策略研究[J];商业研究;2010年01期

2 张俊霞;旅游网站有效性的定量评价方法[J];中国地质大学学报(社会科学版);2001年04期

3 路紫,郭来喜,白翠玲;河北省旅游网站使用评估分析[J];地球信息科学;2004年01期

4 章成敏,章成志;国外农业搜索引擎评析[J];农业网络信息;2004年11期

5 殷炜琳;郑向敏;;基于使用者满意度的网站质量评价方法研究[J];价值工程;2008年01期

6 常捷;陈德广;屈冬萌;;河南省旅游网站的现状调查与发展对策[J];旅游科学;2006年03期

7 朱峰;吕镇;;应该在信息技术发展背景下进行“旅游与网络”研究[J];旅游学刊;2007年06期

8 王铁;;网络对旅游的影响——从营销到供应链和贫困人口受益[J];旅游学刊;2007年06期

9 钟栎娜;吴必虎;;中外国际旅游城市网络旅游信息国际友好度比较研究[J];旅游学刊;2007年09期

10 马费成,李东e,

本文编号:1911181


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1911181.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户838a5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com