当前位置:主页 > 科技论文 > 搜索引擎论文 >

支持向量机在化学主题爬虫中的应用

发布时间:2019-11-19 06:32
【摘要】:爬虫是搜索引擎的重要组成部分,它沿着网页中的超链接自动爬行,搜集各种资源。为了提高对特定主题资源的采集效率,文本分类技术被用来指导爬虫的爬行。本文把基于支持向量机的文本自动分类技术应用到化学主题爬虫中,通过SVM 分类器对爬行的网页进行打分,用于指导它爬行化学相关网页。通过与基于广度优先算法的非主题爬虫和基于关键词匹配算法的主题爬虫的比较,表明基于SVM分类器的主题爬虫能有效地提高针对化学Web资源的采集效率。

【参考文献】

相关期刊论文 前2条

1 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期

2 李晓霞,杨章远,许志宏;Internet化学资源的发展状况与展望[J];计算机与应用化学;1999年05期

【共引文献】

相关期刊论文 前10条

1 朱礼军,陶兰,黄赤;语义万维网的概念、方法及应用[J];计算机工程与应用;2004年03期

2 黄苏华,李晓霞,郭力,刘宗红,杨章远;基于数据库的Internet化学资源导航信息管理与自动发布[J];计算机与应用化学;2000年03期

3 贾红阳,郭力,李晓霞,杨章远,姜林,陈晓青;Web石油化工信息服务管理系统的研究[J];计算机与应用化学;2000年04期

4 韩化雪;康鲲鹏;;基于WEB搜索引擎的发展[J];福建电脑;2006年09期

5 刘金红,夏阳,陆余良;基于Ontology的网络元数据抽取系统的研究与实现[J];安徽电子信息职业技术学院学报;2004年Z1期

6 原福永,李莉,李红岩;智能信息检索的设计与研究[J];燕山大学学报;2005年04期

7 王树锋,张永奎;交叉语言信息检索研究[J];电脑开发与应用;2001年11期

8 邵学广,蔡文生;化学信息学及其课程建设[J];大学化学;2002年03期

9 李立耀;;基于页面链接结构Page Rank算法的改进——有向访问模型[J];福建师大福清分校学报;2006年02期

10 邵学广;化学信息学网络化教学系统的研制[J];化学教育;2001年11期

相关会议论文 前4条

1 汤志伟;王菁;;面向公众的电子政务个性化信息服务体系的构建[A];中国信息经济学会2007年学术年会论文集[C];2007年

2 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 曹玮祺;梁华瑞;朱雷;李涓子;王克宏;;基于半结构化信息模型的信息检索[A];第六届全国计算机应用联合学术会议论文集[C];2002年

4 毛颖;周源远;王继成;;信息过滤技术研究[A];第一届学生计算语言学研讨会论文集[C];2002年

相关博士学位论文 前8条

1 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年

2 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年

3 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年

4 温浩宇;制造网格若干关键技术研究[D];西安电子科技大学;2005年

5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年

6 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年

7 邓发云;基于用户需求的信息可信度研究[D];西南交通大学;2006年

8 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年

相关硕士学位论文 前10条

1 郭杨;移动Agent技术在Web信息搜索上的研究[D];大连海事大学;2008年

2 王志强;WEB文本信息抽取和分类研究[D];辽宁工程技术大学;2006年

3 刘菁菁;基于结构和主题的Web信息检索研究[D];大连理工大学;2007年

4 郑伟;基于分类语义的Web信息检索系统的研究[D];北京交通大学;2008年

5 徐东;基于本体的领域智能搜索技术研究[D];哈尔滨工程大学;2007年

6 杨宁宁;智能信息检索技术在医疗保险信息系统中的研究与实现[D];南京航空航天大学;2007年

7 刘强国;主题搜索引擎设计与研究[D];电子科技大学;2007年

8 谢华;Internet网页自动分类技术的研究[D];中南大学;2007年

9 蔡国民;基于XML的个性化信息检索系统研究[D];中南大学;2007年

10 张映海;基于概念的中文文本检索研究[D];重庆大学;2007年

【相似文献】

相关期刊论文 前10条

1 李凯,郭子雪;基于SVM的函数模拟[J];河北大学学报(自然科学版);2001年01期

2 庄莉,艾海舟,徐光yP;基于视频的人脸验证[J];电子学报;2002年08期

3 陈建华,包煊;Web挖掘系统的设计与实现[J];计算机工程;2002年08期

4 黄志斌,陈锻生;支持向量机在车牌字符识别中的应用[J];计算机工程;2003年05期

5 夏建涛,何明一;支持向量机与纠错编码相结合的多类分类算法[J];西北工业大学学报;2003年04期

6 范昕炜,杜树新,吴铁军;可补偿类别差异的加权支持向量机算法[J];中国图象图形学报;2003年09期

7 谭小彬,奚宏生,王卫平,殷保群;基于支持向量机的异常检测[J];中国科学技术大学学报;2003年05期

8 孙鹏,张浩然,韩正之;基于支持向量机的有效带宽估计算法的研究[J];系统仿真学报;2003年02期

9 王定成,方廷健;一种基于支持向量机的内模控制方法[J];控制理论与应用;2004年01期

10 李凌均,张周锁,何正嘉;基于支持向量机的机械故障智能分类研究[J];小型微型计算机系统;2004年04期

相关会议论文 前9条

1 刘森;方卫;封化民;宋国森;方勇;;一种扩展的基于学习的视频镜头检测方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

2 王在文;;SVM方法在快速订正中的应用研究[A];中国气象学会2005年年会论文集[C];2005年

3 王世卫;李爱国;;报税欺诈检测研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年

4 强俊;周鸣争;汪军;楚宁;;基于核学习算法的内窥镜图像的识别[A];第十二届全国图象图形学学术会议论文集[C];2005年

5 李杰;高大启;;线性与非线性主成分分析和独立成分分析数据降维的比较[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

6 施俊;郑永平;周康源;严壮志;;基于超声的骨骼肌特性的多信号结合研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年

7 沈永良;杨国辉;;支持向量机在森林生物灾害预测中的应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年

8 齐志泉;田英杰;徐志洁;;支持向量机中的核参数选择问题[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年

9 常涛;;支持向量机在乌鲁木齐大气污染预报中的应用研究[A];中国气象学会2008年年会大气环境监测、预报与污染物控制分会场论文集[C];2008年

相关博士学位论文 前6条

1 黄景涛;支持向量机算法参数选择及其在电站锅炉系统中的应用研究[D];浙江大学;2005年

2 何世钧;电容层析成像系统的研究与应用[D];天津大学;2005年

3 司宏宗;基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究[D];兰州大学;2006年

4 李伟红;基于支持向量机的人脸特征选择及识别研究[D];重庆大学;2006年

5 黄志开;彩色图像特征提取与植物分类研究[D];中国科学技术大学;2006年

6 徐红敏;基于支持向量机理论的水环境质量预测与评价方法研究[D];吉林大学;2007年

相关硕士学位论文 前10条

1 胡磊;基于内容的垃圾邮件过滤技术的研究[D];昆明理工大学;2005年

2 刘蓉;SVM与K-Means算法在IHRS中的研究与应用[D];昆明理工大学;2005年

3 苏桂莲;数字图像隐形信息检测技术研究[D];上海师范大学;2006年

4 王青力;基于支持向量机的步态识别[D];华侨大学;2006年

5 岳红原;基于统计的数字图像篡改检测方法[D];上海师范大学;2006年

6 刘志伟;基于Ontology的个性化信息服务方法研究[D];哈尔滨工业大学;2006年

7 孙铁;改进的核函数算法及其在人脸识别中的应用研究[D];西北工业大学;2007年

8 张剑风;巴彦塔拉油田测井资料综合解释方法研究[D];大庆石油学院;2007年

9 李琪;基于支持向量机的人形检测[D];昆明理工大学;2007年

10 尚燕;纹理图像分类算法的研究[D];燕山大学;2007年



本文编号:2562965

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2562965.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户41663***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com