当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Web的语料自动采集技术研究

发布时间:2018-06-15 17:40

  本文选题:语料采集 + 搜索引擎 ; 参考:《太原理工大学学报》2008年S1期


【摘要】:在为词典编撰进行大规模语料采集工作的背景下,以实现语料的批量自动采集为目的,介绍了基于Web的词典编撰语料自动采集技术。同时提出了该技术在图书信息领域的实验模型,图书信息搜寻系统(SearchBook v2.1.0)的设计与实现,包括如何利用搜索引擎技术及信息提取技术进行图书信息的搜索及提取。
[Abstract]:Under the background of large-scale data collection for dictionary compilation, this paper introduces the automatic data collection technology based on Web in order to realize the batch automatic data collection. At the same time, the paper puts forward the experimental model of this technology in the field of book information, and the design and implementation of book information search system (SearchBook v2.1.0), including how to use search engine technology and information extraction technology to search and extract book information.
【作者单位】: 太原理工大学计算机与软件学院;中国电子科技集团第三十三研究所;
【基金】:国家863计划资助项目(2006AA01Z142) 国家社科基金资助项目(07CYY022)
【分类号】:TP274

【参考文献】

相关期刊论文 前2条

1 邓长寿,赵秉岩;下一代Web搜索引擎探讨[J];情报科学;2005年03期

2 刘肖静,耿骞;Ontology与面向概念的网络信息检索[J];情报理论与实践;2004年06期

【共引文献】

相关期刊论文 前3条

1 杨建林;;基于本体的文本信息检索研究[J];情报理论与实践;2006年05期

2 张鼐;;基于本体论的网络信息检索[J];情报杂志;2006年04期

3 王弼佐;王茜;李鹏;;基于Ontology的多主体知识检索模型[J];情报杂志;2006年06期

相关博士学位论文 前2条

1 谷建军;基于叙词表的中医古籍文献领域本体建模方法研究[D];中国中医科学院;2006年

2 谢刚;基于变精度粗集的软件项目投标风险挖掘与规避研究[D];华中科技大学;2006年

相关硕士学位论文 前10条

1 张英;基于工作流的协同制造任务分配技术研究[D];西北工业大学;2006年

2 姚永祥;基于XTM的政务知识导航系统的研究与实现[D];大连理工大学;2006年

3 王煜;Internet智能比较购物的研究与实现[D];浙江工商大学;2006年

4 许又泉;一种网络学习系统的研究与设计[D];湖南大学;2006年

5 杨若望;基于本体的语义检索方法研究[D];北京邮电大学;2006年

6 常江;数字图书馆建设中数字资源整合的研究与蓝图设计[D];北京交通大学;2007年

7 李爱明;个性化搜索引擎用户模型研究[D];华中师范大学;2007年

8 于俊洋;智能搜索引擎导航器的研究和设计[D];河南大学;2007年

9 李渊;面向异步通讯机制的网页搜索技术研究[D];浙江工商大学;2007年

10 魏丕国;基于本体的信息检索系统模型研究[D];山东科技大学;2007年

【二级参考文献】

相关期刊论文 前3条

1 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期

2 朱礼军,陶兰,黄赤;语义万维网的概念、方法及应用[J];计算机工程与应用;2004年03期

3 张晓林;Semantic Web与基于语义的网络信息检索[J];情报学报;2002年04期

【相似文献】

相关期刊论文 前10条

1 胡风华;郭丹峰;刘冰;;搜索引擎的智能化和知识库系统在其中的应用[J];光盘技术;2009年05期

2 张莲梅,陈红梅,许继红,杨璃,李凌;基于分布式电力资源库的搜索引擎框架设计[J];电力信息化;2005年03期

3 袁林;;基于搜索引擎的电力调度知识管理系统[J];电力信息化;2008年07期

4 谢文洁;陈森利;;企业搜索引擎在供电行业的研究和应用[J];办公自动化;2009年02期

5 陈红英;杨宜民;;基于决策树技术的个性化服务Agent[J];微电子学与计算机;2006年03期

6 仇壮丽;;在线论文复制检测系统设计[J];计算机工程与应用;2011年19期

7 谢建国;;智能代理在电子商务中的应用[J];闽西职业技术学院学报;2010年01期

8 陈正铭;邓雪梅;;Web知识挖掘与计算机网络[J];韶关学院学报;2006年09期

9 谢娟文;秦淑娟;焦爱胜;;人工智能在搜索引擎资源获取中的应用[J];机械研究与应用;2009年02期

10 李春杰;崔红霞;;基于多Agent搜索行为分析的用户兴趣模型[J];吉林大学学报(信息科学版);2010年02期

相关会议论文 前4条

1 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年

2 张军;于浩;内野宽治;;UGC中产品评论信息的挖掘[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

3 张素智;李宝燕;樊得强;;面向用户和领域本体的Web信息采集系统[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年

4 付双双;段京莉;;治疗药物监测软件应用进展[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年

相关重要报纸文章 前3条

1 ;搜索引擎将引入人工智能技术[N];人民邮电;2006年

2 本报记者 金真;破解行业发展瓶颈 力争接轨国际标准[N];中国建设报;2010年

3 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年

相关博士学位论文 前10条

1 王德吉;复杂环境下自适应智能决策支持系统研究[D];中国科学技术大学;2007年

2 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年

3 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年

4 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年

5 王亮;基于胞映射的数字控制系统量化效应分析与设计[D];华中科技大学;2008年

6 孙小林;2-型模糊描述逻辑及其在本体进化中的应用研究[D];华中科技大学;2007年

7 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年

8 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年

9 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年

10 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年

相关硕士学位论文 前10条

1 王亚伟;智能代理在网络营销中的应用框架研究[D];河北工业大学;2006年

2 程涛;个性化网络信息采集处理系统的设计与实现[D];北京邮电大学;2011年

3 车志军;人工智能在搜索引擎资源获取中的应用[D];浙江大学;2006年

4 王放;一种自治的分布式信息采集与检索系统[D];四川大学;2006年

5 徐芳;利用概念检索实现专业搜索引擎的智能化[D];北京化工大学;2008年

6 张兴;数字有机体中资源发现的知识库构建[D];电子科技大学;2007年

7 王晓;网络制造资源搜索关键技术研究与应用[D];贵州大学;2006年

8 朱宏磊;流形学习算法的研究与应用[D];天津大学;2007年

9 姜博;基于聚焦爬虫的web信息采集技术研究[D];北方工业大学;2011年

10 安利斌;基于知网的内容知晓研究[D];太原理工大学;2006年



本文编号:2022909

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2022909.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户098ed***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com