当前位置:主页 > 科技论文 > 搜索引擎论文 >

中文交互式网络搜索引擎及其自学习能力

发布时间:2018-06-09 04:15

  本文选题:向量空间模型 + 自动机 ; 参考:《计算机工程与应用》2003年10期


【摘要】:论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。
[Abstract]:This paper introduces a Chinese interactive search engine for Chi-neset next search engine with self-learning ability, vector space model, Chinese word segmentation technology based on automata and the application of neural network BP algorithm. The self-learning ability of INSE is discussed in detail. Word segmentation based on automata is a new concept put forward by INSE. When applied to Chinese word segmentation, it can satisfy the maximum matching and the speed of self-learning ability of INSE depends on the BP algorithm of neural network. The algorithm can provide more accurate query results when applied to interactive web search engines.
【作者单位】: 哈尔滨工业大学国家计算机信息内容安全重点实验室 哈尔滨工业大学国家计算机信息内容安全重点实验室 哈尔滨工业大学国家计算机信息内容安全重点实验室 哈尔滨工业大学国家计算机信息内容安全重点实验室
【基金】:国家863高科技研究发展计划资助项目(编号:863-104-02-01)
【分类号】:TP393.03

【参考文献】

相关期刊论文 前2条

1 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期

2 王忠,周士波;Internet英文搜索引擎评析[J];情报学报;1999年05期

【共引文献】

相关期刊论文 前10条

1 焦俊婷;于霖冲;;基于ANN的复合材料变厚度壳体固化变形预测[J];玻璃钢/复合材料;2006年05期

2 胡志军;王鸿斌;;BP神经网络数值预测方法的研究[J];长春师范学院学报;2006年10期

3 郝云芳,冯晓明,黄天禄;数据融合在选矿自动控制中的应用[J];传感器技术;2004年11期

4 吴正茂,罗健;利用BP神经网络实现函数逼近[J];长江工程职业技术学院学报;2005年02期

5 王立华;人工神经网络电路的新发展[J];沧州师范专科学校学报;2005年01期

6 陈晓楠;黄强;邱林;段春青;;基于神经网络的农业干旱评估模型及其概率分布研究[J];河北农业大学学报;2006年01期

7 李玉坤,寒枫,高朝辉;BP神经网络模型在彩色胶卷乳剂数据分析中的应用[J];信息记录材料;2004年03期

8 王立舒,戚国强,杨广林,钮志勇;基于Hopfield神经网络模型大豆产量的预测应用[J];东北农业大学学报;2005年03期

9 张世海,刘晓燕,欧进萍,王光远;高层建筑基础抗震选型评价指标与智能优选方法[J];地震工程与工程振动;2002年04期

10 吕伟锋,毕净,沈继忠,姚茂群;多值逻辑基本运算的神经网络实现[J];电路与系统学报;2003年06期

相关博士学位论文 前10条

1 吕天启;高温后混凝土静置性能的试验研究及已有建筑物的防火安全评估[D];大连理工大学;2002年

2 马成勇;新一代800MPa级超低碳微合金钢焊材及接头组织性能研究[D];天津大学;2003年

3 王瑞梅;池塘水质管理智能决策支持系统研究[D];中国农业大学;2003年

4 李霞;基于连续小波变换的水下信号处理技术研究[D];西北工业大学;2003年

5 赵冲冲;基于支持向量机的旋转机械故障诊断[D];西北工业大学;2003年

6 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年

7 许桢英;动态测量系统误差溯源与精度损失诊断的理论与方法研究[D];合肥工业大学;2004年

8 徐文贤;因特网矿业信息资源及其利用研究[D];中南大学;2001年

9 刘学庆;海洋环境工程钢材腐蚀行为与预测模型的研究[D];中国科学院研究生院(海洋研究所);2004年

10 杜文斌;基于神经网络的冠心病证候诊断标准与药效评价模型研究[D];辽宁中医学院;2004年

相关硕士学位论文 前10条

1 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年

2 张驰;Web信息获取技术研究与实现[D];西北工业大学;2001年

3 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年

4 陈红英;Internet信息过滤Agent的研究和实现[D];广东工业大学;2002年

5 陆文彦;概念网的建模、实现与应用[D];中南大学;2002年

6 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年

7 张宏森;Web信息检索及应用设计优化技术研究[D];重庆大学;2002年

8 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年

9 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年

10 姜永波;基于CBR模型的呼叫中心系统[D];广东工业大学;2003年

【二级参考文献】

相关期刊论文 前3条

1 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期

2 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期

3 曾民族;网络信息检索现状和性能评价[J];情报学报;1997年02期

【相似文献】

相关期刊论文 前10条

1 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期

2 吴梦兰;;WEB内容推荐算法在远程教育中的应用[J];电脑知识与技术;2011年26期

3 蒋国瑞;王秋利;;基于本体的TBT电子信息产品领域主题爬虫研究[J];情报杂志;2011年07期

4 李光敏;陈年生;许新山;;面向网页结构特征的Hopfield算法[J];计算机系统应用;2011年07期

5 李京;姜卫;张跟鹏;宋世延;;基于电子商务的个性化推荐系统研究[J];计算机与数字工程;2011年07期

6 李志义;梁士金;;国内网页去重技术研究:现状与总结[J];图书情报工作;2011年07期

7 单蓉;;用户兴趣模型的更新与遗忘机制研究[J];微型电脑应用;2011年07期

8 林伟;;一种基于成词概率的贝叶斯垃圾邮件过滤方法[J];计算机技术与发展;2011年09期

9 魏宁;;基于手机终端的网页自动摘要系统的设计[J];黑龙江科技信息;2011年21期

10 骆万文;高飞;周学广;;抗中文主动干扰关键词过滤研究综述[J];吉首大学学报(自然科学版);2011年03期

相关会议论文 前10条

1 豆风雷;蔡永泉;;互联网WEB信息内容过滤系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年

2 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

3 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

4 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

5 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

6 林臻彪;陈性元;汪永伟;;基于数据流分析的内网防泄密系统[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

7 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

8 张平;何小卫;;电子邮件特征向量提取[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

9 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年

10 马辉民;李卫华;;Web文档聚类系统的实现方法探析[A];第10届计算机模拟与信息技术会议论文集[C];2005年

相关重要报纸文章 前1条

1 ;为什么我搜索不到想要的内容[N];中国电脑教育报;2003年

相关博士学位论文 前8条

1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年

2 王菁;P2P系统中资源管理机制的研究[D];中国科学技术大学;2007年

3 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年

4 葛继科;语义网格环境中的服务匹配研究[D];西南大学;2009年

5 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年

6 马玉涛;在线客户评论的产品族设计与加工方法研究[D];华中科技大学;2012年

7 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年

8 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年

相关硕士学位论文 前10条

1 王驰;基于海量网络舆情信息的热点发现[D];电子科技大学;2011年

2 盛鹏;基于全文过滤的垃圾邮件防范机制[D];昆明理工大学;2006年

3 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年

4 陈魁;智能搜索引擎系统的分析设计与开发[D];大连理工大学;2004年

5 巩玉玺;基于文本挖掘的垃圾邮件过滤技术研究[D];中国海洋大学;2005年

6 赵治军;OAI-PMH中元数据相似度计算的研究与实现[D];太原科技大学;2009年

7 肖佳;基于Agent的信息推送技术的研究与应用[D];苏州大学;2006年

8 曾超;基于WordNet概念向量空间模型的电子邮件分类方法的研究与实现[D];华东师范大学;2008年

9 李金磊;在线社会网络模糊挖掘模型研究[D];华中科技大学;2008年

10 彭希鸿;基于Web内容挖掘的网页分类与过滤研究与应用[D];中南大学;2003年



本文编号:1998851

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1998851.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77db7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com