中文交互式网络搜索引擎及其自学习能力
本文选题:向量空间模型 + 自动机 ; 参考:《计算机工程与应用》2003年10期
【摘要】:论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。
[Abstract]:This paper introduces a Chinese interactive search engine for Chi-neset next search engine with self-learning ability, vector space model, Chinese word segmentation technology based on automata and the application of neural network BP algorithm. The self-learning ability of INSE is discussed in detail. Word segmentation based on automata is a new concept put forward by INSE. When applied to Chinese word segmentation, it can satisfy the maximum matching and the speed of self-learning ability of INSE depends on the BP algorithm of neural network. The algorithm can provide more accurate query results when applied to interactive web search engines.
【作者单位】: 哈尔滨工业大学国家计算机信息内容安全重点实验室 哈尔滨工业大学国家计算机信息内容安全重点实验室 哈尔滨工业大学国家计算机信息内容安全重点实验室 哈尔滨工业大学国家计算机信息内容安全重点实验室
【基金】:国家863高科技研究发展计划资助项目(编号:863-104-02-01)
【分类号】:TP393.03
【参考文献】
相关期刊论文 前2条
1 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
2 王忠,周士波;Internet英文搜索引擎评析[J];情报学报;1999年05期
【共引文献】
相关期刊论文 前10条
1 焦俊婷;于霖冲;;基于ANN的复合材料变厚度壳体固化变形预测[J];玻璃钢/复合材料;2006年05期
2 胡志军;王鸿斌;;BP神经网络数值预测方法的研究[J];长春师范学院学报;2006年10期
3 郝云芳,冯晓明,黄天禄;数据融合在选矿自动控制中的应用[J];传感器技术;2004年11期
4 吴正茂,罗健;利用BP神经网络实现函数逼近[J];长江工程职业技术学院学报;2005年02期
5 王立华;人工神经网络电路的新发展[J];沧州师范专科学校学报;2005年01期
6 陈晓楠;黄强;邱林;段春青;;基于神经网络的农业干旱评估模型及其概率分布研究[J];河北农业大学学报;2006年01期
7 李玉坤,寒枫,高朝辉;BP神经网络模型在彩色胶卷乳剂数据分析中的应用[J];信息记录材料;2004年03期
8 王立舒,戚国强,杨广林,钮志勇;基于Hopfield神经网络模型大豆产量的预测应用[J];东北农业大学学报;2005年03期
9 张世海,刘晓燕,欧进萍,王光远;高层建筑基础抗震选型评价指标与智能优选方法[J];地震工程与工程振动;2002年04期
10 吕伟锋,毕净,沈继忠,姚茂群;多值逻辑基本运算的神经网络实现[J];电路与系统学报;2003年06期
相关博士学位论文 前10条
1 吕天启;高温后混凝土静置性能的试验研究及已有建筑物的防火安全评估[D];大连理工大学;2002年
2 马成勇;新一代800MPa级超低碳微合金钢焊材及接头组织性能研究[D];天津大学;2003年
3 王瑞梅;池塘水质管理智能决策支持系统研究[D];中国农业大学;2003年
4 李霞;基于连续小波变换的水下信号处理技术研究[D];西北工业大学;2003年
5 赵冲冲;基于支持向量机的旋转机械故障诊断[D];西北工业大学;2003年
6 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
7 许桢英;动态测量系统误差溯源与精度损失诊断的理论与方法研究[D];合肥工业大学;2004年
8 徐文贤;因特网矿业信息资源及其利用研究[D];中南大学;2001年
9 刘学庆;海洋环境工程钢材腐蚀行为与预测模型的研究[D];中国科学院研究生院(海洋研究所);2004年
10 杜文斌;基于神经网络的冠心病证候诊断标准与药效评价模型研究[D];辽宁中医学院;2004年
相关硕士学位论文 前10条
1 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
2 张驰;Web信息获取技术研究与实现[D];西北工业大学;2001年
3 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
4 陈红英;Internet信息过滤Agent的研究和实现[D];广东工业大学;2002年
5 陆文彦;概念网的建模、实现与应用[D];中南大学;2002年
6 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年
7 张宏森;Web信息检索及应用设计优化技术研究[D];重庆大学;2002年
8 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年
9 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
10 姜永波;基于CBR模型的呼叫中心系统[D];广东工业大学;2003年
【二级参考文献】
相关期刊论文 前3条
1 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
2 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期
3 曾民族;网络信息检索现状和性能评价[J];情报学报;1997年02期
【相似文献】
相关期刊论文 前10条
1 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期
2 吴梦兰;;WEB内容推荐算法在远程教育中的应用[J];电脑知识与技术;2011年26期
3 蒋国瑞;王秋利;;基于本体的TBT电子信息产品领域主题爬虫研究[J];情报杂志;2011年07期
4 李光敏;陈年生;许新山;;面向网页结构特征的Hopfield算法[J];计算机系统应用;2011年07期
5 李京;姜卫;张跟鹏;宋世延;;基于电子商务的个性化推荐系统研究[J];计算机与数字工程;2011年07期
6 李志义;梁士金;;国内网页去重技术研究:现状与总结[J];图书情报工作;2011年07期
7 单蓉;;用户兴趣模型的更新与遗忘机制研究[J];微型电脑应用;2011年07期
8 林伟;;一种基于成词概率的贝叶斯垃圾邮件过滤方法[J];计算机技术与发展;2011年09期
9 魏宁;;基于手机终端的网页自动摘要系统的设计[J];黑龙江科技信息;2011年21期
10 骆万文;高飞;周学广;;抗中文主动干扰关键词过滤研究综述[J];吉首大学学报(自然科学版);2011年03期
相关会议论文 前10条
1 豆风雷;蔡永泉;;互联网WEB信息内容过滤系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
5 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 林臻彪;陈性元;汪永伟;;基于数据流分析的内网防泄密系统[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
7 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
8 张平;何小卫;;电子邮件特征向量提取[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年
10 马辉民;李卫华;;Web文档聚类系统的实现方法探析[A];第10届计算机模拟与信息技术会议论文集[C];2005年
相关重要报纸文章 前1条
1 ;为什么我搜索不到想要的内容[N];中国电脑教育报;2003年
相关博士学位论文 前8条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
2 王菁;P2P系统中资源管理机制的研究[D];中国科学技术大学;2007年
3 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
4 葛继科;语义网格环境中的服务匹配研究[D];西南大学;2009年
5 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
6 马玉涛;在线客户评论的产品族设计与加工方法研究[D];华中科技大学;2012年
7 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
8 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
相关硕士学位论文 前10条
1 王驰;基于海量网络舆情信息的热点发现[D];电子科技大学;2011年
2 盛鹏;基于全文过滤的垃圾邮件防范机制[D];昆明理工大学;2006年
3 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
4 陈魁;智能搜索引擎系统的分析设计与开发[D];大连理工大学;2004年
5 巩玉玺;基于文本挖掘的垃圾邮件过滤技术研究[D];中国海洋大学;2005年
6 赵治军;OAI-PMH中元数据相似度计算的研究与实现[D];太原科技大学;2009年
7 肖佳;基于Agent的信息推送技术的研究与应用[D];苏州大学;2006年
8 曾超;基于WordNet概念向量空间模型的电子邮件分类方法的研究与实现[D];华东师范大学;2008年
9 李金磊;在线社会网络模糊挖掘模型研究[D];华中科技大学;2008年
10 彭希鸿;基于Web内容挖掘的网页分类与过滤研究与应用[D];中南大学;2003年
,本文编号:1998851
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1998851.html