谈搜索引擎中Web页面标引关键词的确定
本文选题:关键词 + 加权 ; 参考:《图书情报工作》2004年09期
【摘要】:论述搜索引擎在对网络信息进行关键词标引时,传统加权词频统计算法的应用和影响关键词权重的几种因素,指出使用后控制词表是改善关键词语言性能的有效措施,最后提出一种新型的、基于逻辑“非”运算的后控制词表,用以提高搜索引擎的检准率。
[Abstract]:This paper discusses the application of the traditional weighted word frequency statistical algorithm and several factors influencing the keyword weight when the search engine indexes the network information, and points out that controlling the vocabulary after use is an effective measure to improve the performance of the keyword language. Finally, a new type of post-control lexicon based on logical "non-" operation is proposed to improve the accuracy of search engines.
【作者单位】: 湘潭大学管理学院图书馆学系
【分类号】:G354
【参考文献】
相关期刊论文 前1条
1 丁璇,侯汉清,章成志;中文网页标引源主题表达能力的调查统计[J];大学图书馆学报;2002年06期
【共引文献】
相关期刊论文 前10条
1 侯汉清,薛鹏军;基于知识库的网页自动标引和自动分类系统的设计[J];大学图书馆学报;2004年01期
2 雷景生,伍庆清,王平;一种基于混合神经网络的Web文档聚类算法[J];计算机工程;2005年01期
3 雷景生,林冬雪,符浅浅;基于改进向量空间模型的Web信息检索技术研究[J];计算机工程;2005年01期
4 雷景生;基于多层向量空间模型的Web信息检索方法[J];计算机应用;2004年04期
5 赵妍,侯汉清,耿金玉,叶常妍,何群;中文期刊论文自动标引加权设计研究[J];新世纪图书馆;2004年01期
6 章成志;数据挖掘研究现状及最新进展[J];南京工业职业技术学院学报;2003年02期
7 曹树金,杨涛;自动分类在搜索引擎性能优化中的应用[J];情报科学;2004年02期
8 章成志,侯汉清,丁璇;中文Web概念挖掘系统设计与测评[J];上海交通大学学报;2003年S1期
9 张谦;从PageRank的技术优势看Google的软件文化理念[J];图书馆论坛;2004年03期
10 过仕明;;PageRank技术分析及网页重要性的综合评价模型[J];图书馆论坛;2006年01期
相关硕士学位论文 前10条
1 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
2 刘平冰;基于Lucene的Web站内信息搜索系统[D];电子科技大学;2005年
3 吕俊;化工专业搜索引擎系统架构设计与实现[D];北京化工大学;2005年
4 赵栓柱;基于特定领域的Wed文本信息获取系统的研究与设计[D];太原理工大学;2005年
5 熊化宇;网络信息组织的质量控制研究[D];湘潭大学;2005年
6 周开朋;湿地保护的本体设计及其文档集的分级排序[D];大连理工大学;2006年
7 林冬雪;基于改进向量空间模型的网络信息检索技术研究[D];重庆大学;2005年
8 王煜;Internet智能比较购物的研究与实现[D];浙江工商大学;2006年
9 叶昭晖;网络信息雷达系统的研究与设计[D];国防科学技术大学;2005年
10 于书翰;基于网页自动分类的搜索引擎研究[D];长春理工大学;2004年
【二级参考文献】
相关期刊论文 前2条
1 张琪玉;自然语言检索中各种因素对检索效率的影响[J];情报理论与实践;1997年05期
2 赵云志;统计分析法自动标引的改进[J];情报学报;2000年04期
相关硕士学位论文 前1条
1 薛鹏军;基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D];南京农业大学;2001年
【相似文献】
相关期刊论文 前10条
1 张琪玉;论后控制词表[J];图书情报工作;1994年01期
2 陈道泉;情报检索系统与后控制词表[J];现代图书情报技术;1994年04期
3 张正强;空军政治学院开发出《汉语题内关键词索引与后控制词表系统》[J];中国档案;1994年09期
4 张琪玉;论自由标引[J];图书馆学刊;1995年05期
5 张琪玉;检索语言讲座(九)[J];情报理论与实践;1996年03期
6 周全明;全文检索系统后控关键词采集政策研究[J];情报理论与实践;1996年04期
7 周全明;全文检索系统后控词表范畴体系确立方法初探[J];情报理论与实践;1996年06期
8 宋明亮;汉语词汇字面相似性原理与后控制词表动态维护研究[J];情报学报;1996年04期
9 张琪玉;自然语言与人工语言对应转换──情报检索语言走向自动化之路[J];中国图书馆学报;1996年01期
10 周全明;全文检索系统后控制技术初探[J];国家图书馆学刊;1996年03期
,本文编号:1921446
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1921446.html