当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于概念空间的文本语义索引

发布时间:2018-11-15 09:13
【摘要】:正 1 引言据统计,在现今的联机存储信息中,80%以上的信息以文本的形式存在。信息的多元化、复杂化,致使信息的自动索引成为急需解决的问题。本文研究的内容是建立一个基于概念空间的文本语义索引。目前的文本索引都是建立在文本空间,或关键词空间上的,而建立在概念空间上的索引具有条理清晰、人机界面友好、符合通常检索习惯等许多优势,这也是文本语义索引发展的方向。另外.在建立文本索引的过程中,国内外大多使用Hopfield神经网络联想的方法,本文首次使用直接聚类法代替了Hopfield神经网络联想功能,这样使得索引具有很好的可扩展性。基于语义关联度的文本索引可以广泛应用于Internet搜索引擎、数字图书馆、电子商务等众多领域中。建立文本索引的过程主要有以下几部分: 1)对文档分类,建立文档的概念空间,在概念空间的层次上组织文档并确定文档中出现的关键词。
[Abstract]:According to statistics, more than 80% of the online storage information exists in the form of text. The diversification and complexity of information makes automatic indexing of information an urgent problem. The content of this paper is to build a semantic index of text based on concept space. At present, all text indexes are built on the text space or keyword space, but the index based on the concept space has many advantages, such as clear structure, friendly man-machine interface, consistent with the common retrieval habits and so on. This is also the direction of text semantic index. In addition. In the process of establishing text index, most of the methods of Hopfield neural network association are used at home and abroad. In this paper, the direct clustering method is used to replace the Hopfield neural network association function for the first time, which makes the index have good expansibility. Text indexing based on semantic correlation can be widely used in many fields, such as Internet search engine, digital library, electronic commerce and so on. The process of establishing text index includes the following parts: 1) classifying documents, establishing concept space of documents, organizing documents at the level of concept space and determining the keywords appearing in documents.
【作者单位】: 中国科技大学研究生院计算机学部 中科院计算技术研究所智能信息处理开放实验室 中科院计算技术研究所智能信息处理开放实验室 中科院计算技术研究所智能信息处理开放实验室
【基金】:国家自然科学基金(课题号60073019、69803010)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期

2 郭俊荣;杨捧;王紫薇;;一种基于信息粒度的信息检索优化方法[J];计算机仿真;2010年08期

3 黄海英;林士敏;严小卫;;基于概念空间的文本分类研究[J];计算机科学;2003年03期

4 党齐民,吕冬煜;基于词关联语义的文本分类研究[J];计算机应用;2004年04期

5 罗三定,陆文彦,王浩,贾维嘉;基于概念的文本类别特征提取与文本模糊匹配[J];计算机工程与应用;2002年16期

6 史田华;;语义检索技术研究[J];图书馆杂志;2001年11期

7 丁露;崔平;;SOM聚类算法在文本分类上的应用[J];现代情报;2007年09期

8 陈燕;龙建勋;;基于明确语义分析的自动文摘算法[J];计算机工程;2011年03期

9 张学福;;基于词共现的可视化概念空间研究[J];情报学报;2008年02期

10 张明宝;马静;施秀丽;;领域本体在信息检索中的应用研究[J];情报学报;2010年02期

相关会议论文 前10条

1 李素建;李芸;纪鹭宁;徐睿峰;;词典匹配和串频统计相结合在自动主题分析中的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

2 赵恩彪;隋金君;王自亮;李智;;电荷法测量粉尘浓度技术研究[A];第八届全国采矿学术会议论文集[C];2009年

3 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年

4 张靖;赵明清;;粗糙集理论在建立线性计量经济模型中的应用[A];中国企业运筹学学术交流大会论文集[C];2005年

5 肖诗斌;孙丽华;王弘尉;施水才;;指标信息抽取技术的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

6 丁春;;论自由词向关键词转换的意义[A];学报编辑论丛(第十二集)[C];2004年

7 齐敏霞;左廷荣;于晓明;;寿光商务小区暖通空调节能设计[A];全国暖通空调制冷2008年学术年会资料集[C];2008年

8 赵[,

本文编号:2332872


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2332872.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc313***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com