基于概念空间的文本语义索引
[Abstract]:According to statistics, more than 80% of the online storage information exists in the form of text. The diversification and complexity of information makes automatic indexing of information an urgent problem. The content of this paper is to build a semantic index of text based on concept space. At present, all text indexes are built on the text space or keyword space, but the index based on the concept space has many advantages, such as clear structure, friendly man-machine interface, consistent with the common retrieval habits and so on. This is also the direction of text semantic index. In addition. In the process of establishing text index, most of the methods of Hopfield neural network association are used at home and abroad. In this paper, the direct clustering method is used to replace the Hopfield neural network association function for the first time, which makes the index have good expansibility. Text indexing based on semantic correlation can be widely used in many fields, such as Internet search engine, digital library, electronic commerce and so on. The process of establishing text index includes the following parts: 1) classifying documents, establishing concept space of documents, organizing documents at the level of concept space and determining the keywords appearing in documents.
【作者单位】: 中国科技大学研究生院计算机学部 中科院计算技术研究所智能信息处理开放实验室 中科院计算技术研究所智能信息处理开放实验室 中科院计算技术研究所智能信息处理开放实验室
【基金】:国家自然科学基金(课题号60073019、69803010)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
2 郭俊荣;杨捧;王紫薇;;一种基于信息粒度的信息检索优化方法[J];计算机仿真;2010年08期
3 黄海英;林士敏;严小卫;;基于概念空间的文本分类研究[J];计算机科学;2003年03期
4 党齐民,吕冬煜;基于词关联语义的文本分类研究[J];计算机应用;2004年04期
5 罗三定,陆文彦,王浩,贾维嘉;基于概念的文本类别特征提取与文本模糊匹配[J];计算机工程与应用;2002年16期
6 史田华;;语义检索技术研究[J];图书馆杂志;2001年11期
7 丁露;崔平;;SOM聚类算法在文本分类上的应用[J];现代情报;2007年09期
8 陈燕;龙建勋;;基于明确语义分析的自动文摘算法[J];计算机工程;2011年03期
9 张学福;;基于词共现的可视化概念空间研究[J];情报学报;2008年02期
10 张明宝;马静;施秀丽;;领域本体在信息检索中的应用研究[J];情报学报;2010年02期
相关会议论文 前10条
1 李素建;李芸;纪鹭宁;徐睿峰;;词典匹配和串频统计相结合在自动主题分析中的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 赵恩彪;隋金君;王自亮;李智;;电荷法测量粉尘浓度技术研究[A];第八届全国采矿学术会议论文集[C];2009年
3 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
4 张靖;赵明清;;粗糙集理论在建立线性计量经济模型中的应用[A];中国企业运筹学学术交流大会论文集[C];2005年
5 肖诗斌;孙丽华;王弘尉;施水才;;指标信息抽取技术的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 丁春;;论自由词向关键词转换的意义[A];学报编辑论丛(第十二集)[C];2004年
7 齐敏霞;左廷荣;于晓明;;寿光商务小区暖通空调节能设计[A];全国暖通空调制冷2008年学术年会资料集[C];2008年
8 赵[,
本文编号:2332872
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2332872.html