基于潜在语义索引和自组织映射网的检索结果聚类方法
[Abstract]:With the continuous development of the Internet and the increasing amount of data, the role of search engines is becoming more and more obvious. Users rely more on search engines to find the needed information. Based on the (LSI) theory of latent semantic index and the (SOM) theory of self-organizing mapping neural network, a new method of text clustering, LSOM., is proposed. In this method, SOM network is used to realize text clustering of retrieval results, which does not need to give the number of categories in advance, and has the characteristics of flexible clustering and high accuracy. At the same time, the LSI theory is used to establish the vector space model, and the semantic relation is introduced into the weight of the entry. For the high-dimensional text feature vector, the noise contained in the original entry matrix is reduced. To improve the clustering speed, LSom uses a new category label extraction method, and uses the extracted label to solve the problem of SOM basic class partition. The algorithm is better than the existing algorithm in category label and clustering effect evaluation index.
【作者单位】: 哈尔滨工业大学计算机学院信息检索研究室;
【基金】:国家自然科学基金项目(60675034) 国家“八六三”高技术研究发展计划基金项目(2008AA01Z144)~~
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 张刚;刘悦;郭嘉丰;程学旗;;一种层次化的检索结果聚类方法[J];计算机研究与发展;2008年03期
【共引文献】
相关期刊论文 前6条
1 贾荣飞;金茂忠;王晓博;;基于用户查询日志的查询聚类[J];北京航空航天大学学报;2010年04期
2 于洪;谌强;;一种结合K-Means的层次化的搜索结果聚类方法[J];重庆邮电大学学报(自然科学版);2010年03期
3 靳宇倡;秦启文;安俊秀;;网络群体心理趋势智能分析模型研究[J];计算机科学;2010年06期
4 安俊秀;;基于服务器集群的云检索系统的研究与示范[J];计算机科学;2010年07期
5 庞观松;张黎莎;蒋盛益;邝丽敏;吴美玲;;一种基于名词短语的检索结果多层聚类方法[J];山东大学学报(理学版);2010年07期
6 罗宏;陈黎;王亚强;朱洪波;韩国辉;于中华;;基于查询相关性分析的检索结果聚类算法[J];小型微型计算机系统;2011年10期
相关会议论文 前1条
1 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年
相关博士学位论文 前3条
1 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
2 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
3 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
相关硕士学位论文 前7条
1 邹浩;基于B/S+C/S结构的高校图书管理系统[D];电子科技大学;2011年
2 刘龙海;基于成对约束的半监督文本聚类算法研究[D];重庆大学;2011年
3 史进玲;基于粒计算的决策表属性约简与规则提取研究[D];河南师范大学;2009年
4 王平;基于自组织特征映射的检索结果聚类研究[D];哈尔滨工业大学;2009年
5 万涛;图书馆管理系统的设计与实现[D];吉林大学;2009年
6 李琳;基于粗糙集和遗传算法的聚类方法研究[D];广西师范大学;2009年
7 吴夙慧;基于引用分析的学术检索系统改进研究[D];南京大学;2012年
【二级参考文献】
相关期刊论文 前1条
1 王志梅,张俊林,李秋山;Web检索结果快速聚类方法的研究与实现[J];计算机工程与设计;2004年12期
【相似文献】
相关期刊论文 前10条
1 苏术锋;Foxbase标签格式文件的改进设计[J];软件世界;1996年05期
2 程红兵;Mac OS8快捷操作[J];桌面出版与设计;1998年01期
3 陈有新;META标签的妙用[J];中国会计电算化;2001年08期
4 秋鸟;给MSN Messenger插上QQ的翅膀[J];电脑爱好者;2004年17期
5 ;Q博士考考你[J];电子质量;2004年09期
6 张登银,汤志云;采用主动响应的标签分发协议在卫星网中的实现[J];南京邮电学院学报;2005年01期
7 侯守礼,顾海英;转基因食品标签管制与消费者的知情选择权[J];科学学研究;2005年04期
8 洪冬冬;群山;;千千高手我来当[J];电脑迷;2005年16期
9 本刊编辑部;Kevin Ashton;Erik Michielsen;Rafael Moreno;Shahram Moradpour;Chantal Polsonetti;Thomas Ryan;Louis Sirico;;RFID的未来之路大有希望——众多美国专家谈RFID[J];金卡工程;2006年04期
10 本刊编辑部;;RFID让无线无处不在[J];中国教育网络;2006年04期
相关会议论文 前10条
1 罗晖;;基于RFID的物业管理系统设计[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
2 杨月欣;;食品营养标签的作用和意义[A];营养与保健食品研究及科学进展学术资料汇编[C];2002年
3 李东;顾鹏;罗yN;汪锦邦;;食品的营养标签[A];未来五十年北京农业与食品业的发展研讨会论文集[C];2000年
4 杨晓强;;500例外埠食品标签项目的调查报告[A];首届全国卫生法规、标准效益评价技术研讨会暨讲习班论文汇编[C];2000年
5 池刚毅;;RFID业务在移动网络中的实现[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年
6 龙飞;;面向RFID标签芯片的天线设计[A];2008年中国西部青年通信学术会议论文集[C];2008年
7 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 陈华媛;王淑艳;吴仁彪;;基于帧时隙ALOHA算法的标签估算数据分析[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
9 张陆;佐斌;;IAT在测量刻板印象中的属性类别标签效应[A];“改革开放与心理学”学术研讨会——湖北省暨武汉心理学会2008年学术年会论文集[C];2008年
10 李欣;林代茂;;一种基于标签排序的Swf文件版权保护方法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
相关重要报纸文章 前10条
1 张珂;欧米特将创新技术带到芝加哥国际标签展[N];中国包装报;2008年
2 本报记者 刘力源;看色别标签 知老人忌口[N];文汇报;2010年
3 本报记者 成静;“信任标签”让不良网商无处藏身[N];中国经济导报;2007年
4 本报记者 王巍;深圳标签护航协议供货[N];政府采购信息报;2008年
5 钟品;贴了新标签就可网开一面?[N];中国改革报;2009年
6 李松;贺岁热:贴个标签就能热卖?[N];新华每日电讯;2004年
7 本报记者 付丽丽 实习记者 吴琼;自然标签揪住了问题食品的“尾巴”[N];大众科技报;2009年
8 张珂;防伪小标签 做出大生意[N];农民日报;2008年
9 本报记者 李丽钧;“高端”身份仅靠一纸标签明示[N];河北经济日报;2010年
10 谭俊峤;标签市场机会不少[N];中国包装报;2008年
相关博士学位论文 前10条
1 龙丽坤;高压诱导水稻发生可遗传DNA甲基化变异和转座子mPing及Pong的转座激活[D];东北师范大学;2006年
2 赖晓铮;UHF频段射频识别系统与天线研究[D];华南理工大学;2006年
3 范志广;超高频射频识别(RFID)中的若干问题研究[D];浙江大学;2007年
4 高远舰;膜联蛋白B1的功能研究及其在蛋白分离和纯化中的应用[D];第二军医大学;2005年
5 刘丹;大成组技术中的若干关键技术研究[D];浙江大学;2010年
6 李晓燕;海量图像语义分析和检索技术研究[D];浙江大学;2009年
7 黄健华;基于SAGE技术的家蚕基因表达谱研究[D];中国科学院研究生院(上海生命科学研究院);2007年
8 管子玉;基于图学习的Web信息检索技术研究[D];浙江大学;2010年
9 叶菊秀;传染性法氏囊病毒粒子感染及其A节段编码基因转化细胞的转录本初步分析[D];浙江大学;2006年
10 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
相关硕士学位论文 前10条
1 张明涛;用于RFID系统的天线设计[D];西安电子科技大学;2007年
2 吴海博;ForCES路由器中路由机制的研究与实现[D];清华大学;2007年
3 张宁;UHF RFID系统标签天线快速设计与测量[D];北京邮电大学;2011年
4 袁晓栋;苏州健康网网站发布系统[D];吉林大学;2005年
5 徐雪慧;射频识别技术中防冲突算法研究[D];华中师范大学;2006年
6 朱兆鹰;L公司中国战略[D];复旦大学;2008年
7 孟淑玲;射频识别系统中防冲突算法的研究[D];天津大学;2008年
8 夏标;新一代EAS系统的研究与实现[D];华东师范大学;2009年
9 江岸;无线射频识别系统中防碰撞问题的研究[D];湖南大学;2009年
10 崔士津;RFID系统关键技术研究[D];哈尔滨工程大学;2008年
,本文编号:2493050
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2493050.html