基于独立分量分析的语义聚类技术在信息检索中的应用研究.pdf
本文关键词:基于独立分量分析的语义聚类技术在信息检索中的应用研究,,由笔耕文化传播整理发布。
电子科技大学
博士学位论文
基于独立分量分析的语义聚类技术在信息检索中的应用研究
姓名:蒲强
申请学位级别:博士
专业:计算机系统结构
指导教师:杨国纬;He Daqing
20100601摘要
摘要
随着计算机技术及网络技术的飞速发展,世界上的数据正以惊人的速度增长
着。面对现代纷繁复杂的海量信息资源,人们反而有了“淹没在信息海洋中”的
困惑。如何快捷、准确地得到所需信息已成为人们关注的焦点问题。信息检索技
术能够帮助不同领域的人们从文本、图像、声音等庞大的数据资料中寻找其所需
的信息。以信息检索技术为核心技术的搜索引擎已经成为人们从互联网发现
所需信息的最依赖的工具,显示出这一领域巨大的市场价值和经济利益。在庞大
用户需求的驱动下,信息检索技术不断发展和创新,成为近年来信息领域研究的
热点。
本文的研究基于统计信号处理技术和信息检索技术的结合,这是源于将文本
文档看成不同主题信号混合的产物,利用统计信号领域中独立分量分析,技术对文档进行处理,分离的独立分量能
很好地表示文档的语义主题结构。基于这一认识,全文以概率模型、信息论、线
性代数及有关统计方法为理论基础,配合大量详实的实验分别研究了基于的
语义聚类理论模型及其应用、基于语义聚类的相关模型和查询模型的估计,
同时还对信息检索领域最常用的查询扩展技术进行了研究。论文主要的贡献和创
新之处包括五个方面:
.提出语义聚类激活的概念,并在理论上证明了利用激活语义聚
类下文档估计的语义主题在语义距离上比使用全部反馈文档估计的语义主题更接
近于真实语义主题。以用户查询为导向的激活方式在语义上将聚类下的文档与查
询关联起来,克服了反馈文档主题分散同现带来
本文关键词:基于独立分量分析的语义聚类技术在信息检索中的应用研究,由笔耕文化传播整理发布。
本文编号:194022
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/194022.html