网络文本信息聚类算法研究与应用.pdf
发布时间:2016-08-30 10:41
本文关键词:网络文本信息聚类算法研究与应用,,由笔耕文化传播整理发布。
文档介绍:
北京交通大学硕士学位论文网络文本信息聚类算法研究与应用姓名:张树魁申请学位级别:硕士专业:通信与信息系统指导教师:刘云20090601中文摘要摘要:随着计算机网络技术在全球范围内的迅速发展与普及,网络信息资源同趋丰富且内容复杂多样,其中既有大量进步、健康的信息,也不乏反动、迷信的内容。因此,如何对这样庞大的信息资源进行快速有效的检索分析,对网络舆论进行准确的预测引导成为一个重要而迫切的研究课题。于是,数据挖掘这门技术应运而生,它以数据库技术为基础,融合统计学、机器学习、模糊学等多门学科的成果,研究如何从数据库中提取隐含的、未知的有潜在应用价值的信息或模式。聚类分析在这项技术中占有重要的位置,它通过比较数据的相似性和差异性将一个数据集合分割成几个称为类的子集,从而发现数据信息的内在特征和分布规律。本论文在系统回顾网络信息检索、数据挖掘和聚类算法应用研究现状的基础上,总结了目前通用的聚类算法存在的问题,试图设计一种适用于中文网络文本信息的聚类算法,并进而设计实现一个网络信息聚类系统。本论文的研究内容和创新工作主要体现在以下几点:(1)分析了几种通用的聚类算法,包括基于划分、基于层次、基于密度、基于网格和基于模型聚类算法,通...
内容来自转载请标明出处.
本文关键词:网络文本信息聚类算法研究与应用,由笔耕文化传播整理发布。
本文编号:105209
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/105209.html