当前位置:主页 > 经济论文 > 信息经济论文 >

基于关联规则的微博主题搜索策略研究

发布时间:2020-03-08 08:12
【摘要】:在Web2.0时代,微博已成为一个有重要价值的信息平台。为了利用微博平台为用户提供较好的搜索服务,论文应用关联规则挖掘技术识别微博相关话题,利用相关话题扩充机制和话题语义相似度度量,构建微博搜索索引文件。实验分析表明:相对于传统的关键词搜索策略,论文提出的搜索策略能从浩瀚的微博信息平台中找到更加有效的搜索结果。
【图文】:

设计图,检索策略,设计图


向量余弦来度量搜索话题与文档的相似度。2检索策略设计选择基于API数据采集方式收集微博中的信息。用ICTCLAS软件对采集的博文进行分词处理,结合VSM思想,实现文档数据的结构化处理;利用微博平台话题的用户关注网络,得到用户影响力,继而利用关联规则将分词数据与用户影响力结合起来,得到关联文本;对于短文本式搜索,查询扩充机制是必不可少的工作,为了保证微博查询扩充机制的实现,构建了基于关联文本的索引文件。在对搜索词进行扩充后,便能通过之前搜集到的信息和索引文件快速准确的返回搜索结果。设计思路如图1所示。图1检索策略设计图2.1分词处理国内分词系统的主要思想是以词典为基础,进行字符串匹配,以少量词法、句法以及语义规则进行辅助。基于N-最短路径方法的中科院的中文分词系统ICTCLAS在中文分词上有着比较广泛的应用,同时它还提供了多种接口,,如C#、C等接口,可以通过接口,调用该软件。提取微博的关键字,对句子含义造成噪音干扰的词汇进行去除,仅保留具有能涵盖句子意义的词汇,也就是通过去除噪音,清洗文本信息。根据对微博热点话题,如“汶川地震”、“乔布斯去世”等语句组成元素的分析,可以发现,名词性质的词是占绝对分量。所以在提取微博关键词时仅保留名词,动名词,专有名词等词性的词,其它词性的词汇一律清洗掉。2.2关联规则与用户影响力截取相应时间段内的微博数据,利用关联规则挖掘技术识别相关话题。该技术的基本思想是将类Apriori的关联规则算法应用到文本挖掘中。规则支持度表示规则出现的频率,规则置信度表示规则的可靠性,可以根据自己的需要设置两者合理的阈值。在进行关联分析之前,需对话题中的用户影响力进行评价。在微博中,用户间的关注关系已构成了社区,即用户

【参考文献】

相关期刊论文 前3条

1 郭炜;何丕廉;;面向领域的语义排序与自适应热点算法[J];天津大学学报;2007年07期

2 霍华,冯博琴;一种基于微分流型的Web检索算法[J];西安交通大学学报;2005年02期

3 崔争艳;;基于语义的微博短信息分类[J];现代计算机(专业版);2010年08期

相关硕士学位论文 前1条

1 唐朝辉;潜在语义分析在互联网数据挖掘中的应用研究[D];湖南大学;2009年

【共引文献】

相关期刊论文 前8条

1 李龙;李芝棠;涂浩;史春永;;一种分布式微博数据采集平台的设计与实现[J];广西大学学报(自然科学版);2011年S1期

2 张东霞;;基于高校学生微博的舆情热点分析与发现[J];东南传播;2013年06期

3 王志晓;张大陆;王玉红;王东;;P2P语义搜索研究进展[J];计算机科学;2010年04期

4 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期

5 程亮;邱云飞;孙鲁;;微博谣言检测方法研究[J];计算机应用与软件;2013年02期

6 周胜臣;瞿文婷;石英子;施询之;孙韵辰;;中文微博情感分析研究综述[J];计算机应用与软件;2013年03期

7 陈正思;张建中;;分词在行业知识检索中的差异影响与改进对策[J];网络财富;2010年22期

8 赵文兵;朱庆华;吴克文;黄奇;;微博客用户特性及动机分析——以和讯财经微博为例[J];现代图书情报技术;2011年02期

相关硕士学位论文 前9条

1 孙胜平;中文微博客热点话题检测与跟踪技术研究[D];北京交通大学;2011年

2 张玉;基于社会化标签的个性化推荐系统研究[D];合肥工业大学;2011年

3 高宝军;Web结构挖掘中PageRank算法优化研究[D];兰州大学;2011年

4 刘义亮;基于元搜索调度算法的领域搜索模型研究[D];大连理工大学;2008年

5 黄波;基于向量空间模型和LDA模型相结合的微博客话题发现算法研究[D];西南交通大学;2012年

6 郭瑞;基于GPU和内容标签的个性化推荐系统研究[D];武汉科技大学;2012年

7 时睿;面向短文本的网络舆情分析[D];西安电子科技大学;2012年

8 李旭;移动微博应用管理系统的研究设计与实现[D];中山大学;2012年

9 方维;微博兴趣识别与推送系统的研究与实现[D];华中科技大学;2012年

【二级参考文献】

相关期刊论文 前10条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报;2003年04期

3 刘丽清;;微博虽“微”足值道尔——微博特性之浅析[J];东南传播;2009年11期

4 汪晓岩,胡庆生,李斌,庄镇泉;面向Internet的个性化智能信息检索[J];计算机研究与发展;1999年09期

5 邢春晓;高凤荣;战思南;周立柱;;适应用户兴趣变化的协同过滤推荐算法[J];计算机研究与发展;2007年02期

6 王永恒;贾焰;杨树强;;大规模文本数据库中的短文分类方法[J];计算机工程与应用;2006年22期

7 秦国;杜小勇;;基于用户层次信息的协同推荐算法[J];计算机科学;2004年10期

8 张丙奇;基于领域知识的个性化推荐算法研究[J];计算机工程;2005年21期

9 沈云斐;沈国强;蒋丽华;覃征;;基于时效性的Web页面个性化推荐模型的研究[J];计算机工程;2006年13期

10 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期

【相似文献】

相关期刊论文 前10条

1 严仍荣;;数值型关联规则挖掘在客户关系管理中的应用[J];皖西学院学报;2007年05期

2 吕圣军;郭伟青;;房地产CRM的挖掘算法应用[J];商场现代化;2008年06期

3 朱慧爽;;数据挖掘在纺织高校科研管理系统中的应用[J];山东纺织经济;2008年03期

4 孙景;田甜;;基于多层关联规则的银行产品交叉销售策略[J];中国金融电脑;2008年10期

5 张志彦;李俊峰;;关联规则挖掘在学生成绩分析中的应用[J];科技和产业;2009年05期

6 刘芳;晏志勇;;基于ART的电子商务推荐系统的研究与实现[J];中国商贸;2009年07期

7 甘振韬;;基于关联规则的数据挖掘技术在网络教学中的应用探讨[J];科学咨询(决策管理);2010年01期

8 吴学民;;基于关联规则的股票走势关联挖掘研究[J];科协论坛(下半月);2010年03期

9 郭卜铭;吕渭济;;高校科研管理中的数据挖掘技术及应用[J];科技和产业;2007年06期

10 何跃;郭辉;;应用关联规则挖掘研究观众喜爱的电视节目[J];统计与决策;2007年11期

相关会议论文 前10条

1 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

2 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

3 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

4 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年

5 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

6 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

7 张仲楠;孙志挥;;关系数据库中限制性关联规则挖掘的优化[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

8 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

9 杨晓雪;衡红军;;一种对XML数据进行关联规则挖掘的方法研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

10 周爱广;李玉忱;蒋志芳;曹璐;;基于HOLAP的关联规则挖掘[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

相关重要报纸文章 前1条

1 浙江省金华市烟草专卖局 满在明 廖明景;谈卷烟专卖案件信息的挖掘[N];东方烟草报;2011年

相关博士学位论文 前10条

1 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年

2 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年

3 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年

4 毛宇星;关联规则挖掘在分类数据领域的扩展性研究[D];复旦大学;2010年

5 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年

6 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年

7 王玮;基于概念格的关联规则挖掘及变化模式研究[D];山东大学;2012年

8 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年

9 颜跃进;最大频繁项集挖掘算法的研究[D];国防科学技术大学;2005年

10 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年

相关硕士学位论文 前10条

1 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年

2 邹丽;分布式系统下关联规则挖掘的研究与实现[D];大连交通大学;2005年

3 黄鹏鹤;关联规则挖掘及其在教务管理中的应用[D];大连交通大学;2005年

4 徐勇;基于概念格模型的分布式关联规则挖掘研究[D];合肥工业大学;2006年

5 李伟;基于关联规则B2C图书销售网站个性化推荐系统研究[D];对外经济贸易大学;2007年

6 梁碧珍;目标频繁项集挖掘算法与应用研究[D];广西大学;2007年

7 陈耀东;遗传算法在关联规则挖掘中的应用[D];华东师范大学;2008年

8 唐文志;蚁群算法在关联规则学习中的研究与应用[D];北京工业大学;2009年

9 李宏运;关联规则挖掘在图书馆管理中的应用[D];华东师范大学;2009年

10 陈斌;条件独立性在关联规则挖掘中的研究和应用[D];河海大学;2004年



本文编号:2585519

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/xxjj/2585519.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2957b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com