当前位置:主页 > 科技论文 > 搜索引擎论文 >

微博中基于增强型倒排索引的特定文档影响力估计算法

发布时间:2017-10-19 16:18

  本文关键词:微博中基于增强型倒排索引的特定文档影响力估计算法


  更多相关文章: 信息获取 倒排索引 TFIDF指标 索引标记


【摘要】:微博搜索系统中,将微博帖子根据搜索相关性和重要性进行排序,并通过列表的方式返回结果,是目前信息内容的主要展示手段。基于向量空间模型的打分函数被广泛地应用于该类系统中。事实上,微博系统中的帖子重要性打分函数实际取值并不为用户所见,文档的影响力通过排名的方式表现出来。对于一个检索外的文档,如何衡量其在信息检索系统文库中的影响力?一般搜索引擎或信息检索系统并不能很好地回答该问题。在微博短文本的基础上引入了社交影响力这一概念,并通过在文本倒排索引基础上设置反向位置标记,给出了一种全新的影响力度量指标,有效地回答了前述问题。理论分析和数据实验验证了算法的有效性和效率。
【作者单位】: 国防科学技术大学计算机学院;
【关键词】信息获取 倒排索引 TFIDF指标 索引标记
【基金】:国家863计划资助项目(2011AA010702,2012AA01A402) 国家自然科学基金资助项目(91124002) 科技支撑计划课题(2012BAH38B06)
【分类号】:TP391.3
【正文快照】: 1引言随着信息技术的快速发展和互联网应用的普及,社会各行业对信息化需求不断增加,产生了大量的信息内容,极大促进了信息检索系统的发展。特别是近年来,以微博为代表的社交网络获得了快速的发展,受社交网络的推动,信息传播模式快速朝着去中心化的方向发展,人类使用互联网的方

【共引文献】

中国期刊全文数据库 前2条

1 郑炜;梁战平;梁建;;基于个性化数据的搜索引擎技术研究[J];情报理论与实践;2013年10期

2 刘海峰;于利军;刘守生;;一种基于类别分布信息的文本特征选择模型[J];图书情报工作;2013年15期

中国博士学位论文全文数据库 前1条

1 张乃静;基于林业科学数据的语义检索研究[D];中国林业科学研究院;2013年

中国硕士学位论文全文数据库 前6条

1 苑琳琳;中医脾胃系疾病辨证诊断若干关键技术研究[D];浙江理工大学;2013年

2 王卫芳;web服务组合的可信评估方法研究[D];中南大学;2012年

3 黄继超;k-means算法若干改进和应用[D];中南大学;2013年

4 万猛;基于贝叶斯网的轴承失效分析应用研究[D];河南科技大学;2013年

5 董金威;基于高斯核函数的带钢边缘缺陷检测系统的设计与实现[D];华中科技大学;2013年

6 徐涛;基于多特征的足球视频索引算法研究[D];华中科技大学;2013年

【相似文献】

中国期刊全文数据库 前10条

1 王智强,刘建毅;一种实时更新索引结构的设计与实现[J];计算机系统应用;2005年10期

2 王宏宇;;基于Native-XML数据库倒排索引算法研究[J];情报科学;2006年07期

3 苏潭英;郭宪勇;金鑫;;一种基于Lucene的中文全文检索系统[J];计算机工程;2007年23期

4 黄少林;王华;张玉红;蒋一峰;;基于Lucene的索引系统的设计与实现[J];现代情报;2009年07期

5 王涛;吴洁明;;搜索引擎建立倒排索引的算法研究[J];现代计算机(专业版);2008年01期

6 王路芳;张虎;;一种面向搜索引擎的基于集合模型的搜索算法[J];山西农业大学学报(自然科学版);2009年06期

7 吐尔洪·吾司曼;维尼拉·木沙江;;维、哈、柯多语种搜索引擎中索引器的研究[J];新疆大学学报(自然科学版);2011年02期

8 余淼;杨丹;赵俊芹;;垂直搜索引擎的关键技术研究[J];软件导刊;2007年23期

9 宁可为;;自动答疑系统知识库文本的索引研究[J];电脑知识与技术;2009年35期

10 宁可为;王炜;;基于倒排索引的答疑系统知识库文本研究[J];湖北广播电视大学学报;2010年06期

中国重要会议论文全文数据库 前10条

1 刘小珠;孙莎;曾承;彭智勇;;基于缓存的倒排索引机制研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

2 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

3 寿国础;;公网接入技术在信息获取中应用分析[A];第二届全国信息获取与处理学术会议论文集[C];2004年

4 张健;;空间信息获取与传输中的无线电技术发展分析[A];第二届全国信息与电子工程学术交流会暨第十三届四川省电子学会曙光分会学术年会论文集[C];2006年

5 刘卉;张漫;;无线传感器网络技术在农业中应用[A];2007年中国农业工程学会学术年会论文摘要集[C];2007年

6 陈文平;毛宽荣;赵严杰;;在互联网络中获取便秘相关信息[A];中华中医药学会肛肠分会换届会议暨便秘专题研讨会论文专刊[C];2007年

7 董祥千;左志宏;刘强国;;Lucene倒排索引文件的实现与优化[A];四川省通信学会2006年学术年会论文集(二)[C];2006年

8 徐秀芳;刘银年;王建宇;;多谱段相机的信息获取与处理技术[A];第二届全国信息获取与处理学术会议论文集[C];2004年

9 何铨;Hora W.Tjitra;马剑虹;;群体复杂问题解决中策略使用和信息获取的模拟研究[A];第十届全国心理学学术大会论文摘要集[C];2005年

10 王纪华;赵春江;刘良云;郑文刚;王秀;黄文江;;基于数字技术的农田信息快速获取与表达[A];中国数字农业与农村信息化学术研究研讨会论文集[C];2005年

中国重要报纸全文数据库 前10条

1 潘学俊;聚焦信息战前沿:“信息获取”[N];解放军报;2003年

2 钟文;信息获取新模式推动互联网搜索引擎“变脸”[N];国际商报;2003年

3 本报记者 王翌;“搜索”改变信息获取方式[N];计算机世界;2004年

4 彭勃;信息获取决胜未来[N];解放军报;2002年

5 马炜;格式差异不能限制信息获取[N];中国计算机报;2004年

6 李兆平;北京:小面积基础地理信息获取有新法[N];中国测绘报;2008年

7 黄岳;Web2.0下一步怎么走?[N];电脑报;2006年

8 记者 常思哲;沈阳造出飞行机器人[N];沈阳日报;2009年

9 李杰;农业生物—环境信息获取无线传感器网络技术研究[N];科技日报;2007年

10 钱晓虎邋通讯员 谭依娜;东海舰队某基地高山海岛部队架通信息“高速路”[N];解放军报;2007年

中国博士学位论文全文数据库 前10条

1 金鑫;数字化背景下的消费者信息获取:对社会信息资源的选择和反思[D];复旦大学;2012年

2 张方华;知识型企业的社会资本与技术创新绩效研究[D];浙江大学;2005年

3 胡良梅;基于信息融合的图像理解方法研究[D];合肥工业大学;2006年

4 朱婕;网络环境下个体信息获取行为研究[D];吉林大学;2007年

5 陆再林;基于图形理解的建筑工程量信息获取原理、方法及其应用研究[D];浙江大学;2002年

6 马静华;基于运动信息获取及智能处理的运动员训练指导系统研究[D];中国科学技术大学;2006年

7 宋记锋;信息获取与应用的若干关键技术研究[D];中国科学技术大学;2008年

8 吴德会;基于质量信息集成的智能质量控制技术研究[D];合肥工业大学;2006年

9 喻友平;企业客户服务中的客户识别方法与支持平台的研究[D];华中科技大学;2007年

10 岳小莉;基于多粒度的产品信息获取技术研究[D];浙江大学;2002年

中国硕士学位论文全文数据库 前10条

1 张治平;Web信息精确获取技术研究[D];国防科学技术大学;2004年

2 崔建晔;VTS的信息获取与播发技术的研究[D];大连海事大学;2009年

3 董富强;网络用户行为分析研究及其应用[D];西安电子科技大学;2005年

4 刘红雨;基于倒排索引的微博话题检测[D];哈尔滨工业大学;2013年

5 董长春;基于Hadoop的倒排索引技术的研究[D];辽宁大学;2011年

6 代万能;倒排索引技术在Hadoop平台上的研究与实现[D];电子科技大学;2013年

7 汪红敏;基于固态硬盘的倒排索引动态更新策略及其优化研究[D];华中科技大学;2013年

8 张博;基于Lucene倒排索引性能的研究与优化[D];昆明理工大学;2013年

9 潘胜一;基于倒排索引的压缩算法性能研究[D];杭州电子科技大学;2009年

10 杨国营;基于MapReduce模型文本分类算法的研究[D];辽宁大学;2013年



本文编号:1062083

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1062083.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户be6ca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com