当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于加权关联规则挖掘的相关文献推荐

发布时间:2019-09-11 16:04
【摘要】:研究利用数据挖掘中的关联规则挖掘分析及论文数据库,进行相关文献推荐,提出适用于进行相关文献推荐的改进的混合加权关联规则挖掘算法,并通过用户行为分析确定相关文献集和垂直权重,采用Google搜索引擎的PageRank算法确定水平权重,获得一些有意义的分析结果。
【图文】:

流程,推荐工作,相关文献,文献


Item A B3. 1 相关文献推荐工作流程  经分析,相关文献推荐工作流程如图1所示:图1 相关文献推荐工作流程  在进行相关文献推荐的过程中,首先根据用户提交的检索式进行查询,再针对用户浏览的每一个检索结果推荐相关文献。在确定推荐文献的过程中,首先要根据用户浏览的文献确定一个相关文献集合,并判断该集合中的每一篇文献的质量,再利用MWARRDR算法对该集合进行挖掘,最终得出文献与用户浏览的文献(即初始文献)的相关度,从而进行推荐。同时

流程,日志分析,兴趣度


体现了以用户为中心的思想。  模型的分析数据来自网站日志,只分析中文文献,不分析外文文献。进行日志分析的简单流程可用图2表示。分析用户类U中的用户对文献集D中的每篇文献分别进行了怎样的操作,从而就能确定相关文献集D中每一篇文献获得的总兴趣度。图2 日志分析流程  将用户对文献的兴趣度定义为β。β是用户对通过链接访问到的文献的兴趣度,反映的是用户对链接的肯定程度,因此可将β的值作为加权关联规则挖掘算法中的垂直权重。用户兴趣矩阵如表2所示:  表2 用户兴趣矩阵DocumentUserD1 D2 D3……DmU1β11β12β13……β1mU2β21β22β23……β2mU3β31β32β33……β3m…… …… …… …… …… ……Unβn1βn2βn3……βnm  (1)判断用户Ui对初始文献A的兴趣度  主要通过用户对文献A是如何访问和操作的来进行分析。为每一个访问方式和操作方式分别确定一个分值,二者之积就构成用户Ui对文献A的兴趣度αi。分值确定标准如表3、表4所示:  表3 访问到A的方式分值表如何访问到A的分值输入检索词后,检索结果列表中有A,点击访问。0. 6访问检索结果列表中的文献(A不在检索结果列表中),通过其题录页中列出的链接访问到A。0. 4  表4 对A进行的操作分值表对A进行的操作分值只是浏览题录页
【作者单位】: 西南大学计算机与信息科学学院 西南大学图书馆 西南大学计算机与信息科学学院 西南大学计算机与信息科学学院
【基金】:西南大学青年基金项目“基于个人网络化学习体系的个人知识管理研究”(项目编号:X06-TQ2502)的研究成果之一
【分类号】:TP311.13

【参考文献】

相关期刊论文 前3条

1 郭岩,白硕,杨志峰,张凯;网络日志规模分析和用户兴趣挖掘[J];计算机学报;2005年09期

2 李长玲;翟雪梅;;基于PageRank的引文分析方法探讨[J];情报理论与实践;2007年01期

3 欧阳为民,郑诚,蔡庆生;数据库中加权关联规则的发现[J];软件学报;2001年04期

【共引文献】

相关期刊论文 前10条

1 吕佳;;Web日志挖掘技术应用研究[J];重庆师范大学学报(自然科学版);2006年04期

2 陆建江,徐宝文,邹晓峰,康达周;模糊关联规则的并行挖掘算法[J];东南大学学报(自然科学版);2005年02期

3 肖海林;李兴明;;层次分析法在通信网告警相关性分析中的应用研究[J];电信科学;2006年11期

4 范全润,李丽,杨泽民;数据挖掘在电子商务中的应用分析[J];德州学院学报;2002年04期

5 邢玲;马建国;李幼平;刘志文;;一种基于UCL的中文网页信息过滤方法[J];电子学报;2006年10期

6 杨近松;胡君;;光学镜头结构智能化设计系统[J];光学精密工程;2005年S1期

7 普杰信,薛冰冰;加权关联规则在网络入侵检测系统中的应用[J];信息技术;2004年04期

8 王艳;王红霞;;基于Apriori算法的加权关联规则挖掘[J];河南科技学院学报(自科版);2006年02期

9 欧阳继红,王仲佳,刘大有;具有动态加权特性的关联规则算法[J];吉林大学学报(理学版);2005年03期

10 杨明,孙志挥,赵传申;交易数据库的加权关联规则增量更新算法[J];计算机工程与应用;2002年01期

相关会议论文 前1条

1 周延泉;张传福;张瑞华;李蕾;何华灿;;移动个性化信息服务中的用户兴趣模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

相关博士学位论文 前6条

1 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年

2 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年

3 蒙祖强;基于分类模型的知识发现机理和方法研究[D];中南大学;2004年

4 颜跃进;最大频繁项集挖掘算法的研究[D];国防科学技术大学;2005年

5 陈耿;面向中观审计的规则发现算法研究[D];东南大学;2005年

6 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年

相关硕士学位论文 前10条

1 张新霞;基于统计相关性的有趣关联规则的挖掘[D];武汉科技大学;2002年

2 张仕念;可测空间与Pawlak代数的关系及基于粗集理论的数据挖掘技术[D];昆明理工大学;2002年

3 欧广宇;数据仓库在超市配送决策支持中的应用[D];郑州大学;2002年

4 武鹏程;关联规则扩展模型的研究[D];合肥工业大学;2002年

5 李雪斌;基于粗糙集理论的规则挖掘方法研究[D];江西师范大学;2002年

6 林振民;分治策略在关联规则挖掘中的应用[D];厦门大学;2002年

7 田海山;基于Web日志的数据挖掘研究[D];河北工业大学;2003年

8 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年

9 张宏宇;粗糙集理论及其在数据挖掘中的应用研究[D];山西大学;2003年

10 陈安龙;基于兴趣度的关联规则挖掘算法的研究[D];西南交通大学;2003年

【二级参考文献】

相关期刊论文 前4条

1 郭岩;基于网络用户行为的搜索引擎系统SISI[J];计算机工程;2004年16期

2 郭岩;基于网络用户行为的相关页面挖掘模型[J];微电子学与计算机;2003年05期

3 高建群,张荣安,陈吉平,施业;期刊引文分析及其情报价值[J];图书情报工作;2004年01期

4 叶协杰;蔡丽珠;邸铭;;我国近年引文分析研究论文的计量分析[J];现代情报;2006年02期

【相似文献】

相关期刊论文 前10条

1 刘晓云;帮助现代企业克服信息障碍——数据仓库 浮出海面[J];中国计算机用户;1995年12期

2 王景璋,刘惠英;情报接受过程中的转换效应[J];现代情报;1996年05期

3 木子;数据库热门技术[J];中国计算机用户;1996年22期

4 肖利,金远平,徐宏炳,王能斌;一个新的挖掘广义关联规则算法[J];东南大学学报(自然科学版);1997年06期

5 涂杰,俞桂平,张哲毅;决策支持系统在税务系统中的应用[J];计算机工程;1997年S1期

6 王轶彤,许学标,施伯乐;Rough集理论在数据挖掘中的应用及其推广[J];计算机工程;1997年S1期

7 程继华,施鹏飞;快速顺序模式的挖掘[J];计算机工程;1997年S1期

8 宋韬,张琦,陈丽秋;数据挖掘及其在税务系统中的应用[J];计算机工程;1997年S1期

9 ;计算机中英文新技术词汇对照[J];通信世界;1997年12期

10 林鸿;数据仓库与财务决策支持系统[J];微型电脑应用;1997年04期

相关会议论文 前10条

1 李永敏;朱善君;吉吟东;陈湘晖;;一种基于近似推理的数据挖掘算法[A];1998中国控制与决策学术年会论文集[C];1998年

2 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会土木工程计算机应用文集[C];1999年

3 宋德昌;姚莉;;基于数据仓库的决策支持系统初探[A];Systems Engineering, Systems Science and Complexity Research--Proceeding of 11th Annual Conference of Systems Engineering Society of China[C];2000年

4 刘耀;;Internet/Intranet环境下新型企业DSS设计与开发[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年

5 赵奕;施鹏飞;朱莉莉;;感兴趣Rough格关联规则发现[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年

6 赵奕;施鹏飞;;一种快速的概念格构造方法[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年

7 王建华;王菲;黄国建;;数据挖掘技术研究的现状及展望[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年

8 李小平;焦李成;;信息颗粒在数据模糊聚类中的应用与构造[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

9 李爱平;陈剑锋;张曙;;网络联盟制造中基于Web的知识供应[A];第一届国际机械工程学术会议论文集[C];2000年

10 沈江;;基于Internet的虚拟企业及电子商务策略[A];第一届国际机械工程学术会议论文集[C];2000年

相关重要报纸文章 前10条

1 孙志永;银行的商业智能[N];中国计算机报;2000年

2 本报记者 朴华;21世纪银行需要金融决策的手段[N];中国计算机报;2000年

3 北京北大融通科技发展有限公司 潘维民 博士;管理,,从点击开始[N];中国计算机报;2000年

4 本报记者 刘红鹰 实习生 李君君;银行利用“智能”今后才好赚钱[N];信息时报;2000年

5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年

6 李华;怎样才能让客户更满意[N];经济日报;2001年

7 ;用 SellWell2000 挖掘潜在客户[N];中国计算机报;2001年

8 国能科诺赛仕企业数据挖掘实验室 赵纪元;挖掘数据中的“宝藏”[N];中国计算机报;2001年

9 孙富春 李磊;电子政务中的数据挖掘[N];计算机世界;2001年

10 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年

相关博士学位论文 前10条

1 曹蓟光;联机分析挖掘处理技术(OLAM)的研究[D];浙江大学;2001年

2 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年

3 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年

4 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年

5 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年

6 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年

7 韩斌;基于数据挖掘的信息融合理论和应用[D];浙江大学;2002年

8 皮德常;CIMS数据库中数据挖掘关键技术的研究[D];南京航空航天大学;2002年

9 张国江;软计算方法和数据挖掘理论在电力系统负荷预测中的应用[D];浙江大学;2002年

10 杜一平;化学数据挖掘新算法和定量构性关系基础研究[D];湖南大学;2002年

相关硕士学位论文 前10条

1 蔡刚坤;数据仓库技术在图书馆中的应用研究[D];西安理工大学;2000年

2 谷宏伟;中国工商银行卡综合信息分析系统[D];河北工业大学;2000年

3 俞珏民;基于项-事务关联数据库的相联规则挖掘算法的研究[D];郑州大学;2000年

4 陈子阳;基于概念层次树的多层次关联规则数据挖掘算法研究[D];燕山大学;2000年

5 路燕;基于时空调节及基于三次遍历的快速关联规则挖掘算法的研究[D];燕山大学;2000年

6 康松林;动态信息系统的研究[D];大连海事大学;2000年

7 李晓;Web挖掘技术[D];河海大学;2001年

8 安磊;一种基于遗传算法的数据挖掘技术的研究与应用[D];河海大学;2001年

9 陈庆强;数据仓库和时态数据库时态查询的方法比较[D];暨南大学;2001年

10 陈小宁;Web信息资源获取技术的研究与实现[D];暨南大学;2001年



本文编号:2534532

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2534532.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户700de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com