当前位置:主页 > 社科论文 > 图书档案论文 >

基于文档多维度的学术文献推荐研究

发布时间:2024-07-10 23:03
  近年来,学术资源的爆炸性增长使得人们在海量数据中快速定位自己需要的信息变得困难。关键词搜索模式虽然可以一定程度缓解信息过载的问题,但是面对海量数据,关键词搜索的结果依旧规模庞大,需要用户在搜索结果中再次甄选所需文献。基于用户历史数据的推荐系统能更精准地获取与用户兴趣相关的文献。现有文档推荐系统通常根据文档的内容和领域相关性或者用户间协同过滤等方式完成推荐,较少考虑到用户的自身学术水平。这使得推荐结果虽然与用户兴趣相关,但部分结果并不符合用户的学术水平和阅读需求,导致利用率较低,造成无效推荐。因此,研究针对学术型用户的学术文献推荐方法具有重要的实用价值。本文完成的主要工作及成果如下:(1)通过网络爬虫技术抓取在线学术文献(2000年-2020年AAAI会议论文集和百度文库文献)作为本研究的数据集。(2)依据维基百科分类词条目录构建概念从属树,将词汇在概念从属树中所处的树深度作为该词汇的概念抽象层次。在学术文献特征提取的过程中考虑了学术文献的文档结构特征和内容特征,改进了传统的词汇权重计算方法,在TF-IDF算法的基础上结合了词汇概念抽象层次和词汇的段落权重。该种计算方法可以更加合理的提取...

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 课题研究背景
        1.1.2 课题研究意义
    1.2 国内外研究现状
    1.3 本文研究内容及成果
    1.4 本文组织结构
第二章 推荐系统基础知识和相关理论
    2.1 推荐技术发展历程
        2.1.1 推荐算法
        2.1.2 推荐方式和评估方式
    2.2 推荐系统模型
    2.3 基于维基百科的概念从属树构建
        2.3.1 维基百科相关背景知识
        2.3.2 概念从属树的构建
    2.4 文档表示模型
    2.5 文档处理
        2.5.1 关键词提取算法
        2.5.2 文档相似度计算
    2.6 本章小结
第三章 基于文档多维度的学术文献推荐方法
    3.1 问题描述
    3.2 用户的文本需求与文档多维度之间对应关系的研究
        3.2.1 文档多维度选定与剖析
        3.2.2 用户模型
    3.3 基于TF-IDF融合文档特征的特征词提取方法
    3.4 基于文档多维度的学术文献推荐方法
        3.4.1 基于文档概念抽象层次的学术文献推荐
        3.4.2 基于文档难度的学术文献推荐
        3.4.3 基于学习难度跨度的文档推荐
    3.5 本章小结
第四章 实验与分析
    4.1 数据集采集及样本库的构建
    4.2 文档各维度正确性验证实验
        4.2.1 样本集
        4.2.2 评估方法
        4.2.3 实验结果与分析
    4.3 基于文档多维度学术文献推荐方法的实验与验证
        4.3.1 样本集
        4.3.2 实验结果与分析
    4.4 本章小结
第五章 系统功能与展示
    5.1 系统功能
    5.2 系统展示
    5.3 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
附录1 攻读硕士学位期间申请的专利
致谢



本文编号:4004869

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/4004869.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户05f51***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com