学术搜索日志中的个体用户识别研究
发布时间:2022-10-08 17:07
[目的/意义]文献检索中,特定账号可能以独享和共享的方式被使用。在理解用户信息需求确保个性化服务的精准性的问题上,首先要排除共享账号的群体所产生的各异行为对理解用户需求造成的干扰。因此,需要识别用户的行为边界,即某个账号的访问者是个体还是群体。[方法/过程]从科研用户的日志数据中提取行为习惯和主题偏好两方面特征,构建基于科研用户小数据和随机森林分类的个体用户识别模型,并以国家科技数字图书馆网站为例进行实证研究。[结果/结论]实验表明,提出的方法能够有效识别学术搜索日志中的个体用户,准确率约为92.9%,其中主题一致性是区别个体与群体科研用户的最重要特征。本研究不仅可以帮助识别个体用户和机构用户,优化用户管理,而且为跨设备的同一用户判定提供思路。
【文章页数】:6 页
【文章目录】:
0 引 言
1 相关研究
2 研究设计
2.1 研究思路与框架
2.2 提取用户特征
2.2.1 行为特征提取
2.2.2 主题偏好特征提取
2.3 模型构建与评价
3 实验数据处理
3.1 原始数据集
3.2 数据标注
3.3 科研用户特征选取
3.3.1 行为习惯特征选取
3.3.2 主题偏好特征选取
4 实验结果
4.1 基于随机森林分类的个体用户识别
4.2 与其他算法对比分析
5 结 语
本文编号:3688100
【文章页数】:6 页
【文章目录】:
0 引 言
1 相关研究
2 研究设计
2.1 研究思路与框架
2.2 提取用户特征
2.2.1 行为特征提取
2.2.2 主题偏好特征提取
2.3 模型构建与评价
3 实验数据处理
3.1 原始数据集
3.2 数据标注
3.3 科研用户特征选取
3.3.1 行为习惯特征选取
3.3.2 主题偏好特征选取
4 实验结果
4.1 基于随机森林分类的个体用户识别
4.2 与其他算法对比分析
5 结 语
本文编号:3688100
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3688100.html