社会化问答社区用户生成答案知识聚合及服务研究
发布时间:2020-08-25 16:22
【摘要】:随着大数据和移动互联网时代到来,传统基于关键词检索的搜索引擎搜寻和获取知识的方式已不能很好地满足人们需求。互联网快速发展带来的信息膨胀化、碎片化、冗余化等问题加速了用户对于垂直化、精准化信息的追求,用户越来越倾向于付出较少的时间和精力成本获取更加专业、权威的信息与知识,迫切需要一种新型的搜寻和获取知识方式。正是在这种大环境背景下社会化问答社区应运而生。社会化问答社区将社交和问答结合起来,引入社交网络来生产、传播和共享知识,满足用户精准化、垂直化以及个性化知识需求,帮助用户高效获取和利用知识,促进知识的流动和交互,迅速发展成为网络用户获取知识的重要渠道。然而,随着社会化问答社区知识资源呈现急剧式增长,出现了“知识过载,用户知识迷航”的现象。用户在搜寻、筛选和利用知识等方面付出了大量的时间和精力成本,使得现有的社会化问答社区知识服务内容和方式难以有效满足用户知识需求。同时也出现了答案质量参差不齐、大量有用知识无人问津,难以被发现和使用等问题。因此,如何实现用户生成答案有效的管理组织和挖掘,优化和创新知识服务模式,为用户提供更好的知识服务成为社会化问答社区发展面临重要问题。鉴于此,本文将知识聚合理论和方法引入到社会化问答社区知识服务,从面向用户知识需求视角出发,分析了社会化问答社区知识流动和用户知识需求,提出了基于知识聚合的社会化问答社区知识服务体系,探讨了用户生成答案质量评价问题,分别从知识单元、知识单元关联关系、句子3个关联维度设计用户生成答案知识聚合方法及相应的知识服务模式,最终提出促进社会化问答社区用户生成答案知识聚合及服务能力的策略。本文主要工作及结论如下:第一,探究了社会化问答社区的知识流动和用户知识需求。首先,分析了社会化问答社区知识流动特征、方式和过程。然后,分析了社会化问答社区用户知识需求的形成原因、层级和特征,借鉴科亨和泰勒的需求层次理论分为客观状态知识需求、意识层次知识需求、表达出来的知识需求、折衷知识需求、个性化知识需求5个层级,认为其具有多样和综合化、随机性和情景化、集成性和精准化、动态连续性等特点。最后,分析了用户知识需求动态演化的原因和方向,运用集合论思想分析了互动交流和浏览推荐2种情境下用户动态演化过程。第二,构建了基于知识聚合的社会化问答社区知识服务体系框架。首先,分析当前社会化问答社区现状及发展趋势,概述了用户生成答案知识聚合的目标和原则,将知识聚合理论引入到社会化问答社区知识服务。然后,分析了基于知识聚合的社会化问答社区知识服务要素、动力和过程,以及相应的知识服务模式。最后,构建了基于知识聚合的社会化问答社区知识服务体系框架,分为资源层、处理层、聚合层、服务层和服务接口层5层结构,其中知识聚合层是最为关键层,并分析了各个层的功能和作用。第三,提出了社会化问答社区用户生成答案质量评价方法。首先,通过文献综述和实证分析方法构建了包含答案文本特征、回答者特征、时效性、用户特征、社会情感5个维度16个指标的答案质量评价指标体系。然后,将用户生成答案质量评价问题认为是典型的机器学习分类问题,提出了基于GA-BP神经网络的评价方法。最后,采集知乎网站数据验证了方法的有效性和可行性。第四,基于标签聚类的社会化问答社区用户生成答案知识聚合及导航服务研究。为协助用户高效的从答案中查找和获取知识,提高知识搜寻和获取的效率,为用户提供知识导航和知识发现服务。首先,采用短语匹配模式提取答案中的关键短语,运用Text Rank算法抽取排名靠前的答案文本中关键短语生成标签。然后,认为答案标签能够代表答案的关键知识内容和思想,运用DPCA算法进行答案标签聚类分析,实现用户生成答案知识聚合。最后,构建了基于答案标签聚类的社会化问答社区知识导航服务模式,采集携程网问答数据进行应用研究。第五,基于改进关联规则的社会化问答社区用户生成答案知识聚合及推荐服务研究。为解决社会化问答社区用户生成答案知识过载,挖掘内含知识单元之间的关联,实现用户生成答案的关联知识聚合,为用户提供个性化的知识推荐服务。通过优化和改进了Apriori算法,设计了基于改进Apriori算法的用户生成答案关联知识聚合方法。构建了基于答案关联知识聚合的社会化问答社区知识推荐服务模式,采集知乎网站数据进行应用研究,验证了答案关联知识聚合及服务的有效性和可行性。第六,基于答案摘要生成的社会化问答社区用户生成答案知识聚合及融合服务。为了满足移动互联网环境下用户对于社会化问答社区答案知识总结需求,减少答案查阅和搜寻成本,提高答案知识获取的效率和用户体验。首先,提出了融合word2vec和多特征的句子相似度计算方法,实现短文本句子相似度计算。然后,针对概念类问题提出了基于改进Text Rank和MMR算法的答案摘要生成方法;针对意见咨询类问题提出了基于主题聚类的答案摘要生成方法;针对观点评价类问题提出了融合句子情感极性的答案摘要生成方法。最后,构建了基于答案摘要生成的社会化问答社区知识融合服务模式,选取知乎网站数据进行应用分析。本文从理论层面,将知识聚合理论和理念引入到社会化问答社区知识服务领域,为社会化问答社区知识服务的服务理念、服务模式、方法、价值目标等基础理论赋予了新的内涵特征,丰富了社会化问答社区知识管理与服务的理论体系,扩展了知识聚合理论的应用领域和范围。同时,也为用户生成答案知识聚合提供了更多的方法和技术支持,丰富了知识聚合的方法理论体系和社会化问答社区的知识挖掘和组织方法理论体系。在实践层面,为社会化问答社区优化和创新知识服务模式,基于知识聚合开展知识服务提供参考依据,为用户生成答案知识整合组织和管理提供了技术和方法支持,能够有效的应用于指导用户生成答案知识整合组织和管理工作,提高社会化问答社区知识服务的能力和质量,具有较强的解决社会化问答社区知识服务实际问题的应用价值。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:G252
【图文】:
32图 1.1 研究思路和技术路线1.6 本文主要创新点本文的创新点主要体现在以下三个方面:(1)提出了面向用户需求基于知识聚合的社会化问答社区知识服务体系框架。本文基于社会化问答社区的知识服务现状、知识流动以及用户知识需求动态
形成的知识生产、传递、交流和接受利用活动。社会化问答社区知识流动以知识主体、知识内容、社会化问答社区平台为基本构成要素,在内外部环境影响下,受到知识组织、数据挖掘等信息技术支撑,其分为知识需求刺激、知识生产发布、知识传递、知识接受和利用、知识分解等阶段,过程模型见图 3.1所示。
见图3.2 所示。图 3.2 社会化问答社区用户知识需求层次(1)客观状态知识需求。客观状态的知识需求是社会化问答社区用户在工作、学习和日常生活中探索未知、解决实际问题时总是存在一定的知识需求,是一种不以社会化问答社区用户主观认知为转移的需求状态。这种知识需求是一种潜在知识需求,存在与主体的现实需求之外。由外界的社会环境、经济文化制度、职业性质、法律法规、物理情境、问题情境等各类客观条件决定,不受用户自身特性、意识的影响。客观状态知识需求有些能够被用户意识到,但是大部分不能被意识到或暂时意识不到,但是仍然是客观存在,会随着时间、工作的进展慢慢
本文编号:2803918
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:G252
【图文】:
32图 1.1 研究思路和技术路线1.6 本文主要创新点本文的创新点主要体现在以下三个方面:(1)提出了面向用户需求基于知识聚合的社会化问答社区知识服务体系框架。本文基于社会化问答社区的知识服务现状、知识流动以及用户知识需求动态
形成的知识生产、传递、交流和接受利用活动。社会化问答社区知识流动以知识主体、知识内容、社会化问答社区平台为基本构成要素,在内外部环境影响下,受到知识组织、数据挖掘等信息技术支撑,其分为知识需求刺激、知识生产发布、知识传递、知识接受和利用、知识分解等阶段,过程模型见图 3.1所示。
见图3.2 所示。图 3.2 社会化问答社区用户知识需求层次(1)客观状态知识需求。客观状态的知识需求是社会化问答社区用户在工作、学习和日常生活中探索未知、解决实际问题时总是存在一定的知识需求,是一种不以社会化问答社区用户主观认知为转移的需求状态。这种知识需求是一种潜在知识需求,存在与主体的现实需求之外。由外界的社会环境、经济文化制度、职业性质、法律法规、物理情境、问题情境等各类客观条件决定,不受用户自身特性、意识的影响。客观状态知识需求有些能够被用户意识到,但是大部分不能被意识到或暂时意识不到,但是仍然是客观存在,会随着时间、工作的进展慢慢
【参考文献】
相关期刊论文 前10条
1 王伟;冀宇强;王洪伟;郑丽娟;;中文问答社区答案质量的评价研究:以知乎为例[J];图书情报工作;2017年22期
2 甘春梅;黄悦;;社会化问答社区不同用户行为影响因素的实证研究[J];图书情报知识;2017年06期
3 赵胜辉;李吉月;徐碧;孙博研;;基于TFIDF的社区问答系统问句相似度改进算法[J];北京理工大学学报;2017年09期
4 吕琳露;李亚婷;;游记文本中的知识发现与聚合——以蚂蜂窝旅行网杭州游记为例[J];情报杂志;2017年07期
5 曹树金;李洁娜;王志红;;面向网络信息资源聚合搜索的细粒度聚合单元元数据研究[J];中国图书馆学报;2017年04期
6 施涛;姜亦珂;;社会化问答社区用户知识贡献行为模型研究[J];科技进步与对策;2017年18期
7 刘乙蓉;刘芸;;问答平台中的答案聚合及其优化:以Quora为例[J];图书馆学研究;2017年06期
8 李枫林;魏蕾如;;社会化媒体用户行为的信息聚合机制研究[J];图书馆学研究;2017年05期
9 徐安滢;吉宗诚;王斌;;基于用户回答顺序的社区问答答案质量预测研究[J];中文信息学报;2017年02期
10 范桥青;方钰;;面向健康问答社区的语义检索技术研究与分析[J];电子技术与软件工程;2017年02期
本文编号:2803918
本文链接:https://www.wllwen.com/tushudanganlunwen/2803918.html
教材专著