算法推荐媒体的用户与内容关系研究 ——以《趣头条》为例
发布时间:2021-02-02 21:56
随着互联网技术的迅速发展,算法推荐机制改变了资讯类算法媒体的内容生产、审核、分发等环节,对用户和内容产生了较大的影响。但是在实现用户与内容精准匹配的同时也产生了用户茧房,平台一味追求流量导致内容质量不高等现象。在算法推荐机制下,媒体用户和内容的关系是什么?用户与内容之间又是如何彼此响应的?本质是什么?归因有哪些?如何治理?这些都是值得深究的问题。然而到目前为止,尚未有有关对资讯类算法媒体在这方面的学术研究。趣头条作为下沉市场资讯类算法媒体的典型代表,也利用算法推荐机制实现了用户与内容的匹配,有独立开展技术研发的能力且具有收集用户数据的平台。因此本文以趣头条为例,分析算法推荐机制下用户和内容的响应关系。第一部分研究了算法媒体的技术语境,并建立了算法推荐机制框架,明确了数据是算法推荐机制的核心,算法推荐机制的本质是实现用户和内容的相互匹配。第二部分以趣头条为分析样本设计了针对用户的调查问卷,并对内容进行样本抽样,以分析算法推荐机制下用户和内容的响应关系。首先,从内容来源、内容种类、内容结构、内容情感向度和内容反馈五个维度构建了趣头条内容分析类目,对内容样本进行了周详的量化分析。其次,从用户...
【文章来源】:上海师范大学上海市
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
趣头条的算法推荐机制框架示意图
上海师范大学硕士学位论文第一章算法媒体的技术语境11感兴趣的类别或主题,感兴趣的关键词,感兴趣的来源,基于用户兴趣的用户聚类以及各种垂直兴趣特征。身份特征通常有性别、年龄和常住地址。行为特征,理解为用户使用App的习惯和特定的场域,如晚上刷新闻,地铁上快速浏览等等。用户标签下的数据处理方式有两种,一种是建立批量计算框架,如图1-2所示。抽取昨天使用过头条的用户,追踪用户过去两个月的数据,导入集群中运用算法进行批量计算。这种数据处理方法由于计算量过大,导致计算机的工作强度和难度增大,用户标签更新不理想。图1-2今日头条用户标签批量计算框架另一种是建立流式计算框架,如图1-3所示。通过实时处理用户数据,每收集一定量用户的数据后不断更新用户兴趣模型。流式计算模型比批量计算模型运用的范围更广,效率更高,是解决大部分用户数据完成跟踪推送的算法。图1-3今日头条用户标签流式计算框架(二)内容数据1、内容属性数据的界定内容数据指标的物自身包含的特征和属性。例如,视频数据标签包括出品方、导演、演职员、主演、国别、年代、语言、是否获奖、剧情、海报图等等元数据。对于趣头条而言,以一篇文本为例,文本中包括作者、文章类型、主题、标题、是否原创、时间、字数、语言风格、插图等元数据。文章自身的特征和属性通过显性因素表示。文章标题、作者、时间、是否原创、插图等都是最直接的表达。文章类型和语言风格是人工判断或机器判断的隐
上海师范大学硕士学位论文第一章算法媒体的技术语境11感兴趣的类别或主题,感兴趣的关键词,感兴趣的来源,基于用户兴趣的用户聚类以及各种垂直兴趣特征。身份特征通常有性别、年龄和常住地址。行为特征,理解为用户使用App的习惯和特定的场域,如晚上刷新闻,地铁上快速浏览等等。用户标签下的数据处理方式有两种,一种是建立批量计算框架,如图1-2所示。抽取昨天使用过头条的用户,追踪用户过去两个月的数据,导入集群中运用算法进行批量计算。这种数据处理方法由于计算量过大,导致计算机的工作强度和难度增大,用户标签更新不理想。图1-2今日头条用户标签批量计算框架另一种是建立流式计算框架,如图1-3所示。通过实时处理用户数据,每收集一定量用户的数据后不断更新用户兴趣模型。流式计算模型比批量计算模型运用的范围更广,效率更高,是解决大部分用户数据完成跟踪推送的算法。图1-3今日头条用户标签流式计算框架(二)内容数据1、内容属性数据的界定内容数据指标的物自身包含的特征和属性。例如,视频数据标签包括出品方、导演、演职员、主演、国别、年代、语言、是否获奖、剧情、海报图等等元数据。对于趣头条而言,以一篇文本为例,文本中包括作者、文章类型、主题、标题、是否原创、时间、字数、语言风格、插图等元数据。文章自身的特征和属性通过显性因素表示。文章标题、作者、时间、是否原创、插图等都是最直接的表达。文章类型和语言风格是人工判断或机器判断的隐
【参考文献】:
期刊论文
[1]破解“算法传播”形成“信息茧房”的对策与路径[J]. 王克. 中国地市报人. 2020(05)
[2]新闻聚合平台的算法规制与隐私保护[J]. 张文祥,杨林. 现代传播(中国传媒大学学报). 2020(04)
[3]用户媒介素养优化研究[J]. 黄红梅,李佳宁,张泽梅. 图书馆学研究. 2020(05)
[4]媒体传播中智能算法的社会风险与治理策略研究[J]. 高志华,冯甜甜. 新闻研究导刊. 2020(01)
[5]基于word2vec和CNN的短文本聚类研究[J]. 杨俊峰,尹光花. 信息与电脑(理论版). 2019(24)
[6]基于内容和协同过滤的科技文献个性化推荐[J]. 杨凯,王利,周志平,赵卫东. 信息技术. 2019(12)
[7]智能型算法分发的价值迭代:“边界调适”与合法性的提升——以“今日头条”的四次升级迭代为例[J]. 喻国明,杜楠楠. 新闻记者. 2019(11)
[8]警惕和防止新闻传播研究的同质化[J]. 邵培仁. 现代视听. 2019(10)
[9]隐藏的价值观:平台媒体算法的伦理考量和权力关系[J]. 段鹏,李嘉琪. 江西师范大学学报(哲学社会科学版). 2019(05)
[10]社会化推荐系统综述[J]. 张岐山,翁丽娟. 计算机工程与应用. 2020(01)
硕士论文
[1]农村信息化视角下的手机应用体验设计研究[D]. 李志宇.北方工业大学 2018
本文编号:3015431
【文章来源】:上海师范大学上海市
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
趣头条的算法推荐机制框架示意图
上海师范大学硕士学位论文第一章算法媒体的技术语境11感兴趣的类别或主题,感兴趣的关键词,感兴趣的来源,基于用户兴趣的用户聚类以及各种垂直兴趣特征。身份特征通常有性别、年龄和常住地址。行为特征,理解为用户使用App的习惯和特定的场域,如晚上刷新闻,地铁上快速浏览等等。用户标签下的数据处理方式有两种,一种是建立批量计算框架,如图1-2所示。抽取昨天使用过头条的用户,追踪用户过去两个月的数据,导入集群中运用算法进行批量计算。这种数据处理方法由于计算量过大,导致计算机的工作强度和难度增大,用户标签更新不理想。图1-2今日头条用户标签批量计算框架另一种是建立流式计算框架,如图1-3所示。通过实时处理用户数据,每收集一定量用户的数据后不断更新用户兴趣模型。流式计算模型比批量计算模型运用的范围更广,效率更高,是解决大部分用户数据完成跟踪推送的算法。图1-3今日头条用户标签流式计算框架(二)内容数据1、内容属性数据的界定内容数据指标的物自身包含的特征和属性。例如,视频数据标签包括出品方、导演、演职员、主演、国别、年代、语言、是否获奖、剧情、海报图等等元数据。对于趣头条而言,以一篇文本为例,文本中包括作者、文章类型、主题、标题、是否原创、时间、字数、语言风格、插图等元数据。文章自身的特征和属性通过显性因素表示。文章标题、作者、时间、是否原创、插图等都是最直接的表达。文章类型和语言风格是人工判断或机器判断的隐
上海师范大学硕士学位论文第一章算法媒体的技术语境11感兴趣的类别或主题,感兴趣的关键词,感兴趣的来源,基于用户兴趣的用户聚类以及各种垂直兴趣特征。身份特征通常有性别、年龄和常住地址。行为特征,理解为用户使用App的习惯和特定的场域,如晚上刷新闻,地铁上快速浏览等等。用户标签下的数据处理方式有两种,一种是建立批量计算框架,如图1-2所示。抽取昨天使用过头条的用户,追踪用户过去两个月的数据,导入集群中运用算法进行批量计算。这种数据处理方法由于计算量过大,导致计算机的工作强度和难度增大,用户标签更新不理想。图1-2今日头条用户标签批量计算框架另一种是建立流式计算框架,如图1-3所示。通过实时处理用户数据,每收集一定量用户的数据后不断更新用户兴趣模型。流式计算模型比批量计算模型运用的范围更广,效率更高,是解决大部分用户数据完成跟踪推送的算法。图1-3今日头条用户标签流式计算框架(二)内容数据1、内容属性数据的界定内容数据指标的物自身包含的特征和属性。例如,视频数据标签包括出品方、导演、演职员、主演、国别、年代、语言、是否获奖、剧情、海报图等等元数据。对于趣头条而言,以一篇文本为例,文本中包括作者、文章类型、主题、标题、是否原创、时间、字数、语言风格、插图等元数据。文章自身的特征和属性通过显性因素表示。文章标题、作者、时间、是否原创、插图等都是最直接的表达。文章类型和语言风格是人工判断或机器判断的隐
【参考文献】:
期刊论文
[1]破解“算法传播”形成“信息茧房”的对策与路径[J]. 王克. 中国地市报人. 2020(05)
[2]新闻聚合平台的算法规制与隐私保护[J]. 张文祥,杨林. 现代传播(中国传媒大学学报). 2020(04)
[3]用户媒介素养优化研究[J]. 黄红梅,李佳宁,张泽梅. 图书馆学研究. 2020(05)
[4]媒体传播中智能算法的社会风险与治理策略研究[J]. 高志华,冯甜甜. 新闻研究导刊. 2020(01)
[5]基于word2vec和CNN的短文本聚类研究[J]. 杨俊峰,尹光花. 信息与电脑(理论版). 2019(24)
[6]基于内容和协同过滤的科技文献个性化推荐[J]. 杨凯,王利,周志平,赵卫东. 信息技术. 2019(12)
[7]智能型算法分发的价值迭代:“边界调适”与合法性的提升——以“今日头条”的四次升级迭代为例[J]. 喻国明,杜楠楠. 新闻记者. 2019(11)
[8]警惕和防止新闻传播研究的同质化[J]. 邵培仁. 现代视听. 2019(10)
[9]隐藏的价值观:平台媒体算法的伦理考量和权力关系[J]. 段鹏,李嘉琪. 江西师范大学学报(哲学社会科学版). 2019(05)
[10]社会化推荐系统综述[J]. 张岐山,翁丽娟. 计算机工程与应用. 2020(01)
硕士论文
[1]农村信息化视角下的手机应用体验设计研究[D]. 李志宇.北方工业大学 2018
本文编号:3015431
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/3015431.html