当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于热点话题自动发现的网站搜索引擎优化

发布时间:2021-01-12 19:34
  搜索引擎作为在丰富的互联网站中获取信息的重要手段,得到了广泛使用。搜索引擎优化是指通过优化网站页面内容、增加网站关键字命中率、改善网站结构以及用户体验等因素使网站符合搜索引擎的搜索规则,最终能够在搜索引擎结果中获得更好排名,增加访问率的策略。其中内容优化是未来的主流趋势,也是搜索引擎所倡导的。目前很对搜索引擎优化团队的优化内容的关键字来源都是通过第三方网络统计公司购买而来的。考虑到Web2.0应用的不断深入,人们参与网络的力式不断在改变,即以前只是参与者,现在已经慢慢转变成号召者,越来越多的流行词,由草根发起,再从草根中流行这一现状。本文针对如何获取新的话题来为搜索引擎优化提供参考这一命题入手,总结了近年来前人工作经验,通过对热点话题发现现状的研究分析,并结合文本分类的理论基础从而实现基于热点话题发现为搜索引擎优化这样的一个工具。之前的网络热点话题基本都是基于点击数,评论数或者转载率来得到,对评论和话题本身内容呼应性考虑的比较少。为此,本文考虑到评论是影响话题热点度的一个重要因素,同时注意到评论和话题内容的相关度,然后对相关度比较低的评论进行噪音过滤,对剩余的评论进行热点度计算,从而得... 

【文章来源】:复旦大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:54 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景、目的及意义
    1.2 本文的主要内容和创新点
    1.3 本文的章节安排
第二章 相关研究理论与关键技术
    2.1 搜索引擎优化技术
    2.2 网络爬虫技术
    2.3 文本预处理
    2.4 文本表示
        2.4.1 向量空间模型
        2.4.2 关于向量空间模型的讨论
        2.4.3 文本特征选取
        2.4.4 特征权重算法
        2.4.5 TF-IDF权重算法分析
        2.4.6 改进的权重算法
第三章 搜索引擎优化关键技术
    3.1 热点话题发现
        3.1.1 概述
        3.1.2 噪音评论过滤
            3.1.2.1 算法思想
            3.1.2.2 内容相关度计算
            3.1.2.3 评论再筛选
            3.1.2.4 噪音过滤举例
        3.1.3 热点话题识别
            3.1.3.1 算法思想
            3.1.3.2 算法设计
    3.2 文本特征表示及分类
        3.2.1 概述
        3.2.2 训练集构建
        3.2.3 分类具体实现
            3.2.3.1 算法描述
    3.3 搜索引擎优化意见
        3.3.1 概述
        3.3.2 具体实现
第四章 系统结构设计
    4.1 系统概述
    4.2 系统架构
        4.2.1 主要功能表结构
    4.3 系统功能模块具体实现
        4.3.1 Web数据采集
            4.3.1.1 概述
            4.3.1.2 爬虫算法设计
        4.3.2 文本预处理模块
            4.3.2.1 概述
            4.3.2.2 算法描述
        4.3.3 特征提取模块
        4.3.4 文本分类模块
第五章 实验与结果分析
    5.1 测试语料
        5.1.1 第三方公司关键词对比
        5.1.2 数据对比实例
    5.2 系统截图
第六章 总结与展望
    6.1 本文的主要工作及特点
    6.2 研究展望
参考文献
致谢



本文编号:2973415

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2973415.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b45f9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com