当前位置:主页 > 法律论文 > 经济法论文 >

数据驱动的互联网违法广告主题挖掘与关联识别研究

发布时间:2023-04-25 03:39
  近年来,随着互联网的快速发展和普及,我国加快了信息化发展的进程,步入了大数据时代。以互联网为依托所进行的各种经济活动形成的互联网经济成为市场经济不可或缺的组成部分,而其中市场规模高速发展的互联网广告也逐渐成为互联网经济的支柱性产业。如今,互联网充斥着形式各样的广告信息,其中包含大量会侵害用户权益、影响用户体验的违法广告。我国互联网广告行政监管部门正致力于构建完善的监管体系,以保障互联网广告行业健康发展。然而,由于多方面因素的影响,目前的监管体系发展仍无法匹配高速增长的市场规模,其中违法广告智能监管技术的滞后、智能化检测和分析水平不高是关键的技术原因。同时,缺少违法广告数据集也导致相关研究无法深入开展。因此,本文采集大量互联网广告,并由法律专业人士参与,结合机器学习算法,构建高质量违法广告数据集。并基于数据集,研究用于挖掘违法广告热点内容和主题分布的主题模型,以及用于准确识别违法广告所违反法条的关联识别模型,为实现监管体系从采集-识别-追责的全流程智能化提供技术支持。具体贡献如下:首先,针对目前相关研究领域缺少可用数据集的问题,通过多种方式采集互联网广告数据,并有法律专业人士参与数据集构...

【文章页数】:102 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 互联网广告发展简介
        1.1.2 互联网广告中存在的问题
    1.2 相关技术及研究现状
        1.2.1 文本分布式的表示方式
        1.2.2 短文本分类模型
        1.2.3 短文本主题挖掘的主题模型
    1.3 本文工作和章节安排
    1.4 本章小结
第二章 数据集构建及预处理分析
    2.1 广告文本数据采集与清洗
    2.2 数据预处理与数据集构建
        2.2.1 新词挖掘和文本分词
        2.2.2 广告词汇语义消歧
        2.2.3 广告文本分类与识别
        2.2.4 违法广告数据集标注与描述
    2.3 广告数据集统计分析
    2.4 本章小结
第三章 违法广告主题挖掘模型构建与分析
    3.1 研究背景与问题描述
    3.2 基于Lattice-LSTM的广告领域命名实体识别
        3.2.1 命名实体识别模型
        3.2.2 命名实体识别效果评估
    3.3 违法广告主题挖掘Lead LDA模型构建
        3.3.1 Lead LDA模型概述
        3.3.2 违法广告关键词提取
        3.3.3 Lead LDA主题模型构建
    3.4 Lead LDA模型实验评估与违法广告主题挖掘
        3.4.1 实验评估准则
        3.4.2 Lead LDA模型评估
        3.4.3 基于Lead LDA的违法广告主题挖掘
    3.5 本章小结
第四章 违法广告与违反法条的关联识别
    4.1 研究背景与问题描述
    4.2 基于Lead LDA模型的多特征融合广告法条关联识别
        4.2.1 多特征融合关联识别模型概述
        4.2.2 基于Lead LDA的多特征融合关联识别模型构建
        4.2.3 多特征融合过程
    4.3 基于IAD-Net模型的广告法条关联识别
        4.3.1 IAD-Net模型概述
        4.3.2 注意力机制简介
        4.3.3 IAD-Net模型构建
    4.4 广告法条关联识别模型实验评估
        4.4.1 基准模型对比实验分析
        4.4.2 IAD-Net模型结构分析
        4.4.3 IAD-Net实例分析
    4.5 本章小结
第五章 总结与展望
    5.1 本文工作总结
    5.2 本文研究展望
参考文献
发表文章目录



本文编号:3800627

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/jingjifalunwen/3800627.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0f444***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com