基于文本挖掘技术的网络热点新闻系统的研建
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
图3.1?BERT算法模型结构??Figure?3.1?BERT?algorithm?model?structure??
设计??3.1.1?BERT算法概述??BERT模型是由谷歌发布的一种用来对语言表征进行预训练的模型,它是基于双??向Transformer结构来实现对大规模有监督语料进行预训练,然后获得理解语义的一??种数学模型,可以应用在NLP自然语言处理中,比如聊天机器人、智能问答、自动?....
图3.3关键词标注数据??Figure?3.3?Keyword?annotation?data??(2)数据集的处理??首先从本文采用的实验数据源中获取5000篇新闻数据,采样方式以体育,财经,??
?3新闻信息提取算法设计与优化???合本文的算法设计的验证方法,中国科学文献数据集涉及的领域比较广泛,含有各个??领域的文本,对于本文抽取新闻本文的文本类型和意图也相吻合,因此确定用此数据??集合作为本文的卖验数振集合。如图3.2和3.3分别为数据集合的摘要标注数据和关??键词标....
图3.5摘要抽取结果??Figure?3.5?Abstract?extraction?results??
?錄于文本挖掘技术的.网络热点_新_闻系统的研建???计算抽取出来的文章摘要结果。??图3.4关键词权重计算结果??Figure?3.4?Keyword?weight?calculation?results??图3.5摘要抽取结果??Figure?3.5?Abstract?ext....
图3.4关键词权重计算结果??Figure?3.4?Keyword?weight?calculation?results??
?錄于文本挖掘技术的.网络热点_新_闻系统的研建???计算抽取出来的文章摘要结果。??图3.4关键词权重计算结果??Figure?3.4?Keyword?weight?calculation?results??图3.5摘要抽取结果??Figure?3.5?Abstract?ext....
本文编号:3896530
本文链接:https://www.wllwen.com/tushudanganlunwen/3896530.html