深度学习与多元特征相结合的事件检测与摘要研究
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图2-1主题模型生成文档集示例
图2-1主题模型生成文档集示例2-1中C表示整个语料库上的所有词语在每篇文档中的概率分布有词语在每个不同主题下的概率分布矩阵,而Θ则表示所有主题档下的概率分布矩阵。整个图2-1通过矩阵相乘的形式示例了按)服从概率分布先生成主题,再根据主题生成词语集合,最终生成过程....
图2-2LDA和BTM模型生成文档图例
而文档d关于biterm项的条件概率由经验统计获得,见公式(2jNjjjdbbpbd1##(|)其中代表biterm项jb在文档d中出现的次数。通过上述计算可以获得每个文档关于所有主题的条件概率,由此该文档的主题分布。因为不同文档对应的biterm集....
图2-3两条数据构建的graph-of-wordsgraph-of-words一旦构建完毕,就可以通过k-degeneracy的方式获得簇内关键词,根据关键词的权重对每条数据打分进而辅助进行摘要环节的推文抽取任
图2-3两条数据构建的graph-of-wordsgraph-of-words一旦构建完毕,就可以通过k-degeneracy的方式获得簇内关键词,根据关键词的权重对每条数据打分进而辅助进行摘要环节的推文抽取任务。2.3.2.2k-degeneracy与core....
图2-4degeneracy示例
哈尔滨工业大学工程硕士学位论文的k-core即为按权重降序的top-K个关键词。4为例,假设K=5,则根据上述算法,依次删),NODE(final),NODE(gotz);剩余的点NODE(win)ni),NODE(argentina),NODE(score)等....
本文编号:4006389
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4006389.html