基于链接分析的网页文本核心地名提取方法
发布时间:2017-10-15 14:33
本文关键词:基于链接分析的网页文本核心地名提取方法
更多相关文章: 地名 地名共现 链接分析 复杂网络 地理信息检索
【摘要】:本文围绕互联网中网页文本蕴含的丰富地理空间信息,抽取网页文本中蕴含的地名实体,提出了一种地名共现网络模型,该模型综合考虑网页中地名的频次信息,表达网页文本中地名的共现及联系传递特征。在此基础上,提出一种基于链接分析的网页文本核心地名的提取方法,通过PageRank算法计算每个地名在共现网络中的链接权重,对网页文本构建的共现地名网络进行核心地名的提取,从而在庞大的网络资源中发现具有显著的焦点特征或导航枢纽特征的重要地名。最后,采用人民日报与新浪新闻体育版2份语料进行实验验证,证明了该方法的有效性。
【作者单位】: 北京大学遥感与地理信息系统研究所;
【关键词】: 地名 地名共现 链接分析 复杂网络 地理信息检索
【基金】:国家自然科学基金项目(41271385)
【分类号】:P209;P208
【正文快照】: 1引言现出随空间距离增大而呈现出幂律衰减的特点。地名共同出现同一网页文本中,它们针对这一文本随着互联网在人们日常生活中的普及与应用,内容或主题存在相互关联性,当相同的地名成对地人类逐渐步入了大数据信息时代。作为现代社会出现在大量的共同话题网页文本集合中,可以,
本文编号:1037654
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/1037654.html