基于半监督学习的WMS元数据文本多标签分类方法
发布时间:2021-12-01 23:45
随着地理信息网络共享和志愿者地理信息技术(VGI)的发展,主题内容多样的开放式网络地图服务(Web Map Service,WMS)资源大量涌现,为地学研究与应用提供了丰富的数据资源。但现有元数据标准缺乏显式、细粒度和面向领域的内容描述机制,导致领域专家和服务用户无法快速定位目标专题内的资源数据。目标领域的服务检索需求对服务数据的主题多标签分类提出了迫切的要求。但WMS元数据文本内容纷繁复杂、长短各异、语言不一,地学术语和通识词汇混杂,且缺乏标注应用领域的元数据集,导致WMS元数据文本的精准多标签分类面临着巨大的挑战。本文提出了一种基于半监督学习的WMS元数据文本多标签分类方法,在仅依赖少量标记样本数据的前提下,实现了WMS元数据双层多标签主题匹配。该方法包含特征选择、多标签分类和二次主题提取三部分:1)特征选择:选取社会受益领域(Societal Benefit Areas,SBAs)作为粗粒度领域主题,引入语料库抽取与SBAs语义密切相关的典型词,基于Word2vec算法计算典型词与文本特征的空间距离,实现最优领域特征子集的选择。2)多标签分类:提出多标签分类基模型ML-CSW,该...
【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
LDA模型图
wMs文本检索示例(检索主题为“Agricultur
图层图像检索示例(检索主题为“Cli
【参考文献】:
期刊论文
[1]基于归一化文档频率的文本分类特征选择方法[J]. 赵鸿山,范贵生,虞慧群. 华东理工大学学报(自然科学版). 2019(05)
[2]基于LDA和word2vec的英文作文跑题检测[J]. 曲强,崔荣一,赵亚慧. 计算机应用研究. 2019(02)
[3]GWR与STARMA结合的WMS响应时间时空预测模型[J]. 刘宵婧,桂志鹏,曹军,李锐,吴华意. 武汉大学学报(信息科学版). 2018(06)
[4]应用描述词汇约简的OGC地理信息服务演绎推理[J]. 苗立志,胥婕,周亚,程文超. 测绘学报. 2015(09)
[5]语境感知的地理信息检索[J]. 徐敏政,许珺. 地理与地理信息科学. 2014(01)
[6]基于分歧的半监督学习[J]. 周志华. 自动化学报. 2013(11)
[7]地理信息服务朴素贝叶斯分类及类别匹配研究[J]. 葛文,成毅,孙亚飞. 测绘工程. 2013(02)
[8]使用自适应线性回归的多标签分类算法[J]. 汤进,黄莉莉,赵海峰,罗斌. 华南理工大学学报(自然科学版). 2012(09)
[9]一种基于方差的文本特征选择算法[J]. 袁轶,王新房. 计算机工程. 2012(12)
[10]基于知识标注的地理信息语义服务框架研究[J]. 梁汝鹏,李宏伟,李文娟,梁颖. 地理与地理信息科学. 2012(03)
硕士论文
[1]基于半监督学习的文本分类关键技术研究[D]. 孙旭明.哈尔滨工业大学 2018
[2]基于半监督学习的多标签文本分类技术研究[D]. 徐石阳.南昌大学 2018
[3]基于WordNet的蒙古文领域知识图谱构建方法研究[D]. 边慧珍.内蒙古师范大学 2018
[4]基于协同训练的半监督短文本分类方法研究[D]. 韩战豪.西南大学 2017
[5]自动问答系统中基于WordNet的句子相似度计算研究与实现[D]. 陈丽莎.华南理工大学 2014
[6]基于布尔模型和扩展布尔模型的中文信息检索系统[D]. 马强.辽宁科技大学 2012
[7]特征选择新算法研究[D]. 冯宗翰.江南大学 2011
本文编号:3527286
【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
LDA模型图
wMs文本检索示例(检索主题为“Agricultur
图层图像检索示例(检索主题为“Cli
【参考文献】:
期刊论文
[1]基于归一化文档频率的文本分类特征选择方法[J]. 赵鸿山,范贵生,虞慧群. 华东理工大学学报(自然科学版). 2019(05)
[2]基于LDA和word2vec的英文作文跑题检测[J]. 曲强,崔荣一,赵亚慧. 计算机应用研究. 2019(02)
[3]GWR与STARMA结合的WMS响应时间时空预测模型[J]. 刘宵婧,桂志鹏,曹军,李锐,吴华意. 武汉大学学报(信息科学版). 2018(06)
[4]应用描述词汇约简的OGC地理信息服务演绎推理[J]. 苗立志,胥婕,周亚,程文超. 测绘学报. 2015(09)
[5]语境感知的地理信息检索[J]. 徐敏政,许珺. 地理与地理信息科学. 2014(01)
[6]基于分歧的半监督学习[J]. 周志华. 自动化学报. 2013(11)
[7]地理信息服务朴素贝叶斯分类及类别匹配研究[J]. 葛文,成毅,孙亚飞. 测绘工程. 2013(02)
[8]使用自适应线性回归的多标签分类算法[J]. 汤进,黄莉莉,赵海峰,罗斌. 华南理工大学学报(自然科学版). 2012(09)
[9]一种基于方差的文本特征选择算法[J]. 袁轶,王新房. 计算机工程. 2012(12)
[10]基于知识标注的地理信息语义服务框架研究[J]. 梁汝鹏,李宏伟,李文娟,梁颖. 地理与地理信息科学. 2012(03)
硕士论文
[1]基于半监督学习的文本分类关键技术研究[D]. 孙旭明.哈尔滨工业大学 2018
[2]基于半监督学习的多标签文本分类技术研究[D]. 徐石阳.南昌大学 2018
[3]基于WordNet的蒙古文领域知识图谱构建方法研究[D]. 边慧珍.内蒙古师范大学 2018
[4]基于协同训练的半监督短文本分类方法研究[D]. 韩战豪.西南大学 2017
[5]自动问答系统中基于WordNet的句子相似度计算研究与实现[D]. 陈丽莎.华南理工大学 2014
[6]基于布尔模型和扩展布尔模型的中文信息检索系统[D]. 马强.辽宁科技大学 2012
[7]特征选择新算法研究[D]. 冯宗翰.江南大学 2011
本文编号:3527286
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3527286.html