微博话题人物关系知识图谱构建研究
发布时间:2022-02-05 04:38
微博数据中含有大量的人物关系(例如,朋友关系,夫妻关系),然而微博数据量大、冗余数据多的特点使得人们难以了解这些复杂的人物关系。为了解决这个问题,本文提出了一种微博话题人物关系知识图谱的构建方法,帮助人们了解微博环境下的人物关系。首先从微博话题提取相关的人名,然后利用微博平台中关于这些人名的冗余信息,抽取人物关系三元组,最后构建该微博话题下的人物关系知识图谱。本文的主要研究内容如以下几个方面:(1)关系特征词的提取。为了尽可能全面的提取关系特征词,本文从三个方面对关系特征词进行提取:基于依存句法的关系特征词提取,基于相对位置信息的关系特征词提取,以及基于主题的关系特征词提取,最后对这些关系特征词整合去重,构建关系特征词组。(2)关系特征词组的优化和知识图谱的构建。为了提高人物关系抽取的效果,本文对关系特征词组进行了优化,首先建立滑动窗口,通过频繁项集挖掘算法对关系特征词组进行扩展,然后不断移动滑动窗口,比较前后两个滑动窗口下关系特征词组的总特征权重,完成关系特征词组的优化。本文研究了微博话题人物关系知识图谱的构建方法,先从微博话题中获取待抽取人物关系的人名对,再通过微博平台获取该人名对...
【文章来源】:安徽理工大学安徽省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2知识图谱构建过程??Figure?2?The?process?of?Knowledge?Graph?Constructing??
习方法相结合的方式。本文主要使用的是Hanlp中文分词系统,该系统的核心字??典来自于人民日报2014年语料库,采用条件随机场和隐马尔科夫模型,分词效果??如图3所示。??^函”?_?_?祖,呈-_?_,圈?.???k国&充特朗普会见国务院副总理刘鹤??图3?Hanlp分词系统实例??Figure?3?The?example?of?Hanlp?word?segmentation?system??3.2.3人名识别??人名识别属于命名实体识别的一部分,命名实体识别的目的是识别文本中的人??名、地名、机构名、时间名等含有一定意义的专有名词。命名实体识别作为信息??抽取中的一个基础工作,其识别效果对于后续的关系特征词的提取有很大影响。??现有的命名实体识别[51]有以下两种方法:??(1)
点和节点之间用一个有向弧连接,有向弧的弧头和弧尾表示关系。??特朗普会见印度总理莫迪”,对应的依存句法树如图4所示见”是根节点作为核心词,SBV表示“特朗普”和“会见”是主迪”和“会见”是动宾关系,ATT表示“总理”和“印度”是定中
【参考文献】:
期刊论文
[1]AceMap学术地图与AceKG学术知识图谱——学术数据可视化[J]. 张晔,贾雨葶,傅洛伊,王新兵. 上海交通大学学报. 2018(10)
[2]一种改进的实体关系抽取算法——OptMultiR[J]. 延浩然,靳小龙,贾岩涛,程学旗. 中文信息学报. 2018(09)
[3]基于远程监督的多因子人物关系抽取模型[J]. 黄杨琛,贾焰,甘亮,徐菁,黄九鸣,赫中翮. 通信学报. 2018(07)
[4]语义社交网络中用户信息提取与影响力分析[J]. 邱望,潘善亮. 小型微型计算机系统. 2018(07)
[5]海量法律文书中基于CNN的实体关系抽取技术[J]. 高丹,彭敦陆,刘丛. 小型微型计算机系统. 2018(05)
[6]命名实体识别研究综述[J]. 刘浏,王东波. 情报学报. 2018(03)
[7]融合最近距离和人名窗口信息的人物关系抽取[J]. 刘赟,张小明,李舟军. 山西大学学报(自然科学版). 2018(01)
[8]基于深度学习的中文实体关系抽取方法[J]. 孙紫阳,顾君忠,杨静. 计算机工程. 2018(09)
[9]基于弱监督和半自动方法的中文关系抽取数据集构建[J]. 马超义,徐蔚然. 中文信息学报. 2017(05)
[10]基于半监督CRF的跨领域中文分词[J]. 邓丽萍,罗智勇. 中文信息学报. 2017(04)
博士论文
[1]基于社交网络的知识图谱构建技术研究[D]. 马江涛.战略支援部队信息工程大学 2018
硕士论文
[1]旅游领域知识图谱构建方法的研究和实现[D]. 徐溥.北京理工大学 2016
[2]中文企业知识图谱构建与分析[D]. 程文亮.华东师范大学 2016
[3]基于词向量模型特征空间优化的同义词扩展研究与应用[D]. 张为泰.北京邮电大学 2015
[4]开放领域的中文实体无监督关系抽取[D]. 孙勇亮.华东师范大学 2014
本文编号:3614574
【文章来源】:安徽理工大学安徽省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2知识图谱构建过程??Figure?2?The?process?of?Knowledge?Graph?Constructing??
习方法相结合的方式。本文主要使用的是Hanlp中文分词系统,该系统的核心字??典来自于人民日报2014年语料库,采用条件随机场和隐马尔科夫模型,分词效果??如图3所示。??^函”?_?_?祖,呈-_?_,圈?.???k国&充特朗普会见国务院副总理刘鹤??图3?Hanlp分词系统实例??Figure?3?The?example?of?Hanlp?word?segmentation?system??3.2.3人名识别??人名识别属于命名实体识别的一部分,命名实体识别的目的是识别文本中的人??名、地名、机构名、时间名等含有一定意义的专有名词。命名实体识别作为信息??抽取中的一个基础工作,其识别效果对于后续的关系特征词的提取有很大影响。??现有的命名实体识别[51]有以下两种方法:??(1)
点和节点之间用一个有向弧连接,有向弧的弧头和弧尾表示关系。??特朗普会见印度总理莫迪”,对应的依存句法树如图4所示见”是根节点作为核心词,SBV表示“特朗普”和“会见”是主迪”和“会见”是动宾关系,ATT表示“总理”和“印度”是定中
【参考文献】:
期刊论文
[1]AceMap学术地图与AceKG学术知识图谱——学术数据可视化[J]. 张晔,贾雨葶,傅洛伊,王新兵. 上海交通大学学报. 2018(10)
[2]一种改进的实体关系抽取算法——OptMultiR[J]. 延浩然,靳小龙,贾岩涛,程学旗. 中文信息学报. 2018(09)
[3]基于远程监督的多因子人物关系抽取模型[J]. 黄杨琛,贾焰,甘亮,徐菁,黄九鸣,赫中翮. 通信学报. 2018(07)
[4]语义社交网络中用户信息提取与影响力分析[J]. 邱望,潘善亮. 小型微型计算机系统. 2018(07)
[5]海量法律文书中基于CNN的实体关系抽取技术[J]. 高丹,彭敦陆,刘丛. 小型微型计算机系统. 2018(05)
[6]命名实体识别研究综述[J]. 刘浏,王东波. 情报学报. 2018(03)
[7]融合最近距离和人名窗口信息的人物关系抽取[J]. 刘赟,张小明,李舟军. 山西大学学报(自然科学版). 2018(01)
[8]基于深度学习的中文实体关系抽取方法[J]. 孙紫阳,顾君忠,杨静. 计算机工程. 2018(09)
[9]基于弱监督和半自动方法的中文关系抽取数据集构建[J]. 马超义,徐蔚然. 中文信息学报. 2017(05)
[10]基于半监督CRF的跨领域中文分词[J]. 邓丽萍,罗智勇. 中文信息学报. 2017(04)
博士论文
[1]基于社交网络的知识图谱构建技术研究[D]. 马江涛.战略支援部队信息工程大学 2018
硕士论文
[1]旅游领域知识图谱构建方法的研究和实现[D]. 徐溥.北京理工大学 2016
[2]中文企业知识图谱构建与分析[D]. 程文亮.华东师范大学 2016
[3]基于词向量模型特征空间优化的同义词扩展研究与应用[D]. 张为泰.北京邮电大学 2015
[4]开放领域的中文实体无监督关系抽取[D]. 孙勇亮.华东师范大学 2014
本文编号:3614574
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3614574.html