基于条件随机场的中医术语抽取方法及其应用探析
本文关键词:基于条件随机场的中医术语抽取方法及其应用探析 出处:《中华中医药学刊》2014年10期 论文类型:期刊论文
【摘要】:中医文献有种类繁多,数量庞大,记录随意,术语表达方式独特等的特点,为知识的获取带来困难。信息抽取技术可以利用计算机对文本信息进行针对性抽取,以结构化的形式将结果储存到数据库中,这种技术可以帮助医学研究者从海量信息中高效获取所需知识。命名实体识别是信息抽取准确与否的关键,对目前常用的几种识别方法进行分析,认为基于统计的方法更适用于中医文献的研究,并选定条件随机场算法,结合中医术语的特点,对该方法及步骤进行了详细阐述。同时,举例介绍了信息抽取技术在中医结构化电子病历及中医专业领域搜索引擎建立中的辅助作用,为其在中医领域的应用提供更广阔的参考思路。
[Abstract]:There are many kinds of documents in TCM, such as large quantity, random records and unique expressions of terms, which make it difficult to obtain knowledge. Information extraction technology can be used to extract text information by computer. The results are stored in the database in a structured form. This technique can help medical researchers to obtain the required knowledge efficiently from massive information. Named entity recognition is the key to the accuracy of information extraction. Through the analysis of several commonly used recognition methods, it is considered that the statistical method is more suitable for the study of TCM literature, and the conditional random field algorithm is selected, combined with the characteristics of TCM terminology. At the same time, it introduces the auxiliary function of information extraction technology in the structured electronic medical records of TCM and the establishment of search engine in the field of TCM. For its application in the field of traditional Chinese medicine to provide a broader reference ideas.
【作者单位】: 北京中医药大学;
【基金】:国家自然科学基金项目(81273876,81072897) 中国中医科学院第五批自主选题项目(Z0193) 教育部博士点基金项目(2011110001) 北京中医药大学创新团队项目(0100603003)
【分类号】:R22
【正文快照】: 中华中医药学刊中国医药学是一个伟大的宝库,蕴藏我国人民几千年来与疾病作斗争的丰富的临床经验,这些经验多以文献的形式加以传播。研究中医文献资料,进一步挖掘及整理中医的文本信息,可为当代人类的医疗保健工作服务,并为中医的现代化研究提供素材。然而,中医书籍汗牛充栋,
【参考文献】
相关期刊论文 前4条
1 翟荔婷;;浅谈中文文本分词方法[J];经营管理者;2012年18期
2 郑敏洁;雷志城;廖祥文;陈国龙;;中文句子评价对象抽取的特征分析研究[J];福州大学学报(自然科学版);2012年05期
3 孟尹;金卫;;中医电子病历技术的特色及发展[J];西部中医药;2013年05期
4 来建梅;曹慧;马金刚;;中医药领域信息抽取技术的研究与应用[J];山东科学;2011年06期
【共引文献】
相关期刊论文 前3条
1 胡人月;姚逸;;中医药信息学的应用研究概述[J];大众科技;2012年08期
2 周红照;侯明午;颜彭莉;张叶青;侯敏;滕永林;;语义特征在评价对象抽取与极性判定中的作用[J];北京大学学报(自然科学版);2014年01期
3 胡秧;;一种基于条件随机场的专利功效标注方法[J];计算机光盘软件与应用;2014年16期
相关博士学位论文 前1条
1 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
相关硕士学位论文 前2条
1 陈丽莎;自动问答系统中基于WordNet的句子相似度计算研究与实现[D];华南理工大学;2014年
2 王强;基于结构化预测模型的企业信息联合抽取方法研究[D];南京师范大学;2014年
【二级参考文献】
相关期刊论文 前3条
1 刘阳;曾凡;黄昊;王禾;;电子病历的临床决策支持[J];重庆医学;2009年21期
2 李毅;保鹏飞;薛万国;;中文电子病历的信息抽取研究[J];生物医学工程学杂志;2010年04期
3 邢红兵;信息领域汉英术语的特征及其在语料中的分布规律[J];术语标准化与信息技术;2000年03期
相关博士学位论文 前2条
1 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
2 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
【相似文献】
相关期刊论文 前10条
1 周小甲;李昊e,
本文编号:1408836
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1408836.html