社保审计领域语料库构建研究
本文关键词:社保审计领域语料库构建研究 出处:《哈尔滨工程大学》2011年硕士论文 论文类型:学位论文
更多相关文章: 社保审计领域 信息动态管理 智能化审计 语料分类 细语料提取
【摘要】:社会保障体系的正常运行关系到广大人民的切身利益,如何能在信息爆炸时代的今天有效的利用领域信息,来指导社保审计体系的调整是领域内急待解决的问题。社保审计语料库用于社保审计领域语言处理,管理领域信息,进而支持领域审计方法的优化。 本文对社保审计领域信息进行分析,并根据领域信息的特征提出采用原始语料和处理后语料不断更新的半自动管理方式来构建领域语料库,通过语料信息的评价评定领域中语料源和领域细语料集。采用半自动网络搜索下载的方式从指定的领域语料源获取不断更新的领域粗语料。在领域细语料集的支持下采用迭代的方式应用双词典回溯遍历算法不断提取领域细语料,丰富领域细语料集,同时给出了领域细语料集的组织结构和更新管理方式。在细语料表示领域语料时以语料的时间、频度、流通度、语料源等级作为特征值,采用基于向量支持的方式对领域语料进行分类管理。 在获得大规模领域语料库的同时,本文应用语料信息与社保审计领域审计方法进行信息对比,根据领域细语料的更新和领域语料的分类情况动态的监测不断更新的领域语料,发掘语料所包含领域信息的变化,通过反馈领域信息的变化指导社保审计方法体系的调整,以最终实现领域语料库支持下的社保智能化审计。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:F239.6;TP391.1
【参考文献】
相关期刊论文 前10条
1 丁信善;语料库语言学的发展及研究现状[J];当代语言学;1998年01期
2 赵世奇;刘挺;李生;;基于自动构建语料库的词汇级复述研究[J];电子学报;2009年05期
3 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
4 崔世起;刘群;孟遥;于浩;西野文人;;基于大规模语料库的新词检测[J];计算机研究与发展;2006年05期
5 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
6 冯永;李华;钟将;叶春晓;;基于自适应中文分词和近似SVM的文本分类算法[J];计算机科学;2010年01期
7 张晶,赵铁军,姚建民,李生;基于语料库的英语从句识别研究[J];中文信息学报;2000年06期
8 金翔宇,孙正兴,张福炎;一种中文文档的非受限无词典抽词方法[J];中文信息学报;2001年06期
9 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期
10 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范(续)[J];中文信息学报;2002年06期
相关会议论文 前3条
1 张普;;关于大规模真实文本语料库的几点理论思考[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
2 尹斌庸;方世增;;词频统计的新概念和新方法[A];语言文字应用研究论文集(Ⅱ)[C];2004年
3 柏晓静;常宝宝;詹卫东;吴拥华;;构建大规模的汉英双语平行语料库[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
,本文编号:1333384
本文链接:https://www.wllwen.com/guanlilunwen/shenjigli/1333384.html