基于NLP的RFC规则提取关键技术研究
【图文】:
使用了正则表达式去寻找相关页眉页脚所在的行,并将其删除。在删除页眉页脚后,所得到的信息即为分句的主要对象。图3.3 提取规则算法在分句过程中,由于包含很多无用的非字母符号(主要是空格和回车)。因此,本文想到的策略是先分词,将所有的行里面的单词都聚合成一个单词集。因为这些单词是有序的。因此,算法只要找到每一句的结尾单词即可将这些单词分句。基于这样的思想,算法将 line 数据中的多余非字母字符删除并且只保留一个单词集。当然算法还在初始化过程中定义了 ASN.1 结构体的形式、关键字字典以及自然语言表达的形式。在初始化结束以后,算法开始对语句进行提取信息。提取的过程在算法第 10-22 行。最外层的循环就是刚刚所讲到的遍历单词。在遍历单词的时候,如果发现这个单词符合章节定义(算法 12-14 行),那么我们就将当前章节换成这个单词。如果发现这个单词为自然语言结尾
由于在 SSL\TLS 的实现中所有的消费者规则验证都是必须实现的,因此规则验证也主要集中于消费者规则。图3.4 适用范围分类算法区分消费者规则和生产者规则的方法就在于规则语句中的描述。在进行认真的观察后,本文提出了和 RFCcert 相似的基于搜索的规则划分方法。例如,主语为 CA 的大多是生产者规则。而宾语为 CA 的大多是消费者规则。因此,本文设计了基于 NLP词性标记的语句实体识别算法。根据 NLP 的词性标记功能,可以确定一个句子的主语和宾语。根据主语宾语的主体含义来判断当前语句的规则类型。规则分类算法如图 3.4 所示。与 RFCcert 不同的是,,本文首创性的提出了自然语言处理的方法。算法的 1-5 行是算法的初始化阶段。提取了规则集,确定了生产者的名次定义,消费者的名词定义以及初始化了生产者规则集和消费者规则集。初始化结束后
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN918;TP391.1
【相似文献】
相关期刊论文 前10条
1 徐伦;;德育渗透 规则先行[J];中国学校体育;2017年04期
2 王燕;李明;;基于扩展概念格的分类规则获取算法[J];计算机应用;2007年10期
3 黄治国;张天伍;;基于极大团的不完备系统规则获取方法[J];重庆邮电大学学报(自然科学版);2017年02期
4 任睿思;魏玲;祁建军;;三支类背景上的规则获取[J];计算机科学;2018年10期
5 辛素飞;辛自强;林崇德;;潜规则认同及其与信任的关系[J];中国社会心理学评论;2017年02期
6 王丽娟;杨习贝;杨静宇;吴陈;;基于多粒度理论的不完备决策规则获取[J];南京理工大学学报;2013年01期
7 陈静雯;马福民;张腾飞;曾永钢;;基于最大粒的悲观邻域多粒度粗糙集规则获取算法[J];模式识别与人工智能;2017年11期
8 范新明;;基于交互式隶属函数调整的模糊神经网络[J];内江师范学院学报;2009年08期
9 程玉胜;张佑生;胡学钢;章晓良;;基于任意分割的串行进位链规则获取的计算流程[J];电子学报;2009年12期
10 代建华,潘云鹤;一种基于分类一致性的决策规则获取算法[J];控制与决策;2004年10期
相关会议论文 前7条
1 汪凌;;基于相容矩阵计算的不完备决策系统规则获取算法[A];第六届ABB杯全国自动化系统工程师论文大赛论文集[C];2013年
2 王欣;阳春华;秦斌;;基于支持向量机的模糊规则获取及其在铁水硅含量预报中的应用[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
3 吕韶义;刘复岩;;基于决策树的规则获取[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
4 ;基于模式冲突的多数据库系统全局规则获取(英文)[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 王启志;王晓霞;;基于粗糙集理论的磨削烧伤故障识别[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
6 王启志;王晓霞;;基于粗糙集理论的磨削烧伤故障识别[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
7 王红军;徐小力;韩秋实;;旋转注水机组故障知识获取的粗糙集模型研究[A];第八届全国设备与维修工程学术会议、第十三届全国设备监测与诊断学术会议论文集[C];2008年
相关重要报纸文章 前9条
1 记者 罗沙;最高法出台办法严查法警当掮客[N];新华每日电讯;2014年
2 记者 王文硕;严肃查处干警充当诉讼掮客[N];人民公安报;2014年
3 顾远山;以严明法治遏制“诉讼掮客”[N];中国纪检监察报;2014年
4 王慧娟;严防法院干警沦为“诉讼掮客”[N];河南法制报;2014年
5 特约评论员 鲁兵海;法制发力打击“诉讼掮客”[N];民主与法制时报;2014年
6 本报记者 刘平;市场规则如何与WTO接轨[N];中国信息报;2001年
7 ;着力解决群众身边不正之风和腐败问题[N];辽源日报;2016年
8 正泽;对诉讼掮客露头就打[N];人民日报;2014年
9 本报记者 刘宇;别再让“关系”牵着鼻子走[N];山西日报;2014年
相关博士学位论文 前4条
1 程玉胜;基于粗糙集理论的知识不确定性度量与规则获取方法研究[D];合肥工业大学;2007年
2 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
3 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年
4 马丽;基于不确定性理论的概念格生成与知识获取的若干问题研究[D];河北师范大学;2016年
相关硕士学位论文 前10条
1 韩文政;基于NLP的RFC规则提取关键技术研究[D];西安电子科技大学;2019年
2 刘一;基于时间粒度的时序关联规则挖掘研究[D];兰州交通大学;2018年
3 桑妍丽;基于粗糙集的近似分布约简与决策规则获取[D];山西大学;2005年
4 张婕;大学生对潜规则态度及行为意向初探[D];曲阜师范大学;2017年
5 朱治春;基于类背景的双向规则获取[D];西北大学;2015年
6 莫京兰;复杂序信息系统的属性约简与规则获取研究[D];广西大学;2013年
7 李明霞;基于规则控制的区间参数优化方法及应用[D];华北理工大学;2017年
8 刘延卿;知识挖掘在时序信号分析系统中的应用[D];大连交通大学;2010年
9 吴绍兵;基于遗传算法的模糊规则获取研究[D];云南师范大学;2005年
10 陈春霖;多知识抽取系统的设计与实现[D];大连海事大学;2014年
本文编号:2594065
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2594065.html