基于主题模型的专利文本分析及应用研究
【图文】:
nii" or Cylindrotheca or Diatoms or Dunaliella or Ellipsoidion or "Euglenilis" or Eustigmatophytes or "Haematococcus pluvaris" or Isochrysis onallanthus salina" or "Monodus subterraneus" or Nannochloris onochloropsis or "Neochloris oleabundans" or Nitzschia or "Oocystis pusilla" olova or "Phaeodactylum tricornutum" or Prymnesiophytes or Scenedemus oizochytrium or Skeletonema or Spirulina or Tetraselmis or "Thalassiordonana")) AND (bio-energy or fuel* or biofuel* or bio-fuel* or biomethan* omethan* or biodiesel* or biodiesel* or biohydrogen or bio-hydrogen othanol* or bio-ethanol* or biooil* or bio-oil* or bio-gas or bio-gas or biorefinerio-refiner* or bioreactor* or bio-reactor*))检索结果包含 3532 件专利(检索日期:2017 年 03 月 06 日),,下载 3532 件的全字段信息,保存为 Excel 文件,作为专利数据集。如图 4-1 所示,在 DWPWCI 下载的专利数据包含了专利公开号、专利申请时间、标准专利权人、专用信息、DWPI 标题、DWPI 摘要、权利要求等诸多字段,编写 Python 脚本,抽取专利的 DWPI 摘要字段,拆分为 3532 个 TXT 文件,作为文本挖掘的库。
题建模的准确性和合理性。设置文档-词矩阵的稀疏度阈值为 98%,即少 2%的微藻生物燃料专利中出现过的词才会保留,去除稀疏度过大的上述预处理过程中,“停用词移除”是专利文本预处理的重要环节。作定种类的文本数据,专利包含大量的技术术语,常使用 些特定词作为,并且还包含 定数量的学术词汇,其中的 些词并不能反映技术主题新。常规英文停用词表中并未包含这些词汇,若基于常规停用词进行停,文档-词矩阵中将包含较多“干扰”词汇,影响之后分析结果的准确性针对微藻生物燃料专利特点,构建自定义停用词表,如表 4-1 所示。除“which”、“that”这样的常规英文停用词,还去除了诸如 “methodprise”的专利常用词汇,同时考虑了 DWPI 的行文风格和描述特点,比用“involve”这 词汇。将微藻生物燃料专利停用词表与英文常规停用合,用于专利语料库的预处理过程,去除那些不能体现技术内容特征的,减少“噪音”,力求更加精确的分析结果。 最终,将微藻生燃料领域库转换成了 个 3532 行 977 列的文档-词矩阵(document-term matri,作为之后 LDA 主题模型的输入,图 4-2 是该矩阵的 部分。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G306
【相似文献】
相关期刊论文 前10条
1 周倩;欧盟积极推动生物燃料[J];国际化工信息;2003年05期
2 谢龙莲;;马来西亚将于2007年使用生物燃料取代柴油[J];世界热带农业信息;2005年11期
3 ;高油价推动各国大力发展生物燃料[J];湖北林业科技;2005年06期
4 ;德国加大生物燃料开发[J];现代电力;2005年01期
5 ;各国大力发展生物燃料[J];中国建设动态.阳光能源;2005年06期
6 朱行;;欧盟通过新的生物燃料发展计划[J];粮食与油脂;2006年03期
7 ;欧盟公布2030年生物燃料实施计划[J];柴油机设计与制造;2006年02期
8 赵建;李春梅;;欧盟发展生物燃料的有关政策及其启示[J];中外能源;2006年04期
9 钱伯章;;全球生物燃料发展方兴未艾[J];中国石化;2006年08期
10 杨万丽;;联合国报告称:生物燃料危害可能更大[J];农村.农业.农民(B版);2007年06期
相关会议论文 前10条
1 ;生物燃料也许没有想象中那么清洁[A];沼气技术和产业化发展研讨会论文选编[C];2009年
2 黄军英;;发展生物燃料须调整相关政策[A];2008中国生物质能源技术路线标准体系建设论坛论文集[C];2008年
3 石元春;;粮食!石油!生物燃料?——解决中国石油与“三农”两大心腹之患的战略思考[A];2008中国生物质能源技术路线标准体系建设论坛论文集[C];2008年
4 李十中;;粮价、油价飙升,生物燃料之过?[A];2008中国生物质能源技术路线标准体系建设论坛论文集[C];2008年
5 肖明松;;我国生物燃料发展与挑战[A];多学科在现代农业建设中交叉运用技术研讨会论文汇编[C];2011年
6 张利华;杨颖;高思扬;徐晓新;;破解能源与环境难题:液体生物燃料的前景与政策作用空间[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
7 张淑华;桃春生;何丹;王丹;张苡铭;;生物燃料在吉林省的发展前景展望[A];增强自主创新能力 促进吉林经济发展——启明杯·吉林省第四届科学技术学术年会论文集(上册)[C];2006年
8 张武高;;车用生物燃料的现状及技术展望[A];2008中国生物质能源技术路线标准体系建设论坛论文集[C];2008年
9 李庆凯;赵良军;;推广使用秸秆生物燃料的可行性分析[A];2011中国环境科学学会学术年会论文集(第四卷)[C];2011年
10 张晶;;生物燃料是石油替代绕不过去的坎———石元春谈生物燃料[A];2008中国生物质能源技术路线标准体系建设论坛论文集[C];2008年
相关重要报纸文章 前10条
1 李菲 王汝堂;生物燃料产业发展可分三步走[N];中国电力报;2006年
2 记者 唐茵;欧盟生物燃料计划遭质疑[N];中国化工报;2007年
3 张德斌;生物燃料产业奏响“发展三部曲”[N];中国矿业报;2006年
4 陈达;环保诉求“捧红”生物燃料[N];中国矿业报;2006年
5 张德斌;发改委称我国生物燃料产业发展可分三步走[N];中国石化报;2006年
6 中国石油和化学工业规划院副院长 白颐;美生物燃料将走非粮路线[N];中国石化报;2007年
7 宏子木;生物燃料仅是部分解决方案[N];中国石化报;2007年
8 尚军;欧盟支持有条件发展生物燃料[N];中国石化报;2007年
9 杨万丽;生物燃料危害大 会破坏生物多样性[N];中国畜牧兽医报;2007年
10 尚军邋刘秀荣;生物燃料“燃”起利益纷争[N];中国国门时报;2007年
相关博士学位论文 前10条
1 薛狄;国际法对生物燃料问题的多维规制[D];吉林大学;2010年
2 兰肇华;生物燃料发展及其影响研究[D];武汉理工大学;2009年
3 勇气;中国农作物生物燃料政策对食品经济及能源安全影响研究[D];西北农林科技大学;2011年
4 付青叶;生物燃料发展对中国粮食安全的影响研究[D];西北农林科技大学;2011年
5 赵莎;微藻悬浮液中CO_2气泡的动力学行为及固碳特性研究[D];重庆大学;2015年
6 乔坤;极端耐NaHCO_3微藻的鉴定及ACBP抗逆机制研究[D];东北林业大学;2015年
7 孙中亮;低浓度二氧化碳培养微藻的吸收强化和烟道气组分调变[D];中国科学院研究生院(过程工程研究所);2015年
8 张丽;微藻对水热液化废水养分的循环利用及代谢途径研究[D];中国农业大学;2016年
9 熊威;微藻仿生硅矿化及其应用[D];浙江大学;2016年
10 任宏宇;微藻油脂合成策略及暗发酵细菌—微藻耦合产能研究[D];哈尔滨工业大学;2016年
相关硕士学位论文 前10条
1 孙宁宁;基于主题模型的专利文本分析及应用研究[D];北京工业大学;2017年
2 刘险峰;生物燃料产业发展对粮食安全的影响研究[D];湖南农业大学;2014年
3 王彦;FCC掺炼法及脱氧加氢法制备第二代生物燃料的研究[D];海南大学;2015年
4 郑艺;蓝藻生物燃料中典型萜类物质的代谢工程研究[D];福建农林大学;2017年
5 李伟;两种典型同分异构体结构碳氢和生物燃料的燃烧反应动力学研究[D];中国科学技术大学;2017年
6 王子忠;美国发展生物燃料的经济后果及政策含义[D];中国社会科学院研究生院;2010年
7 李薇;粮食安全约束下的中美生物燃料发展比较[D];辽宁大学;2012年
8 胡凯;生物燃料产业可持续发展问题研究[D];湖南农业大学;2013年
9 张剑;我国生物燃料企业发展现状与发展模式研究[D];武汉理工大学;2009年
10 王永明;生物燃料技术应用监管中的法律问题研究[D];南京工业大学;2012年
本文编号:2659391
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2659391.html