中文自然语言处理_python自然语言处理pdf 中文完整版
本文关键词:Python自然语言处理,由笔耕文化传播整理发布。
自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。Python语言在做NLP方面有较明显的优势。之前国外有《Natural Language Process with Python》,国内热心网友将其翻译为中文版。从这个角度讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。通过使用Python程序设计语言和自然语言工具包(NTLK)的开源库,本书将帮助你增加自然语言处理的实际经验。如果你对开发Web应用、分析多语言的新闻源或编制濒危语言感兴趣,,或者只是想要从程序员的视角看人类语言如何运作,你将发现本书不仅有趣而且极其有用。
Python自然语言处理目录第1章 语言处理与Python
1.1 语言计算:文本和词汇
1.2 近观Python:将文本当做词链表
1.3 计算语言:简单的统计
1.4 回到Python:决策与控制
1.5 自动理解自然语言
1.6 小结
1.7 深入阅读
1.8 练习
第2章 获得文本语料和词汇资源
2.1 获取文本语料库
2.2 条件频率分布
2.3 更多关于Python:代码重用
2.4 词典资源
2.5 WordNet
2.6 小结
2.7 深入阅读
2.8 练习
第3章 处理原始文本
3.1 从网络和硬盘访问文本
3.2 字符串:最底层的文本处理
3.3 使用Unicode进行文字处理
3.4 使用正则表达式检测词组搭配
3.5 正则表达式的有益应用
3.6 规范化文本
3.7 用正则表达式为文本分词
3.8 分割
3.9 格式化:从链表到字符串
3.10 小结
3.11 深入阅读
3.12 练习
第4章 编写结构化程序
4.1 回到基础
4.2 序列
4.3 风格的问题
4.4 函数:结构化编程的基础
4.5 更多关于函数
4.6 程序开发
4.7 算法设计
4.8 Python库的样例
4.9 小结
4.10 深入阅读
4.11 练习
第5章 分类和标注词汇
5.1 使用词性标注器
5.2 标注语料库
5.3 使用Python字典映射词及其属性
5.4 自动标注
5.5 N-gram标注
5.6 基于转换的标注
5.7 如何确定一个词的分类
5.8 小结
5.9 深入阅读
5.10 练习
第6章 学习分类文本
6.1 监督式分类
6.2 监督式分类的举例
6.3 评估
6.4 决策树
6.5 朴素贝叶斯分类器
6.6 最大熵分类器
6.7 为语言模式建模
6.8 小结
6.9 深入阅读
6.10 练习
第7章 从文本提取信息
7.1 信息提取
7.2 分块
7.3 开发和评估分块器
7.4 语言结构中的递归
7.5 命名实体识别
7.6 关系抽取
7.7 小结
7.8 深入阅读
7.9 练习
第8章 分析句子结构
8.1 一些语法困境
8.2 文法的用途
8.3 上下文无关文法
8.4 上下文无关文法分析
8.5 依存关系和依存文法
8.6 文法开发
8.7 小结
8.8 深入阅读
8.9 练习
第9章 建立基于特征的文法
9.1 文法特征
9.2 处理特征结构
9.3 扩展基于特征的文法
9.4 小结
9.5 深入阅读
9.6 练习
第10章 分析语句的含义
10.1 自然语言理解
10.2 命题逻辑
10.3 一阶逻辑
10.4 英语语句的语义
10.5 段落语义层
10.6 小结
10.7 深入阅读
10.8 练习
第11章 语言数据管理
11.1 语料库结构:案例研究
11.2 语料库生命周期
11.3 数据采集
11.4 使用XML
11.5 使用Toolbox数据
11.6 使用OLAC元数据描述语言资源
11.7 小结
11.8 深入阅读
11.9 练习
本文关键词:Python自然语言处理,由笔耕文化传播整理发布。
本文编号:137368
本文链接:https://www.wllwen.com/wenshubaike/mishujinen/137368.html