第一部份:自然语言分析利器——Python入门
第二部份:自然语言分析工具包——NLTK入门。编程实战:NLTK包的安装与常用方法介绍
第三部份:语料库的获取与词频分析。编程实战:词条频率分布图的绘制
第四部份:原始文本资料的读取与处理。编程实战:使用正则表达式实现英文分词
第五部份:中文分词的算法与实现。编程实战:结巴分词器的使用
第六部份:词条分类与词条属性。编程实战:中英文词性标注
第七部份:文本挖掘之文本分类器。编程实战:新闻类别分类
第八部份:文本挖掘之文本聚类。编程实战:百度词条聚类分析
第九部份:文本信息提取。编程实战:结构化数据提取系统
第十部份:句子语法分析。编程实战:自动语法树构建系统
第十一部份:让计算机读懂我们——文本语义分析实现。编程实现:智能问答系统
第十二部份:语言数据管理。编程实践:语料库的设计与创建