自然语言处理复习
1. 自然语言概述
- 自然语言处理定义
- 自然语言处理技术
- 自然语言理解
- 自然语言生成
- 自然语言处理面临的问题
- 自然语言处理应用场景
- NLP任务、流程
- NLP工具
- NLP语料
2. 中文分词与词性标注
- 中文分词
- 中文分析概念
- Jieba分词的三种模式及代码
- 词性标注
- 词性标注概念
- 常见的词性列表
- 词性标注工具
- 词性标注的难点
- 词性标注的方法-Jieba代码
3. 基于情感词典的文本情感分析
- 情感分析的概念
- 情感分析的分类
- 按文本级别分类
- 按任务分类
- 情感分类
- 情感分类方法
- 评估指标
4.基于K-means的短文本聚类
- 文本聚类概念
- 常见的文本聚类算法
- 文本聚类流程
- 文本预处理
- 文本表示
- one-hot编码
- 整数编码
- tf-idf
- Word2Vec
- Kmeans算法流程、评估指标、优缺点
5.基于LDA主题模型的关键词提取
- 关键词提取定义
- 关键词提取的方法
- LDA主题模型的两个假设
- LDA的输入与输出
- LDA的训练流程
6.基于TextCNN的文本分类
- 文本分类的定义
- 文本分类常见算法
- 文本预处理流程
- TextCNN
- 一维卷积、池化
- TextCNN模型结构及原理
- TextCNN变种
7.基于FastText的文本分类
- Word2Vec
- 文本相似度
- 文本表示
- Word2Vec的两种结构
- FastText
- FastText模型改进点
- FastText优点
8.基于Seq2Seq的问答系统
- 问答系统的概念
- 经典的问答系统
- 问答系统的分类
- Seq2Seq
- Encoder-Decoder
9、基于Seq2Seq+Attention的翻译系统
- 翻译系统
- 翻译系统定义
- 发展历程
- 翻译系统方法分类
- Attention
- 计算公式
- 自注意力机制
- Attention与Encoder-Decoder
- Attention特点
- 文本因果卷积
10.基于Transformer的翻译系统
-
Transformer结构
-
多头注意力
-
位置编码
-
掩码注意力
-
编解码注意力
-
残差连接与层归一化