自然语言处理复习 | Tian

LOADING

加载过慢请开启缓存 浏览器默认开启

自然语言处理复习

2023/12/6 知识点 NLP

自然语言处理复习

1. 自然语言概述

  • 自然语言处理定义
  • 自然语言处理技术
  • 自然语言理解
  • 自然语言生成
  • 自然语言处理面临的问题
  • 自然语言处理应用场景
  • NLP任务、流程
  • NLP工具
  • NLP语料

2. 中文分词与词性标注

  • 中文分词
  • 中文分析概念
    • Jieba分词的三种模式及代码
  • 词性标注
  • 词性标注概念
  • 常见的词性列表
  • 词性标注工具
  • 词性标注的难点
    • 词性标注的方法-Jieba代码

3. 基于情感词典的文本情感分析

  • 情感分析的概念
  • 情感分析的分类
  • 按文本级别分类
  • 按任务分类
  • 情感分类
  • 情感分类方法
  • 评估指标

4.基于K-means的短文本聚类

  • 文本聚类概念
  • 常见的文本聚类算法
  • 文本聚类流程
  • 文本预处理
  • 文本表示
    • one-hot编码
    • 整数编码
    • tf-idf
    • Word2Vec
  • Kmeans算法流程、评估指标、优缺点

5.基于LDA主题模型的关键词提取

  • 关键词提取定义
  • 关键词提取的方法
  • LDA主题模型的两个假设
  • LDA的输入与输出
  • LDA的训练流程

6.基于TextCNN的文本分类

  • 文本分类的定义
  • 文本分类常见算法
  • 文本预处理流程
  • TextCNN
    • 一维卷积、池化
    • TextCNN模型结构及原理
    • TextCNN变种

7.基于FastText的文本分类

  • Word2Vec
  • 文本相似度
  • 文本表示
    • Word2Vec的两种结构
    • FastText
    • FastText模型改进点
    • FastText优点

8.基于Seq2Seq的问答系统

  • 问答系统的概念
  • 经典的问答系统
  • 问答系统的分类
  • Seq2Seq
  • Encoder-Decoder

9、基于Seq2Seq+Attention的翻译系统

  • 翻译系统
  • 翻译系统定义
  • 发展历程
  • 翻译系统方法分类
  • Attention
  • 计算公式
  • 自注意力机制
  • Attention与Encoder-Decoder
  • Attention特点
  • 文本因果卷积

10.基于Transformer的翻译系统

  • Transformer结构

  • 多头注意力

  • 位置编码

  • 掩码注意力

  • 编解码注意力

  • 残差连接与层归一化

载入天数...载入时分秒...
访问量 总访客