sawyerbutton / NLP-Funda-2023-Spring

2023 Sping NLP Fundamental Course

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

NLP-Funda-2023-Spring

2023 Sping NLP Fundamental Course 2023 春季 NLP 基础课程

Course Hour:Every Weekend 16:00pm-17:30pm

Syllabus

  1. NLP基础概念及评价标准

    • 语言模型及NLP的概念
    • NLP的度量指标
    • 语言模型生成文本的思路
  2. 基于统计的NLP模型之 N-Gram

    • N-Gram概念
    • N-Gram 平滑优化
  3. 基于统计的NLP模型之 概率图模型

    • Markov Model 马尔科夫模型
    • HMM 隐藏马尔科夫模型
    • MEMM 最大熵马尔科夫模型
    • CRF 条件随机场模型
  4. NLP之文本预处理技术

    • 文本分词
    • 停用词过滤
    • 拼写纠错
    • 词性还原
    • 词干提取
  5. NLP之 基于统计的文本表示技术

    • One Hot 表示
    • 词袋模型表示
    • TF-IDF模型表示
  6. NLP之 基于神经网络的文本表示技术

    • Word2Vect概念
    • C-BOw模型
    • Skip-Gram 模型
    • 负采样与层次Softmax
  7. NLP之 基于统计和神经网络的文本表示技术

    • 共现矩阵的概念
    • Glove 模型概念
  8. NLP之 神经网络模型RNN

    • RNN 模型
    • RNN 的缺陷:梯度爆炸,梯度消失
  9. NLP之 先进RNN模型

    • LSTM 模型
    • GRU 模型
    • 双向RNN模型
    • 多层RNN模型
  10. NLP之 Seq2Seq模型

    • Encoder-Decoder 模型
    • Seq2Seq的优化演进
  11. NLP之 Transformer模型

    • Transformer模型概述
    • Word Embedding 与 Positional Encoding
    • Encoder 编码器详解
    • Decoder 解码器详解
  12. NLP之 Bert模型

    • Bert模型概述
    • Bert的预训练任务
  13. NLP之 GPT模型

    • GPT模型概述
    • GPT1.0模型
    • GPT2.0模型
    • GPT3.0模型
    • Instruct GPT
  14. NLP之 Prompt Learning

    • 预训练模型概述
    • Pre-Training 和 Fine Tunning 范式
    • Prompt 范式

Code Samples

  1. 文本生成的演进
  2. N-gram文本生成
  3. 补充内容-使用Python创建一个NLP任务的Vocabulary
  4. 文本预处理基础案例-推特客服服务信息
  5. RNN_From_Scratch
  6. GLove_implementation
  7. ChatGPT-Conversation2Image
  8. Transformer_Source_Code
  9. GPT-API-Easy-To-Use
  10. Bert1
  11. Bert2
  12. Bert3
  13. Annotated-Bert-Tokenization-Sourcecode
  14. Annotated-Bert-Run-Classifier-Sourcecode
  15. Annotated-Bert-Modeling-Sourcecode
  16. Annotated-Bert-Pytorch-Series
  17. LangChain-QARetriever

Homeworks

  1. N-Gram-Python实现snippet
  2. 基于NN的词向量表示

Related Works

  1. METEOR
  2. 构建基于Wiki的文本簇
  3. 文本预处理Demo
  4. 如何使用NLTK进行词性标注
  5. 后GPT4时代-什么是 Prompt
  6. SVD分解_1
  7. LangChain-01
  8. LangChain-usecases
  9. Linux-Funda
  10. Positional Encoding in Transformer
  11. 浮点数类型初探
  12. 浮点数类型再探fp16与bf16
  13. GPT模型详细解释大纲
  14. ChatGLM2-6b微调保姆级教程 - More-Annotation&Colab-Support
  15. 单样本+adalora微调给ChatGLM2注入知识

About

2023 Sping NLP Fundamental Course

License:Apache License 2.0


Languages

Language:Jupyter Notebook 96.0%Language:Python 3.9%Language:JavaScript 0.1%