• Stars
    star
    214
  • Rank 184,678 (Top 4 %)
  • Language
  • Created almost 4 years ago
  • Updated almost 4 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

书籍《现代自然语言生成》介绍

新书《现代自然语言生成》

cover

内容简介

Keywords: 循环神经网络、Transformer、变分自编码器、生成式对抗网络、序列到序列模型、统计语言模型、神经语言模型、非自回归生成、知识融合、语言生成评价

本书总结了以神经网络为代表的现代自然语言生成的基本思想、模型和框架。本书共12章,首先介绍了自然语言生成的研究背景、从统计语言模型到神经网络语言建模的过程,以及自然语言建模的思想与技术演化过程;其次从基础模型角度介绍了基于循环神经网络、基于Transformer 的语言生成模型,从优化方法角度介绍了基于变分自编码器、基于生成式对抗网络的语言生成模型,从生成方式角度介绍了非自回归语言生成的基本模型和框架;然后介绍了融合规划的自然语言生成、融合知识的自然语言生成、常见的自然语言生成任务和数据资源,以及自然语言生成的评价方法;最后总结了本书的写作思路及对自然语言生成领域未来发展趋势的展望。 本书可作为高等院校计算机科学与技术、人工智能、大数据等相关专业高年级本科生、研究生相关课程的教材,也适合从事自然语言处理研究、应用实践的科研人员和工程技术人员参考。

structure

目录

我们提供部分试读,点击下方链接下载:

  • (中国科学院院士 清华大学教授 张钹院士 为本书作序)
  • 前言
  • 第一章
第1章 自然语言生成的研究背景
    1.1 自然语言生成的背景概述
    1.2 基本定义与研究范畴
    1.3 自然语言生成与自然语言理解.
    1.4 传统的模块化生成框架
    1.5 端到端的自然语言生成框架
    1.6 典型的自然语言生成任务
    1.7 自然语言生成的可控性
    1.8 本书结构
第2章 从统计语言模型到神经网络语言建模
    2.1 统计语言模型
        2.1.1 基本原理
        2.1.2 平滑技术
        2.1.3 语言模型评价
        2.1.4 统计语言模型的缺点
    2.2 神经网络语言模型
        2.2.1 前馈神经网络语言模型
        2.2.2 基于循环神经网络的神经语言模型
        2.2.3 基于Transformer 的神经语言模型
    2.3 静态词向量模型
        2.3.1 分布假设与分布式表示
        2.3.2 词向量模型CBOW 和Skip-gram
        2.3.3 词向量模型训练优化:负采样
        2.3.4 词向量模型训练优化:层次化softmax 
        2.3.5 静态词向量的缺陷
    2.4 语境化语言表示模型
        2.4.1 ELMo 
        2.4.2 BERT 
        2.4.3 XLNet
    2.5 本章小结
第3章 基于RNN 的语言生成模型
    3.1 RNN 的基本原理
    3.2 RNN 的训练算法
    3.3 长短期记忆神经网络与门控循环单元
    3.4 RNN 的架构设计
        3.4.1 多层RNN 
        3.4.2 双向RNN 
    3.5 基于RNN 的语言模型
        3.5.1 模型结构
        3.5.2 主要问题
        3.5.3 模型改进
    3.6 序列到序列模型
        3.6.1 基本原理
        3.6.2 模型结构
        3.6.3 注意力机制
    3.7 解码器的解码方法
        3.7.1 基于搜索的解码方法
        3.7.2 基于采样的解码方法
    3.8 序列到序列模型存在的问题
    3.9 本章小结
第4章 基于Transformer 的语言生成模型
    4.1 Transformer 模型的基本原理
        4.1.1 多头注意力机制
        4.1.2 Transformer 基本单元
    4.2 基于Transformer 的编码器—解码器结构
        4.2.1 基本原理
        4.2.2 位置编码模块
        4.2.3 Transformer 编码器
        4.2.4 Transformer 解码器
    4.3 Transformer 模型与RNN 模型的比较
    4.4 Transformer 模型问题与解决方案
        4.4.1 长距离依赖问题
        4.4.2 运算复杂度问题
    4.5 基于Transformer 的预训练语言生成模型
        4.5.1 GPT 模型
        4.5.2 GPT-2 和GPT-3 
        4.5.3 GPT 模型的扩展
    4.6 本章小结
第5章 基于变分自编码器的语言生成模型
    5.1 自编码器
    5.2 变分自编码器
    5.3 条件变分自编码器
    5.4 解码器设计
    5.5 变分自编码器在语言生成任务上的应用实例
        5.5.1 含类别约束的条件变分自编码器模型
        5.5.2 含隐变量序列的条件变分自编码器模型
    5.6 主要问题及解决方案
        5.6.1 隐变量消失
        5.6.2 可解释性增强
    5.7 本章小结
第6章 基于生成式对抗网络的语言生成模型
    6.1 生成式对抗网络的背景
    6.2 生成式对抗网络的基本原理
    6.3 生成式对抗网络的基本结构
    6.4 生成式对抗网络的优化问题
        6.4.1 使用强化学习方法训练生成式对抗网络
        6.4.2 使用近似方法训练生成式对抗网络
    6.5 生成式对抗模型在文本与图像中的区别
    6.6 生成式对抗网络的应用
        6.6.1 对话生成
        6.6.2 无监督的风格迁移
    6.7 本章小结
第7章 非自回归语言生成
    7.1 基本原理
        7.1.1 适用场景的问题定义
        7.1.2 自回归模型和非自回归模型
        7.1.3 模型结构
    7.2 非自回归模型的挑战
        7.2.1 一对多问题
        7.2.2 内部依赖问题
    7.3 非自回归模型的改进
        7.3.1 网络结构的改进
        7.3.2 模型理论的改进
        7.3.3 后处理的方法
        7.3.4 半自回归方法
    7.4 应用与拓展
    7.5 本章小结
第8章 融合规划的自然语言生成
    8.1 数据到文本生成任务中的规划
        8.1.1 数据到文本生成任务的定义
        8.1.2 传统的模块化方法
        8.1.3 神经网络方法
    8.2 故事生成任务中的规划
        8.2.1 故事生成任务的定义
        8.2.2 传统方法
        8.2.3 神经网络方法
    8.3 本章小结
第9章 融合知识的自然语言生成
    9.1 引入知识的动机
    9.2 引入知识面临的挑战
    9.3 知识的编码与表示
        9.3.1 结构化知识表示
        9.3.2 非结构化知识表示
    9.4 融合知识的解码方法
        9.4.1 拷贝网络
        9.4.2 生成式预训练
    9.5 应用实例
        9.5.1 基于多跳常识推理的语言生成
        9.5.2 故事生成
    9.6 发展趋势
        9.6.1 语言模型与知识的融合
        9.6.2 预训练模型与知识的融合
    9.7 本章小结
第10章 常见的自然语言生成任务和数据资源
    10.1 机器翻译
        10.1.1 常规机器翻译
        10.1.2 低资源机器翻译
        10.1.3 无监督机器翻译
    10.2 生成式文本摘要
        10.2.1 短文本摘要
        10.2.2 长文本摘要
        10.2.3 多文档摘要
        10.2.4 跨语言文本摘要
        10.2.5 对话摘要
        10.2.6 细粒度文本摘要
    10.3 意义到文本生成
        10.3.1 抽象语义表示到文本生成
        10.3.2 逻辑表达式到文本生成
    10.4 数据到文本生成
    10.5 故事生成
        10.5.1 条件故事生成
        10.5.2 故事结局生成
        10.5.3 故事补全
        10.5.4 反事实故事生成
    10.6 对话生成
        10.6.1 常规对话生成
        10.6.2 知识导引的对话生成
        10.6.3 个性化对话生成
        10.6.4 情感对话生成
    10.7 多模态语言生成
        10.7.1 图像描述生成
        10.7.2 视频描述生成
        10.7.3 视觉故事生成
        10.7.4 视觉对话
    10.8 无约束语言生成
    10.9 本章小结
第11章 自然语言生成的评价方法
    11.1 语言生成评价的角度
    11.2 人工评价
        11.2.1 人工评价的分类
        11.2.2 标注一致性
        11.2.3 人工评价的问题与挑战
    11.3 自动评价
        11.3.1 无需学习的自动评价方法
        11.3.2 可学习的自动评价方法
    11.4 自动评价与人工评价的结合
    11.5 自动评价与人工评价的统计相关性
        11.5.1 Pearson 相关系数
        11.5.2 Spearman 相关系数
        11.5.3 Kendall 相关系数
        11.5.4 相关系数的显著性
    11.6 本章小结
第12章 自然语言生成的趋势展望
    12.1 现状分析
    12.2 趋势展望
参考文献

More Repositories

1

CDial-GPT

A Large-scale Chinese Short-Text Conversation Dataset and Chinese pre-training dialog models
Python
1,678
star
2

Safety-Prompts

Chinese safety prompts for evaluating and improving the safety of LLMs. 中文安全prompts,用于评估和提升大模型的安全性。
837
star
3

CrossWOZ

A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset
Python
580
star
4

KdConv

KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation
Python
455
star
5

ConvLab-2

ConvLab-2: An Open-Source Toolkit for Building, Evaluating, and Diagnosing Dialogue Systems
Python
449
star
6

CharacterGLM-6B

CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models
Python
395
star
7

EVA

EVA: Large-scale Pre-trained Chit-Chat Models
Python
304
star
8

BPO

Python
281
star
9

Emotional-Support-Conversation

Data and codes for ACL 2021 paper: Towards Emotional Support Dialog Systems
Python
227
star
10

ccm

This project is a tensorflow implement of our work, CCM (Commonsense Conversational Model).
Python
218
star
11

ecm

This project is a tensorflow implement of our work, ECM (emotional chatting machine).
Python
216
star
12

COLDataset

The official repository of the paper: COLD: A Benchmark for Chinese Offensive Language Detection
201
star
13

PaperForONLG

Paper list for open-ended language generation
187
star
14

PsyQA

一个中文心理健康支持问答数据集,提供了丰富的援助策略标注。可用于生成富有援助策略的长咨询文本。
154
star
15

SafetyBench

Official github repo for SafetyBench, a comprehensive benchmark to evaluate LLMs' safety.
Python
144
star
16

ShieldLM

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors
Python
139
star
17

cotk

Conversational Toolkit. An Open-Source Toolkit for Fast Development and Fair Evaluation of Text Generation
Python
128
star
18

DA-Transformer

Official Implementation for the ICML2022 paper "Directed Acyclic Transformer for Non-Autoregressive Machine Translation"
Python
114
star
19

PPT

Official Code for "PPT: Pre-trained Prompt Tuning for Few-shot Learning". ACL 2022
Python
104
star
20

CommonsenseStoryGen

Implementation for paper "A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation"
Python
103
star
21

PICL

Code for ACL2023 paper: Pre-Training to Learn in Context
Python
101
star
22

CritiqueLLM

96
star
23

tatk

Task-oriented dialog system toolkits
Python
84
star
24

SentiLARE

Codes for our paper "SentiLARE: Sentiment-Aware Language Representation Learning with Linguistic Knowledge" (EMNLP 2020)
Python
78
star
25

THUOOP

清华大学面向对象程序设计课程 课程材料及答疑
76
star
26

OPD

OPD: Chinese Open-Domain Pre-trained Dialogue Model
Python
74
star
27

LOT-LongLM

Python
71
star
28

JointGT

Codes for our paper "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs" (ACL 2021 Findings)
Python
70
star
29

UNION

UNION: An Unreferenced Metric for Evaluating Open-ended Story Generation
Python
57
star
30

OpenMEVA

Benchmark for evaluating open-ended generation
Python
44
star
31

HINT

Python
35
star
32

CTRLEval

Codes for our paper "CTRLEval: An Unsupervised Reference-Free Metric for Evaluating Controlled Text Generation" (ACL 2022)
Python
31
star
33

CPT4DST

Official code for "Continual Prompt Tuning for Dialog State Tracking" (ACL 2022).
Python
28
star
34

seq2seq-pytorch-bert

Python
26
star
35

DiaSafety

This repo is for the paper: On the Safety of Conversational Models: Taxonomy, Dataset, and Benchmark
Python
23
star
36

Targeted-Data-Extraction

Official Code for ACL 2023 paper: "Ethicist: Targeted Training Data Extraction Through Loss Smoothed Soft Prompting and Calibrated Confidence Estimation"
Python
23
star
37

TaiLr

ICLR2023 - Tailoring Language Generation Models under Total Variation Distance
Python
20
star
38

SafeUnlearning

Safe Unlearning: A Surprisingly Effective and Generalizable Solution to Defend Against Jailbreak Attacks
Python
20
star
39

LAUG

Language Understanding Augmentation Toolkit for Robustness Testing
Python
19
star
40

MoralStory

Python
17
star
41

ConPer

Official Code for NAACL 2022 paper: "Persona-Guided Planning for Controlling the Protagonist's Persona in Story Generation"
Python
15
star
42

AugESC

Official repository for the Findings of ACL 2023 paper "AugESC: Dialogue Augmentation with Large Language Models for Emotional Support Conversation"
15
star
43

NAST

Codes for "NAST: A Non-Autoregressive Generator with Word Alignment for Unsupervised Text Style Transfer" (ACL 2021 findings)
Python
14
star
44

CDConv

Data and codes for EMNLP 2022 paper "CDConv: A Benchmark for Contradiction Detection in Chinese Conversations"
Python
13
star
45

JailbreakDefense_GoalPriority

[ACL 2024] Defending Large Language Models Against Jailbreaking Attacks Through Goal Prioritization
Python
11
star
46

AutoCAD

Official Code for EMNLP 2022 findings paper: "AutoCAD: Automatically Generating Counterfactuals for Mitigating Shortcut Learning"
Python
10
star
47

Implicit-Toxicity

Official Code for EMNLP 2023 paper: "Unveiling the Implicit Toxicity in Large Language Models""
Python
8
star
48

grounded-minimal-edit

Code for EMNLP 2021 paper "Transferable Persona-Grounded Dialogues via Grounded Minimal Edits"
Python
8
star
49

hred-tensorflow

Python
7
star
50

EssayCommentGen

Python
7
star
51

UDIT

Official Code for EMNLP2022 Paper: "Learning Instructions with Unlabeled Data for Zero-Shot Cross-Task Generalization"
Python
7
star
52

Reverse_Generation

Python
6
star
53

earl

This project is a tensorflow implementation of our work, EARL.
Python
6
star
54

MoralDial

The official Implementations of the paper: MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Moral Discussions
Python
5
star
55

seqGAN-tensorflow

Python
5
star
56

LaMemo

NAACL2022 - LaMemo: Language Modeling with Look-Ahead Memory
Python
5
star
57

Re3Dial

Official Code for EMNLP 2023 paper: "Re3Dial: Retrieve, Reorganize and Rescale Conversations for Long-Turn Open-Domain Dialogue Pre-training"
Python
5
star
58

ERIC

Code for the AAAI 2023 paper "Generating Coherent Narratives by Learning Dynamic and Discrete Entity States with a Contrastive Framework"
Python
4
star
59

DAG-Search

The beamsearch algorithm for DA-Transformer
C++
4
star
60

cotk_docs

Document for cotk package. Refer to: https://github.com/thu-coai/cotk
Python
4
star
61

lightseq-nat

A Modified Version of LightSeq for Non-Autoregressive Transformer
Cuda
3
star
62

seq2seq-pytorch

Python
3
star
63

SelfCont

Code for the paper "Mitigating the Learning Bias towards Repetition by Self-Contrastive Training for Open-Ended Generation"
Python
3
star
64

CodePlan

3
star
65

transformerLM-pytorch

Python
2
star
66

cotk_dashboard

Dashboard for cotk
JavaScript
2
star
67

GPT2LM-pytorch

Python
2
star
68

ConvLab-2_docs

2
star
69

CVAE-tensorflow

Python
2
star
70

GRULM-pytorch

Python
1
star
71

LM-tensorflow

Python
1
star
72

cotk-test-CVAE

Python
1
star
73

tatk_docs

The document of TaTK platform.
1
star
74

seq2seq-tensorflow

Python
1
star
75

VAE-tensorflow

Python
1
star
76

ComplexBench

Python
1
star
77

cotk_data

1
star
78

SST-pytorch

Python
1
star