• Stars
    star
    11,475
  • Rank 2,888 (Top 0.06 %)
  • Language
    Jupyter Notebook
  • Created over 1 year ago
  • Updated 2 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

面向开发者的 LLM 入门教程,吴恩达大模型系列课程中文版

figures/readme.png

面向开发者的 LLM 入门课程

项目简介

一个中文版的大模型入门教程,围绕吴恩达老师的大模型系列课程展开,主要包括:

一、吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版,主要内容为指导开发者如何构建 Prompt 并基于 OpenAI API 构建新的、基于 LLM 的应用,包括:

· 书写 Prompt 的原则;

· 文本总结(如总结用户评论);

· 文本推断(如情感分类、主题提取);

· 文本转换(如翻译、自动纠错);

· 扩展(如书写邮件);

二、吴恩达《Building Systems with the ChatGPT API》课程中文版,主要内容为在 Prompt Engineering 课程的基础上,指导开发者如何基于 ChatGPT 提供的 API 开发一个完整的、全面的智能问答系统,包括:

· 使用大语言模型的基本规范;

· 通过分类与监督评估输入;

· 通过思维链推理及链式提示处理输入;

· 检查并评估系统输出;

三、吴恩达《LangChain for LLM Application Development》课程中文版,主要内容为指导开发者如何结合工具 LangChain 使用 ChatGPT API 来搭建基于 LLM 的应用程序,包括:

· 模型、提示和解析器;

· 应用程序所需要用到的存储;

· 搭建模型链;

· 基于文档的问答系统;

· 评估与代理;

四、吴恩达《LangChain Chat With your Data》课程中文版,主要内容为在 LangChain 应用开发课程基础上,讲解如何使用 LangChain 来整合自己的私有数据,包括:

· 加载并切割本地文档;

· 向量数据库与词向量;

· 检索回答;

· 基于私有数据的问答与聊天;

五、(制作中)进阶的 Prompt 高级技巧,包括:

· 上下文学习;

· 思维链;

· Prompt 模板;

· 对抗性提示;

· 自动 Prompt 工程;

英文原版地址:吴恩达关于大模型的系列课程

双语字幕视频地址:吴恩达 x OpenAI的Prompt Engineering课程专业翻译版

中英双语字幕下载:《ChatGPT提示工程》非官方版中英双语字幕

项目意义

LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM 提供的 API 快速、便捷地开发一些具备更强能力、集成LLM 的应用,来便捷地实现一些更新颖、更实用的能力,是一个急需学习的重要能力。

由吴恩达老师与 OpenAI 合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。其中,《Prompt Engineering for Developers》教程面向入门 LLM 的开发者,深入浅出地介绍了对于开发者,如何构造 Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能,是入门 LLM 开发的经典教程;《Building Systems with the ChatGPT API》教程面向想要基于 LLM 开发应用程序的开发者,简洁有效而又系统全面地介绍了如何基于 ChatGPT API 打造完整的对话系统;《LangChain for LLM Application Development》教程结合经典大模型开源框架 LangChain,介绍了如何基于 LangChain 框架开发具备实用功能、能力全面的应用程序,《LangChain Chat With Your Data》教程则在此基础上进一步介绍了如何使用 LangChain 架构结合个人私有数据开发个性化大模型应用。

上述教程非常适用于开发者学习以开启基于 LLM 实际搭建应用程序之路。因此,我们将该系列课程翻译为中文,并复现其范例代码,也为其中一个视频增加了中文字幕,支持国内中文学习者直接使用,以帮助中文学习者更好地学习 LLM 开发;我们也同时实现了效果大致相当的中文 Prompt,支持学习者感受中文语境下 LLM 的学习使用,对比掌握多语言语境下的 Prompt 设计与 LLM 开发。未来,我们也将加入更多 Prompt 高级技巧,以丰富本课程内容,帮助开发者掌握更多、更巧妙的 Prompt 技能。

项目受众

适用于所有具备基础 Python 能力,想要入门 LLM 的开发者。

项目亮点

《ChatGPT Prompt Engineering for Developers》、《Building Systems with the ChatGPT API》、《LangChain for LLM Application Development》、《LangChain Chat with Your Data》等教程作为由吴恩达老师与 OpenAI 联合推出的官方教程,在可预见的未来会成为 LLM 的重要入门教程,但是目前还只支持英文版且国内访问受限,打造中文版且国内流畅访问的教程具有重要意义;同时,GPT 对中文、英文具有不同的理解能力,本教程在多次对比、实验之后确定了效果大致相当的中文 Prompt,支持学习者研究如何提升 ChatGPT 在中文语境下的理解与生成能力。

内容大纲

一、面向开发者的 Prompt Engineering

注:吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版

目录:

  1. 简介 Introduction @邹雨衡
  2. Prompt 的构建原则 Guidelines @邹雨衡
  3. 如何迭代优化 Prompt Itrative @邹雨衡
  4. 文本总结 Summarizing @玉琳
  5. 文本推断 Inferring @长琴
  6. 文本转换 Transforming @玉琳
  7. 文本扩展 Expanding @邹雨衡
  8. 聊天机器人 Chatbot @长琴
  9. 总结 @长琴

附1 使用 ChatGLM 进行学习 @宋志学

二、搭建基于 ChatGPT 的问答系统

注:吴恩达《Building Systems with the ChatGPT API》课程中文版

目录:

  1. 简介 Introduction @Sarai
  2. 模型,范式和 token Language Models, the Chat Format and Tokens @仲泰
  3. 检查输入-分类 Classification @诸世纪
  4. 检查输入-监督 Moderation @诸世纪
  5. 思维链推理 Chain of Thought Reasoning @万礼行
  6. 提示链 Chaining Prompts @万礼行
  7. 检查输入 Check Outputs @仲泰
  8. 评估(端到端系统)Evaluation @邹雨衡
  9. 评估(简单问答)Evaluation-part1 @陈志宏、邹雨衡
  10. 评估(复杂问答)Evaluation-part2 @邹雨衡
  11. 总结 Conclusion @Sarai

三、使用 LangChain 开发应用程序

注:吴恩达《LangChain for LLM Application Development》课程中文版

目录:

  1. 简介 Introduction @Sarai
  2. 模型,提示和解析器 Models, Prompts and Output Parsers @Joye
  3. 存储 Memory @徐虎
  4. 模型链 Chains @徐虎
  5. 基于文档的问答 Question and Answer @苟晓攀
  6. 评估 Evaluation @苟晓攀
  7. 代理 Agent @Joye
  8. 总结 Conclusion @Sarai

四、使用 LangChain 访问个人数据

注:吴恩达《LangChain Chat with Your Data》课程中文版

目录:

  1. 简介 Introduction @Joye
  2. 加载文档 Document Loading @Joye
  3. 文档切割 Document Splitting @苟晓攀
  4. 向量数据库与词向量 Vectorstores and Embeddings @刘伟鸿、仲泰
  5. 检索 Retrieval @刘伟鸿
  6. 问答 Question Answering @邹雨衡
  7. 聊天 Chat @高立业
  8. 总结 Summary @高立业

五、Prompt 高级技巧(暂未完成)

目录:

  1. 上下文学习 In-context Learning @Noah
  2. 思维链 Chain of Thought @玉琳
  3. Prompt 模板 Template @万礼行
  4. Prompt 集成 Ensembling @杨同学
  5. 自我一致性 Self-consistency @朱宏民
  6. 对抗性提示 Adversarial Prompting @周辉池
  7. 可靠性 Reliability @成剑
  8. 自动 Prompt 工程 Automatic Prompt Engineer @邹雨衡

配套视频

双语字幕视频:吴恩达 x OpenAI的Prompt Engineering课程专业翻译版 @万礼行

致谢

核心贡献者

其他

  1. 特别感谢 @Sm1les@LSGOMYP 对本项目的帮助与支持;
  2. 感谢 GithubDaily 提供的双语字幕;
  3. 如果有任何想法可以联系我们 DataWhale 也欢迎大家多多提出 issue;
  4. 特别感谢以下为教程做出贡献的同学!

Made with contrib.rocks.

关注我们

扫描下方二维码关注公众号:Datawhale

Datawhale 是一个专注于数据科学与 AI 领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。微信搜索公众号Datawhale可以加入我们。

LICENSE

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

More Repositories

1

pumpkin-book

《机器学习》(西瓜书)公式详解
23,825
star
2

leedl-tutorial

《李宏毅深度学习教程》(李宏毅老师推荐👍,苹果书🍎),PDF下载地址:https://github.com/datawhalechina/leedl-tutorial/releases
Jupyter Notebook
13,188
star
3

easy-rl

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
Jupyter Notebook
9,150
star
4

self-llm

《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程
Jupyter Notebook
8,097
star
5

joyful-pandas

pandas中文教程
Jupyter Notebook
4,603
star
6

llm-universe

本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/
Jupyter Notebook
4,420
star
7

competition-baseline

数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路
Jupyter Notebook
4,251
star
8

fun-rec

推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/
Jupyter Notebook
4,197
star
9

hugging-llm

HuggingLLM, Hugging Future.
Jupyter Notebook
2,732
star
10

so-large-lm

大模型基础: 一文了解大模型基础知识
2,612
star
11

daily-interview

Datawhale成员整理的面经,内容包括机器学习,CV,NLP,推荐,开发等,欢迎大家star
HTML
2,524
star
12

thorough-pytorch

PyTorch入门教程,在线阅读地址:https://datawhalechina.github.io/thorough-pytorch/
Jupyter Notebook
2,426
star
13

learn-nlp-with-transformers

we want to create a repo to illustrate usage of transformers in chinese
Shell
2,245
star
14

team-learning

主要展示Datawhale的组队学习计划。
2,208
star
15

statistical-learning-method-solutions-manual

统计学习方法习题解答,在线阅读地址:https://datawhalechina.github.io/statistical-learning-method-solutions-manual
Jupyter Notebook
1,709
star
16

team-learning-data-mining

主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。
Jupyter Notebook
1,599
star
17

key-book

《机器学习理论导引》(宝箱书)的证明、案例、概念补充与参考文献讲解。
1,522
star
18

hugging-multi-agent

A tutorial based on MetaGPT to quickly help you understand the concept of agent and muti-agent and get started with coding development. 基于MetaGPT的多智能体入门与开发教程
CSS
1,333
star
19

llms-from-scratch-cn

仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理
Jupyter Notebook
1,149
star
20

hands-on-data-analysis

动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果
Jupyter Notebook
1,148
star
21

tiny-universe

《大模型白盒子构建指南》:一个全手搓的Tiny-Universe
Python
1,113
star
22

team-learning-nlp

主要存储Datawhale组队学习中“自然语言处理”方向的资料。
Jupyter Notebook
865
star
23

dive-into-cv-pytorch

动手学CV-Pytorch版
Python
837
star
24

team-learning-program

主要存储Datawhale组队学习中“编程、数据结构与算法”方向的资料。
Jupyter Notebook
825
star
25

wonderful-sql

Follow me,从 0 到 1 掌握 SQL。
736
star
26

leetcode-notes

🐳 LeetCode 算法笔记:面试、刷题、学算法。在线阅读地址:https://datawhalechina.github.io/leetcode-notes/
682
star
27

machine-learning-toy-code

《机器学习》(西瓜书)代码实战
Jupyter Notebook
648
star
28

whale-quant

本项目为量化开源课程,可以帮助人们快速掌握量化金融知识以及使用Python进行量化开发的能力。
Jupyter Notebook
515
star
29

intro-mathmodel

《数学建模导论》教程,全网最全数学建模模型与算法教程系列,带你走进数学建模的大门!
460
star
30

fantastic-matplotlib

Matplotlib中文教程,在线阅读地址:https://datawhalechina.github.io/fantastic-matplotlib/
Python
456
star
31

torch-rechub

A Lighting Pytorch Framework for Recommendation Models, Easy-to-use and Easy-to-extend.
Python
400
star
32

powerful-numpy

巨硬的NumPy
Jupyter Notebook
363
star
33

d2l-ai-solutions-manual

《动手学深度学习》习题解答,在线阅读地址如下:
Jupyter Notebook
337
star
34

learn-python-the-smart-way

聪明方法学Python,简明且系统的 Python 入门教程。
Jupyter Notebook
330
star
35

vced

VCED 可以通过你的文字描述来自动识别视频中相符合的片段进行视频剪辑。该项目基于跨模态搜索与向量检索技术搭建,通过前后端分离的模式,帮助你快速的接触新一代搜索技术。
Python
327
star
36

team-learning-cv

主要存储Datawhale组队学习中“计算机视觉”方向的资料。
Jupyter Notebook
315
star
37

juicy-bigdata

🎉🎉🐳 Datawhale大数据处理导论教程 | 大数据技术方向的开篇课程🎉🎉
Python
265
star
38

office-automation

python自动化办公
Jupyter Notebook
245
star
39

learn-python-the-smart-way-v2

聪明办法学Python,简明且系统的 Python 入门教程第二版。
Jupyter Notebook
216
star
40

DOPMC

Datawhale 开源项目管理委员会(Datawhale Open-source Project Management Committee,简称DOPMC)
199
star
41

grape-book

图深度学习(葡萄书),在线阅读地址: https://datawhalechina.github.io/grape-book
HTML
186
star
42

team-learning-sql

主要存储Datawhale组队学习中“SQL”方向的资料。
178
star
43

joyrl

An easier PyTorch deep reinforcement learning library.
Python
160
star
44

agent-tutorial

157
star
45

awesome-compression

模型压缩的小白入门教程
152
star
46

smoothly-vslam

VSLAM开源基础教程,各章节练习代码
C++
149
star
47

undingable-optimization

顶不住的运筹优化
149
star
48

faster-git

a chinese tutorial of git
138
star
49

ensemble-learning

Jupyter Notebook
137
star
50

free-excel

开源Excel教程。
CSS
131
star
51

unusual-deep-learning

水很深的深度学习
122
star
52

hugging-sd

Hugging StableDiffusion, Hugging Future.
Jupyter Notebook
112
star
53

huawei-od-python

华为OD算法题解
Python
110
star
54

sweetalk-design-pattern

基于《大话设计模式》对设计原则和设计模式进行解读。
C++
106
star
55

joyrl-book

Jupyter Notebook
101
star
56

sora-tutorial

97
star
57

wow-fullstack

wow-fullstack,令人惊叹的全栈开发教程
JavaScript
88
star
58

hands-dirty-nlp

本课程面对具有一定机器学习基础,但尚未入门的NLPer或经验尚浅的NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计思想,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。
Jupyter Notebook
80
star
59

paper-chart-tutorial

《科研论文配图》组队学习
64
star
60

whale-anno

Datawhale自研数据标注工具
Vue
63
star
61

time-series-learning

天池”AI Earth“气象海洋预测竞赛的Topline学习教程
Jupyter Notebook
60
star
62

wow-plotly

高级可视化神器plotly的学习
Jupyter Notebook
55
star
63

leegenai-tutorial

《李宏毅生成式人工智能教程》,PDF下载地址:https://github.com/datawhalechina/leegenai-tutorial/releases
55
star
64

openmmlab-tutorial

帮助新手快速入门、快速使用、习惯 OpenMMLab 开源库官方文档且能够自主上手实验,自由选择阅读更深层的知识。
Jupyter Notebook
53
star
65

go-talent

Go天才小队
Go
49
star
66

rl-papers

rl-papers
41
star
67

whale-paper

Datawhale论文分享,阅读前沿论文,分享技术创新
40
star
68

unlock-hf

解锁HuggingFace生态的百般用法
HTML
40
star
69

aima-notes

人工智能:现代方法(第4版)笔记
39
star
70

llm-deploy

大模型/LLM推理和部署理论与实践
39
star
71

llm-research

39
star
72

what-is-vs

向量检索教程
36
star
73

whale-starry

繁星点点,光芒万丈
C++
34
star
74

team-learning-rl

主要存储Datawhale组队学习中“强化学习”方向的资料。
31
star
75

hugging-audio

Hugging Face Audio Course中文版,帮助学习者快速入门音频模态
Jupyter Notebook
28
star
76

ML-FTTI

机器学习 - 从原理到实现
Python
28
star
77

whale-web

Python
27
star
78

handy-ollama

动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/
Jupyter Notebook
27
star
79

magic-cv

Jupyter Notebook
22
star
80

hugging-rl

Robot Learning Algorithms
18
star
81

leeml-notes

leeml-notes已更名为leedl-tutorial,请访问:https://github.com/datawhalechina/leedl-tutorial
18
star
82

coggle

Coggle数据科学
16
star
83

easy-grokking-deep-learning

Easy-Grokking-Deep-Learning,意为轻松摸索深度学习,英文缩写可简称为EGDL。
Python
13
star
84

scientific-computing

Python科学计算教程,学完Python不知道如何应用?看这里:https://datawhalechina.github.io/scientific-computing/
12
star
85

sweetalk-data-structure

电子书阅读地址
10
star
86

datawhale-linklearner

datawhale linklearner 网站
TypeScript
9
star
87

camel-agent-tutorial

This is a tutorial based on the CAMEL framework, aimed at understanding how to build an Agent Society from the ground up!
9
star
88

repo-template

Datawhale Repository Template
8
star
89

self-dify

8
star
90

udl-tutorial

6
star
91

easy-ros2arm

Robotic arm with machine vision and its os is ROS2.
C++
5
star
92

HandPoseKeyPoints

5
star
93

latex-template

Datawhale LaTex Template
TeX
5
star
94

design-and-analysis-of-algorithm

4
star
95

hello-net

4
star
96

fun-marl

4
star
97

light-memory-pool

基于Arrow的轻量内存池
C++
4
star
98

hands-on-llm

Python
3
star
99

whale-coin

Python
3
star
100

ai-club

Datawhale 高校联盟
3
star