• Stars
    star
    251
  • Rank 161,862 (Top 4 %)
  • Language
    C++
  • License
    Apache License 2.0
  • Created almost 6 years ago
  • Updated over 3 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

unit-uskit

USKit

简介

在真实的对话系统中,通常会要求同时支持多种对话技能,比如育儿对话机器人中要求同时支持音乐、故事、古诗、百科等技能。这涉及到多个技能的管理、召回、排序和选择等策略,在具体的实现中,通常由一个统一调度对话中控 US (Unified Scheduler) 来提供这些能力。

USKit 作为 UNIT 的开源对话中控模块,主要负责多个对话技能的接入、调度、排序、选择、回复生成以及多轮对话 session 的管理,无缝对接 UNIT 平台能力,可以方便开发者通过配置快速搭建和定制符合自己业务场景的对话中控,将多种技能整合为统一的对话机器人为用户提供服务。

主要功能

核心概念

在开始之前,我们先定义以下两个概念:

  1. 对话技能 (bot skill):指某个特定场景下的对话能力,一个对话技能对应一个具体的对话场景,例如天气技能负责提供天气场景下的对话能力。
  2. 对话机器人 (bot service):由多个对话技能整合而成的统一对话服务,可以同时支持多个对话场景的人机对话,一个对话机器人对应一个具体业务的整体解决方案,比如车载对话机器人、育儿对话机器人等。USKit 提供的正是快速搭建对话机器人的能力。

功能介绍

USKit 作为 UNIT 的开源中控模块,通过配置驱动和内置表达式运算支持,提供了以下能力:

  • 支持配置表达式运算,内置常用函数,提供丰富的表达能力,通过修改配置即可轻松实现策略的定制
  • 支持定义后端服务的请求构造和接入策略 (后端服务泛指各种通过网络访问的远程服务,比如 UNIT 技能、DMKit 服务、Redis session 服务等),支持的通信协议包括 HTTPRedis
  • 支持定义后端服务结果的抽取 (extract) 和变换 (transform) 策略
  • 支持定义多种对话技能的排序 (ranking) 和选择策略
  • 支持定义对话中控流程 (chatflow) 策略
  • 内置 UNIT 技能协议请求构造和结果解析策略的配置支持,只需配置技能 ID 即可实现对话技能的快速接入

架构

USKit 针对对话中控的能力做了抽象,抽取出不同对话场景中下中控的通用能力,避免不必要的重复开发。同时按照配置化驱动和高扩展性的思想进行整体架构的设计,方便开发者通过配置快速构建和定制适用于特定业务场景的对话中控。USKit的整体架构如下图:

USKit整体架构

系统主要由以下4个核心部分组成:

  • 表达式引擎:负责表达式的解析和执行求值,详细的运算支持可以参见配置表达式运算支持,表达式引擎为下面三个引擎提供了基础支持,基于表达式引擎,可以实现根据用户请求动态生成配置
  • 后端服务管理引擎:负责后端服务的接入、请求构造和结果解析抽取等策略的管理,通过 backend.conf 进行策略的配置
  • 排序策略管理引擎:负责技能的排序规则的管理,用于多技能的排序,通过 rank.conf 进行策略的配置
  • 对话流程管理引擎:负责对话中控流程的策略的管理,用于定义机器人中控的逻辑执行流程:包括调用后端服务引擎召回技能 (recall)、调用排序引擎进行技能排序 (rank)、结果选择和输出等,通过 flow.conf 进行策略的配置

开发者在使用 USKit 的时候,只需配置上述3个配置文件,即可完成对话中控的搭建,后续策略的变动和升级也通过修改配置文件即可完成,可以让开发者关注对话机器人中控本身的策略逻辑,不需要重复开发框架代码

3个配置文件的详细说明可以参考详细配置说明

安装

从 GitHub 获取 USKit 的源代码:

git clone https://github.com/baidu/unit-uskit.git
cd unit-uskit

USKit 提供了两种安装方式:使用 Docker 构建镜像和手动安装。推荐使用 Docker 进行安装。

Docker 安装

docker build -t unit-uskit .

我们也提供成功编译的 Docker 镜像,可使用如下命令拉取镜像:

docker pull docker.io/shanetian/unit-uskit:v3.0.0

手动安装

1. 安装依赖

USKit 基于以下工具包进行开发:

  • brpc
  • boost
  • protobuf
  • flex >= 2.6.4
  • bison >= 3.0.4
  • cmake >= 2.8.10

目前支持 Ubuntu,CentOS 等系统环境,Ubuntu 推荐使用 16.04 或以上版本,CentOS 推荐使用 7 以上版本,编译 USKit 前请确保对应版本的依赖已经正确安装:

Ubuntu
sh deps.sh ubuntu
CentOS
sh deps.sh centos

2. 编译USKit

mkdir _build && cd _build && cmake .. && make

注:编译前请检查 gcc 版本,若版本较低不支持 C++14,则使用 source /opt/rh/devtoolset-7/enable 切换到新安装的 gcc 再编译即可。

如果希望打印更多 Debug 信息,可以在生成执行 cmake 时指定为 Debug,在运行 USKit 的过程中将会打出更详细的 log 信息,方便问题定位:

mkdir _build && cd _build && cmake -DCMAKE_BUILD_TYPE=Debug .. && make

注:打开该选项会影响性能,建议只在开发环境中使用。

USKit 代码目录结构

.
├── CMakeLists.txt
├── README.md
├── _build              # 编译产出,在该目录下修改配置文件以及运行 ./uskit 启动服务
│   ├── conf            # 配置目录
│   │   ├── us          # 对话机器人的配置,每个子目录对应一个具体业务场景下的对话机器人
│   │   │   └── demo    # USKit 教程示例的配置及配置生成工具
│   │   │       ├── options.py           # demo 场景里需要开发者自行配置的选项,如技能 ID,API Key 等
│   │   │       ├── conf_generator.py    # 根据 options.py 里声明的配置,自动生成所需配置文件
│   │   │       └── conf_templates       # 配置模板目录
│   │   ├── gflags.conf                  # USKit 启动参数默认参数配置
│   │   └── us.conf                      # USKit 本身相关的配置,用于指定加载的对话机器人
│   └── uskit           # USKit 主程序
├── conf                # 配置目录,编译成功后会被复制到 _build/conf
├── docs                # 详细文档
├── proto               # protobuf 文件
├── src                 # 源代码
└── third_party         # 第三方依赖目录

使用

USKit 主要通过配置来驱动中控的搭建和定制,使用方只需要配置对应目录下的 backend.confrank.conf 以及 flow.conf,然后重启服务即可生效。

新建对话中控

在 USKit 中,新建一个对话场景下的机器人中控,只需在 _build/conf/us 目录下新增对应的目录,例如,新增一个对话机器人 demo_service

mkdir -p _build/conf/us/demo_service

在该目录下,编写对应的配置文件:

  • backend.conf:指定需要接入的资源对应的请求构造和结果解析配置
  • rank.conf:召回结果的排序配置
  • flow.conf:中控整体对话流程的配置

注册对话中控

同时修改 us.conf,注册需要加载的对话机器人,新添如下一行:

load : "demo_service"

启动服务

进入 _build 目录运行 USKit:

./uskit

命令参数说明:

  • --port:指定 USKit 服务的端口,默认为 8888
  • --idle_timeout_s:指定 client 多少秒没有读/写操作即关闭链接,默认为 -1,即不关闭
  • --us_conf:指定 us.conf 的路径,默认为 ./conf/us.conf
  • --url_path:指定 USKit 服务的 url 路径,默认为 /us
  • --http_verbose: 在 stderr 输出 http 网络请求和返回的数据
  • --http_verbose_max_body_length: 指定 http_verbose 输出数据的最大长度
  • --redis_verbose:在 stderr 输出 redis 请求和返回的数据

成功启动 USKit 服务后,可以通过 <HOST>:8888/us 发起 HTTP POST 请求,请求体使用 json 格式,请求参数如下:

  • usid:指定需要请求的对话机器人中控 id,比如上文中创建的 demo_service
  • logid:每个请求对应 id,用于将上下游串起来的唯一 id,方便问题追踪定位
  • query:用户请求的 query
  • uuid:用户对应的 id,用于唯一区分一个用户

样例:

{"usid": "demo_service", "logid": "123456", "query": "北京今天天气怎么样", "uuid": "123"}

返回结果同样采用 json 格式,包含以下三个字段:

  • error_code:错误码
  • error_msg:具体错误信息
  • result:通过对话中控策略执行得到的请求响应

样例:

{"error_code": 0, "error_msg": "OK", "result": "好的"}

更多文档

FAQ

  1. 执行 deps.sh 的过程中 clone boost 失败导致后续依赖安装失败

    由于 boost 库较大,GitHub 访问较慢导致下载失败。可以在 boost 官网手动下载包至 third_party/ 并编译:

    tar -zxf boost_1_76_0.tar.gz && mv boost_1_76_0 boost
    cd boost
    mkdir -p _build/output
    ./bootstrap.sh --prefix=./_build/output
    ./b2 install

如何贡献

  • 欢迎提交任何问题到 Github Issues,可以是使用过程中遇到的问题、bug reporting 或者新需求的讨论。
  • 对于 issues 中的问题欢迎贡献并发起 pull request。
  • 定制新的自定义函数和策略,如果足够通用,可以提交 pull request 合入作为内置。

讨论

  • issue 发起问题讨论,如果是问题选择类型为问题即可。
  • 欢迎加入 UNIT QQ群(584835350)交流讨论。

Copyright and License

USKit is licensed under the Apache License, Version 2.0

More Repositories

1

amis

前端低代码框架,通过 JSON 配置就能生成各种页面。
TypeScript
17,235
star
2

uid-generator

UniqueID generator
Java
5,429
star
3

san

A fast, portable, flexible JavaScript component framework
JavaScript
4,708
star
4

lac

百度NLP:分词,词性标注,命名实体识别,词重要性
C++
3,864
star
5

braft

An industrial-grade C++ implementation of RAFT consensus algorithm based on brpc, widely used inside Baidu to build highly-available distributed systems.
C++
3,499
star
6

dperf

dperf is a DPDK based 100Gbps network performance and load testing software.
C
3,273
star
7

bfs

The Baidu File System.
C++
2,853
star
8

openrasp

🔥Open source RASP solution
C++
2,774
star
9

Familia

A Toolkit for Industrial Topic Modeling
C++
2,638
star
10

AnyQ

FAQ-based Question Answering System
C++
2,584
star
11

sofa-pbrpc

A light-weight RPC implement of google protobuf RPC framework.
C++
2,130
star
12

Senta

Baidu's open-source Sentiment Analysis System.
Python
1,889
star
13

tera

An Internet-Scale Database.
C++
1,887
star
14

bfe-book

In-depth Understanding of BFE《深入理解BFE》(Book for BFE, a CNCF open source project. both in English and in Chinese)
1,212
star
15

BaikalDB

BaikalDB, A Distributed HTAP Database.
C++
1,169
star
16

bigflow

Baidu Bigflow is an interface that allows for writing distributed computing programs and provides lots of simple, flexible, powerful APIs. Using Bigflow, you can easily handle data of any scale. Bigflow processes 4P+ data inside Baidu and runs about 10k jobs every day.
C++
1,142
star
17

DuReader

Baseline Systems of DuReader Dataset
Python
1,133
star
18

DDParser

百度开源的依存句法分析系统
Python
973
star
19

starlight

Java implementation for Baidu RPC, multi-protocol & high performance RPC.
Java
961
star
20

CUP

CUP, common useful python-lib. (Currently, Most popular python lib in baidu). Python 开发底层库, 涵盖util、service(threadpool/generator/executor/cache等等)、logging、monitoring、增强型配置 等等库支持
Python
938
star
21

ICE-BA

C++
700
star
22

NoahV

An efficient front-end application framework based on vue.js
JavaScript
639
star
23

EasyFaaS

EasyFaaS是一个依赖轻、适配性强、资源占用少、无状态且高性能的函数计算服务引擎
Go
620
star
24

Curve

An Integrated Experimental Platform for time series data anomaly detection.
JavaScript
530
star
25

Jprotobuf-rpc-socket

Protobuf RPC是一种基于TCP协议的二进制RPC通信协议的Java实现
Java
516
star
26

bifromq

A MQTT broker implementation adopting serverless architecture
Java
514
star
27

fast_rgf

Multi-core implementation of Regularized Greedy Forest
C++
466
star
28

babylon

High-Performance C++ Fundamental Library
C++
457
star
29

Dialogue

Python
444
star
30

Elasticsearch

Baidu Elasticsearch
Java
432
star
31

brcc

BRCC(better remote config center)是一个分布式配置中心,用于统一管理应用服务的配置信息,避免各类资源散落在各个项目中,简化资源配置的维护成本。作为一种轻量级的解决方案,部署简单,同时支持多环境、多版本、多角色的资源管理,可以在不改变应用源码的情况下无缝切换和实时生效配置信息。
Java
390
star
32

Cafe

A powerful test framework for Android
Java
370
star
33

mix-img

A fast mix image javascript tool libary
JavaScript
332
star
34

puck

Puck is a high-performance ANN search engine
Jupyter Notebook
331
star
35

unit-dmkit

C++
327
star
36

galaxy

Galaxy is a cluster management system.
C++
326
star
37

information-extraction

Python
325
star
38

knowledge-driven-dialogue

baseline system of knowledge driven dialogue competition
Python
270
star
39

CarbonGraph

A Swift dependency injection / lookup framework for iOS
Swift
254
star
40

BIPlatform

JavaScript
219
star
41

dlock

An effective and reliable Distributed Lock
Java
216
star
42

ins

iNexus, coordinate large scale services
C++
214
star
43

boteye

C++
212
star
44

titan-dex

Java
201
star
45

m-git

MGit 是一款基于 Git 的多仓库管理工具,可以安全的、高效的管理多个 Git 仓库; 适合于在多个仓库中进行关联开发的项目,实现批量的版本管理功能,提高 Git 操作的效率,避免逐个执行 Git 命令带来的误操作风险。
Ruby
166
star
46

Rubik

An Android platform component management tool chain, based on Kotlin language.
Kotlin
154
star
47

common

Common library
C++
132
star
48

go-lib

Go
126
star
49

titan-hotfix

Java
125
star
50

wx2

小程序互转工具
JavaScript
124
star
51

iot-sdk-c

device sdk for baidu IoT Core service, in c. Including MQTT client
C
118
star
52

Youtube-8M

PaddlePaddle models for Youtube-8M Video Understanding Challenge
Python
114
star
53

ar-sdk

DuMix AR SDK for Developer
GLSL
107
star
54

broc

Python
101
star
55

ITEST

Web service interface test framework
97
star
56

ote-stack

OTE-Stack is an edge computing platform for 5G and AI
Go
96
star
57

GPT

Java
87
star
58

redis

Baidu Ksarch Redis - a production solution of redis cluster
87
star
59

san-devtools

Browser developer tools extension for debugging San.
TypeScript
82
star
60

terminator

Service Virtualization
Java
76
star
61

QCompute

QCompute is a Python-based quantum software development kit (SDK). It provides a full-stack programming experience for advanced users via hybrid quantum programming language features and a high-performance simulator.
Python
76
star
62

spring-cloud-baidu

70
star
63

shuttle

A fast computing framework based on Galaxy
C++
64
star
64

iot-edge-sdk-for-iot-parser

C
64
star
65

baidu-iot-samples

C
61
star
66

san-store

Application States Management for San
JavaScript
59
star
67

ARK

Development framework of intelligent operation
Python
57
star
68

san-update

Object immutable update utility for san solution
JavaScript
56
star
69

logcover

轻量级异常日志测试覆盖率度量工具
Python
56
star
70

palo

A fast MPP database for all modern analytics on big data. Powered by Apache Doris(Incubating)
50
star
71

speech-samples

百度语音示例
Java
48
star
72

ntripcaster

C
43
star
73

san-router

Official Router for San
JavaScript
38
star
74

Quanlse

Jupyter Notebook
38
star
75

san-ssr

San SSR framework and utils
TypeScript
37
star
76

dm-kit-php

PHP
36
star
77

boteye_sensor

C
35
star
78

ipipe-agent

Java
33
star
79

OASP

OASP (Online App Status Protocol)
Java
32
star
80

san-composition

JavaScript
30
star
81

duedge-recipes

DuEdge百度边缘网络计算样例代码
JavaScript
27
star
82

paddle-on-k8s-operator

Kubernetes operator for managing the lifecycle of PaddlePaddle job.
Go
24
star
83

baiducloud-sdk-go

Go SDK for Baidu Cloud
Go
24
star
84

san-website

JavaScript
21
star
85

baiduads-sdk

Baidu Ads API SDK
Python
19
star
86

du1906_esp

DUHOME AIOT platform based on du1906 and esp32
C
18
star
87

highflip

HIGHFLIP: An easy way to bridge different federal learning platforms
18
star
88

smartapp-openapi-java

百度智能小程序服务端 OpenAPI SDK for java,是基于小程序服务端 OpenAPI 封装的一套让开发者方便使用的 SDK, 它可以帮开发者减少理解和使用 OpenAPI 的成本, 减少开发者直接调用服务端接口不当而引起的错误, 避免在开发中走弯路。
Java
16
star
89

san-factory

JavaScript
15
star
90

ttm

C
14
star
91

cluster-api-provider-baiducloud

Kubernetes cluster-api for Baidu Cloud
Go
13
star
92

minions

Baidu 100G Chasiss Switch hardware spec
11
star
93

signet

签章系统
JavaScript
10
star
94

sgxray

SGXRay: a bounded verifier for Intel SGX enclaves
C
10
star
95

grafana-tsdb-datasource

JavaScript
9
star
96

iotcore-sdk-java

Java SDK for baidu IoT Core service
Java
9
star
97

bce-fpga-dev-kit

VHDL
8
star
98

iot

for all code about Internet of Things
8
star
99

smartapp-openapi-go

百度智能小程序服务端 OpenAPI SDK for go,是基于小程序服务端 OpenAPI 封装的一套让开发者方便使用的 SDK, 它可以帮开发者减少理解和使用 OpenAPI 的成本, 减少开发者直接调用服务端接口不当而引起的错误, 避免在开发中走弯路。
Go
8
star
100

duedge-cli

DuEdge Command Line
Python
6
star