• Stars
    star
    205
  • Rank 191,264 (Top 4 %)
  • Language
    Python
  • License
    MIT License
  • Created over 6 years ago
  • Updated over 2 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

骂丫--对骂机器人。君子动口不动手,科技改变骂丫

Maya(骂丫) -- 对骂机器人

君子动口不动手,科技改变骂丫

为什么做对骂机器人?

本能也好,陋习也罢,“脏话”伴随着每一个人。 纵使很多积极的情绪,表达的时候若不带点脏话,就特么的没了味道。

操你妈昨天吃了两个红心火龙果,早上撒尿变成红色,吓死爸爸了。
-- 请听题:是谁吃了火龙果,又是谁受到了惊吓?

理解充斥着脏字的自然语言,是每一个对话机器人绕不过的坎。

作为一个对话机器人,收到用户的“脏话”也是不可避免的。我做了一个彩票的客服机器人,每周都会收到很多国骂。

彩票用户脏话

堵,不如疏。

  1. 做一个对骂机器人,跟丫的正面硬刚。
  2. 对骂不是目的,关键是能够更好的理解带有脏话的对话的语义的能力。
  3. 骂到最 high 处,戛然而止,然后开始哄。看看多久能哄好。-- 客服之本。

我们既要有核武器,又要有不首先使用核武器的克制。

开发环境搭建

  • python 3.7
  • MongoDB
pip install -r requirements.txt

导入初始的数据集

$ cd corpus_builder/merger
$ python merge_raw.py
dropping existing data
importing 1juzi
importing manually_data
5823 records imported

数据集如何被构建的:corpus_builder.Readme

阅读材料

More Repositories

1

captcha-tensorflow

Image Captcha Solving Using TensorFlow and CNN Model. Accuracy 90%+
Jupyter Notebook
992
star
2

money-maker-apps

我认为有赚钱能力的开源小程序、个人网站
JavaScript
891
star
3

paper-reading

比做算法的懂工程落地,比做工程的懂算法模型。
Jupyter Notebook
194
star
4

renren

人人网信息抓取与数据挖掘。social network analysis
Python
94
star
5

bookhub

eBook manager and sharing tools
Python
91
star
6

wechat-notification

通过微信公众号, 将通知信息推送至个人微信. 无需认证公众号, 可群发.
Python
58
star
7

personalization-vocabulary

根据个人的英语水平、兴趣和经常阅读的文章, 自动创建一个自定义的生词库,供背单词使用。
Python
33
star
8

distributed-vertical-crawlers

分布式垂直爬虫框架 & 爬虫们
Python
15
star
9

pages

一个月黑风不高的夜晚,接到一单外包。通宵写了这 270 行代码,赚了 1 万。
HTML
14
star
10

porn-hot-classification

Tensorflow 版本的图片鉴黄。not suitable/safe for work (NSFW) images detection using Tensorflow
Jupyter Notebook
13
star
11

football

足彩爬虫与数据分析
Python
12
star
12

dianping-crawler

大众点评网爬虫
HTML
10
star
13

hands-on-deep-learning-using-tensorflow-2.0

重读 CNN 网络的经典论文,并用 tensorflow 2.0 手撸一遍经典模型,感受一下实测数据
Jupyter Notebook
9
star
14

wechat-broker-bot

微信消息转发器
Python
7
star
15

mcm_latex_template

美赛数学建模论文 latex 模板 2010年 H 奖
6
star
16

django2-python3-docker-tmpl

Python3 & Django2 web 项目通用模板。docker & 微服务部署
Python
6
star
17

parenting

育儿的图书、文章、攻略和一页纸计划
5
star
18

ansible-playbooks

管理个人开发环境、服务器资源的 playbook 们
Shell
5
star
19

topology

树形结构展示网络拓扑图
JavaScript
5
star
20

projects-in-one

我的独立项目,都在这里。
JavaScript
5
star
21

media-of-lean-read

lean-read media与数据库备份
Shell
5
star
22

PerfTrack

linux 性能监控与图像显示。启动、关闭 sar 监控系统运行状态,并将性能运行信息写入文件; 显示滤波后的性能曲线;清理数据文件。
Python
5
star
23

interview-questions

HTML
2
star
24

vimrc

vim 配置备份
C++
2
star
25

shadowsocks-proxychains4-openvpn

文章最早发在知乎上,被和谐了。在这里做个备份
2
star
26

reading-more-books

我的读书笔记
2
star
27

score-now

实时比分与赔率信息
JavaScript
1
star
28

lottery-article-writer

rubbish
Python
1
star
29

dataset-repo

collection of datasets for deep learning
Python
1
star
30

compile_latex

latex 自动编译脚本
Shell
1
star
31

public-wechat-proxy

微信公众号消息 proxy
Python
1
star
32

iTableOcr

基于深度学习的 Table 信息提取框架
Python
1
star
33

paper-pipe

科技论文的下载、数据清洗与信息提取,试着碰撞一下好玩的思路💥
Python
1
star