• Stars
    star
    580
  • Rank 77,010 (Top 2 %)
  • Language
  • License
    GNU General Publi...
  • Created almost 6 years ago
  • Updated 4 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

语音识别理论、论文和PPT

ASR_Theory

对于近研一期间所学进行总结,包括理论部分和实践部分,之间主要包括本人认为比较好的论文,以及也有自己的看法
个人博客 包含自己近期的学习总结

PPT and Papers

ppt主要包括本人研一期间使用kaldi语音识别工具构建GMM-HMMNN-HMM语音识别声学模型
论文主要包括一些研一到到现在所看的论文,之后还会不定期更新论文,如果对理论比较感兴趣的同行可以持续关注

INTERSPEECH Google'PPT

其中包含谷歌开源的18年INTERSPEECH的PPT,个人觉得写得非常棒,系统

DL 总结

下面这幅图片是自己对于深度学习近期的网络进行总结,可以用本人在github开源仓库中的两个项目实现
(1)ASR_Syllable:以音节为建模单元构建语音识别声学模型
(2)ASR_WORD以字为建模单元构建语音识别声学模型
(3)ASR_Phone以字为建模单元构建语音识别声学模型
深度学习模型汇总

More Repositories

1

ASR_Syllable

基于卷积神经网络的语音识别声学模型的研究
Python
169
star
2

ASR_WORD

采用端到端方法构建声学模型,以字为建模单元,采用DCNN-CTC网络结构。
Python
71
star
3

kaggle-cats-and-dogs

采用深度学习方法进行图像识别,数据集为kaggle数据集中的猫与狗数据集。
Python
52
star
4

video-action-recognition

视频动作识别,基于C3D网络构建
Python
29
star
5

image-recognition

采用深度学习方法进行刀具识别。
Python
23
star
6

ASR_Phone

以音素建模构建NN-CTC声学模型
Python
15
star
7

agriculture_recognition

AI挑战赛,农作物识别,已经做好数据处理,模型训练等部分,由于时间原因交由实验室师弟进行优化。
Python
9
star
8

cloud-recognition

采用深度学习方法,进行6分类云彩识别,识别率为73.17%,比赛用
Python
7
star
9

NMT_Keras

Using seq2seq to convert Spanish to English
Python
5
star
10

Pytorch_Learning

采用Pytorch深度学习框架,使用MNIST数据集进行实验
Python
2
star
11

stcmds-kaldi

nn-hmm for stcmds
Shell
2
star
12

ASR_Transformer

A Pytorch implementation of Speech Transformer, an End-to-End Automatic Speech Recognition with Transformer Network, Which directly converts acoustic features to character sequence using a signal neural network.
2
star
13

face-recognition

采用深度学习Triplet网络进行人脸识别,参照师兄留下的脚本进行一步一步分析。
1
star
14

SparseSelfAttention

Sparse Attention Mechanism, accepted in KSC 2019
Python
1
star
15

Voiceprint_Recognition

Just for DACAS 2019 and for studying AI
Python
1
star
16

asr

中文语音识别系统,在西安电子科技大学某位大神的脚本上进行改进模型。
1
star