Speech Algorithms
目录
语音前端算法
标题 | 原文 | 代码 |
---|---|---|
语音降噪初探——谱减法 | Link | Code |
基于Mask的语音分离 | Link | Code |
生成有噪声/回声/混响/啸叫的混合语音样本 | Link | Code |
解析自适应滤波回声消除 | Link | Code |
使用AMR编解码器生成VAD的标签 | Link | Code |
使用TDOA进行声源定位 | Link | Code |
以任意频率重采样语音信号 | Link | Code |
音频数字水印的嵌入和提取 | Link | Code |
语音变速和变调 | Link | Code |
分帧,加窗和DFT | Link | Code |
WebRTC VAD流程解析 | Link | Code |
基于卡尔曼滤波器的回声消除算法 | Link | Code |
WebRTC ANR流程解析 | Link | Code |
WebRTC AGC流程解析 | Link | Code |
WebRTC AEC流程解析 | Link | Code |
使用互相关进行音频对齐 | Link | Code |
基于音频指纹的听歌识曲系统 | Link | Code |
戈泽尔算法 | Link | Code |
DNN单通道语音增强 | Link | Code |
使用LSTM进行端点检测 | Link | Code |
CGMM-MVDR | Link | Code |
AI降噪的N种数据扩增方法 | Link | Code |
生成丰富的啸叫样本 | Link | Code |
语音后端算法
标题 | 原文 | 代码 |
---|---|---|
使用CNN进行简单的指令识别 | Link | Code |
说话人性别识别 | Link | Code |
使用XGBoost进行环境声音分类 | Link | Code |
生成下雨的声音 | Link | Code |
语音编解码器
标题 | 原文 | 代码 |
---|---|---|
基于深度学习语音编解码器 | Link | Code |
语音编解码器考古之G.711 | Link | Code |
语音评价标准
标题 | 原文 | 代码 |
---|---|---|
语音客观评价标准——语音质量评价 | Link | Code |
语音可懂度评估(一)——基于清晰度指数的方法 | Link | Code |
语音相似度评价 | Link | Code |