• Stars
    star
    353
  • Rank 120,322 (Top 3 %)
  • Language
    Python
  • License
    MIT License
  • Created over 4 years ago
  • Updated almost 4 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

一款电脑语音输入工具,运行后,按下大写锁定键超过 0.3 秒,就开始语音识别,松开按键之后,自动输入识别结果。

Gitee | Github

icon.ico Caps Writer

💡 简介

这是一款电脑端语音输入工具。顾名思义,Caps Writer 就是按下大写锁定键来打字的工具。它的具体作用是:当你长按键盘上的大写锁定键后,软件会开始语音识别,当你松开大写锁定键时,识别的结果就可以立马上屏。

对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。

目前软件内置了对阿里云一句话识别 API 的支持。如果你要使用,就需要先在阿里云上实名认证,申请语音识别 API,在设置页面添加一个语音识别引擎。

添加其它服务商的引擎也是可以做的,只是目前阿里云的引擎就够用,还没有足够的动力添加其它引擎。

具体使用效果、申请阿里云 API 的方法,可以参考我这个视频: CapsWriter 2.0 使用视频

添加上引擎后,在主页面选择一个引擎,点击启用按钮,就可以进行语音识别了!

启用后,在实际使用中,只要按下 CapsLock 键,软件就会立刻开始录音:

  • 如果只是单击 CapsLock 后松开,录音数据会立刻被删除;
  • 如果按下 CapsLock 键时长超过 0.3 秒,就会开始连网进行语音识别,松开 CapsLock 键时,语音识别结果会被立刻输入。

所以你只需要按下 CapsLock 键,无需等待,就可以开始说话,因为当你按下按下 CapsLock 键的时候,程序就开始录音了,只要你按的时长超过 0.3 秒,就肯定能识别上。说完后,松开,识别结果立马上屏。

image-20201225053752740

⭐技巧

在设置界面,将 点击关闭按钮时隐藏到托盘 选项勾选,就可以将软件隐藏到托盘栏运行:

image-20201225140607971

📝 背景

对于直到 0202 年,仍然没有开发者做过一个好用的语音输入工具,我又生气又无奈,毕竟这东西不赚钱,自然没有人做。

有人建议用搜狗输入法、讯飞输入法的语音输入,但这几个方面是真让人受不了:

  • 广告太多的软件,拒绝安装
  • 速度慢,讯飞在手机上的语音输入挺快的,但是在 PC 上的语音识别速度超级慢
  • 就以搜狗输入法为例,它的语音输入快捷键只能是Ctrl + Shift + A/B/C……,有以下槽点:
    • 这个快捷键会和许多软件的快捷键冲突,且不好记
    • 打字时,按这样三个快捷键,手指很别扭,不爽
  • 讯飞语音输入法的快捷键是 F6,只能换成 F 功能键,离手指太远,不好够,同时和许多软件快捷键冲突

🔮 开箱即用

Windows 小白用户,只需要在 Gitee ReleasesGithub Releases 界面下载打包好的压缩文件,解压,执行里面的 exe 文件,就可以运行了,在设置界面新建引擎,填入你在阿里云中申请的:

  • 拥有 管理智能语音交互(NLS) 权限的 RAM访问控制 用户的 Accesskey IdAccesskey Secret
  • 智能语音交互语音识别项目的 appkey

就可以正常使用了。

详细申请、填写 API 的步骤请到 CapsWriter 2.0 使用视频 查看视频教程。

Mac 和 Linux 用户,你们也可以使用,只是我没有 Mac 和 Linux 的电脑,无法打包。需要你们下载源代码、安装依赖库,再打包或者直接运行。

🛠 源代码使用

小白下载的 Release 其实是用 pyinstaller 导出的 exe 文件,如果你需要在源码基础上使用,就需要安装以下模块:

  • keyboard (用于监听键盘输入)
  • pyaudio (用于接收录音)
  • PySide2 (图形界面框架)
  • aliyun-python-sdk-core (阿里云 sdk)
  • alibabacloud-nls-java-sdk (阿里云智能语音引擎 sdk)

其中:

  • pyaudio 在 windows 上不是太好安装,可以先到 这个链接 下载 pyaudio 对应版本的 whl 文件,再用 pip 安装,Mac 和 Linux 上需要先安装 port audio,才能安装上 pyaudio
  • alibabacloud-nls-java-sdk 是指阿里云官方 java sdk 的 python 实现,它不是通过 pip 安装的(官方没有上传到 pypi ),而是通过 阿里云官方文档的方法 进行安装。
  • 其它模块使用 pip 安装即可

本文件夹内有一个 安装指南 文件夹,在里面可以找到详细的安装指南,还包括了提前下载的 alibabacloud-nls-python-sdkpyaudio 的 whl 文件。

打赏

万水千山总是情,一块几块都是情。本软件完全开源,用爱发电,如果你愿意,可以以打赏的方式支持我一下:

sponsor

😀 交流

如果有软件方面的反馈可以提交 issues,或者加入 QQ 群:1146626791

More Repositories

1

QuickCut

Your most handy video processing software
Python
2,343
star
2

CapsWriter-Offline

CapsWriter 的离线版,一个好用的 PC 端的语音输入工具
Python
1,375
star
3

QuickHand

快速的仿手写文字的图片生成器。基于 https://github.com/Gsllchb/Handright/ 的 GUI。
Python
364
star
4

color-trace

将位图转为彩色矢量 svg 图片
Python
145
star
5

JumpCutter2

使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。
Python
125
star
6

ali-audio-to-srt

功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕
Python
105
star
7

Protect-Windows-Context-Menu

Batchfile
85
star
8

Markdown-Toolbox

Move your Markdown to another folder along with it's relatively refered pics and attachments.
Python
57
star
9

PyInstaller-Perfect-Build-Method

如果我要写一个 Python 项目,打包成 exe 运行(方便在没有 Python 的电脑上使用),我需要打包出的根目录结构美观,没有多余的、杂乱的依赖文件在那里碍眼,而且需要在发现 bug 时,我还需要能够修改里面的代码后,无需再次打包,就能正常运行,该怎么做呢? 就以一个 Hello 项目为例,记一下我找到的完美方法。
Python
51
star
10

ShortcutMapper_Chinese

可视化、交互式的快捷键映射图,中文版本,可以直观地查找快捷键。不懂编程也可以方便地修改、添加快捷键。
HTML
41
star
11

web_remote_input

JavaScript
32
star
12

MakePracticeBook

为考研习题册制作好用的「做题本」
Python
14
star
13

FunASR-Online-Paraformer-Test

Python
13
star
14

RcloneVault

Crypt-type remote of rclone can be used as users File Vault, and this script is ment to make managing, editing, opening and closing File Vaults easier.
Python
8
star
15

audio-video-resync

功能: 通过波形比较,得到两个音频的时间戳偏移值,合成新视频。 用途示例: 录制 vlog 时,使用录音笔实现更好的收声,再将相机的视频与录音笔的录音同步。
Python
7
star
16

ali-audio-text-sync

Python
6
star
17

Chinese-ITN

中文逆文本正则化 (Chinese ITN, Chinese Inverse Text Normalization) ,即将文本中的中文数字转为阿拉伯数字。
Python
6
star
18

my-photo-storage-backup-scheme

my-photo-storage-backup-scheme
Python
5
star
19

windows-batch-script

我收集、自己写的 Windows 下的 bat 脚本
HTML
4
star
20

blink-prompt

让屏幕主动提示你眨眼,避名长时间不眨眼而患上「干眼症」
Python
4
star
21

JumpCutter-Improved

Python
4
star
22

QuickMath

顾名思义,Quick Math 是用于快速输入数学公式的一个工具。在软件上手写公式,然后通过云api识别。
Python
4
star
23

python-template

My python program template
Python
2
star
24

baidu-ime-skin-manage-tool

Python
2
star
25

SubWriter

用 Paraformer 离线生成分段良好的字幕,能用了,但暂时无力写文档
Python
2
star
26

wubi86-revert-query

86五笔反查
Python
1
star
27

ytb-vtt-to-srt

Convert a YouTube vtt subtitle to srt format.
Python
1
star
28

my-pay-code-three-in-one-

我的付款码
HTML
1
star