首页 >电脑软件 > CapsWriter离线识别语音输入工具 绿色版
CapsWriter离线识别语音输入工具 绿色版

CapsWriter离线识别语音输入工具 绿色版

软件大小:1.2GB

软件语言:简体中文

软件类别:应用工具

更新时间:2026-01-23 15:31:12

版本:

应用平台:Windows平台

  • 软件介绍
  • 软件截图
  • 相关软件
  • 相关阅读
  • 下载地址

CapsWriter离线识别语音输入工具绿色版,亮点在于离线使用且绿色无负担。它摆脱网络限制,随时开启语音输入。我超喜欢它的精准识别功能,之前写文章时,遇到灵感突发但打字慢的情况,用它直接语音输入,语句识别又快又准,迅速把灵感转化成文字,大大提高了写作效率,让创作过程更加流畅。

这是 CapsWriter 简陋的离线版,一个 PC 端的语音输入工具。

运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。

安装说明

安装 Python 后,在 cmd 窗口进入本文件夹,运行 pip install -r requirements.txt 安装依赖

sherpa-onnx-bin 文件夹中已经放置了在 Win10-64 端预先编译的 sherpa-onnx 二进制。

其它系统暂时需要按照 sherpa-onnx — sherpa 1.2 documentation 编译后,放入 sherpa-onnx-bin 文件夹。

运行和使用

运行 01sherpa-onnx-server.py 脚本,会载入 Paraformer 模型识别模型(这会占用1GB的内存,载入时长约十几秒)

运行 02-CapsWriter-client.py 脚本,它会打开系统默认麦克风,开始监听按键

按住 CapsLock 键,录音开始,松开 CapsLock 键,录音结束,识别结果立马被输入(录音时长短于0.3秒不算)

注意事项

目前使用的模型是 Paraformer 非实时模型,即录完再转,因此录音时间越长,上屏延迟越大。

主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每 10s 录音需 0.6s 转录时长。

本地模型对算力要求非常低,基本无需担心性能问题

暂不支持标点符号,暂不支持逆标准化(如把中文数字转阿拉伯数字)

为方便用户检查录音质量、识别效果,脚本默认开启了保存录音,所有都被保存在了 audios 文件夹

软件截图
  • CapsWriter离线识别语音输入工具 绿色版
  • CapsWriter离线识别语音输入工具 绿色版下载地址

相关软件

相关阅读