使用 Faster-whisper 模拟实时语音转写

faster-whiper 模拟实时语音转写流程

使用方法

服务端

git clone https://github.com/ultrasev/stream-whisper
apt -y install libcublas11
cd stream-whisper
pip3 install -r requirements.txt

注：

libcublas11 是 NVIDIA CUDA Toolkit 的依赖，如果需要使用 CUDA Toolkit，需要安装。
经 @muzian666 提示，aioredis 包目前仍然不支持 Python3.11，Python 版本建议 3.8 ~ 3.10

把 .env 文件中的 REDIS_SERVER 改成自己的 Redis 地址，然后运行 python3 -m src.server，服务端就启动了。第一次执行时，会从 huggingface 上下载语音识别模型，需要等待一段时间。Huggingface 已经被防火墙特别对待了，下载速度很慢，建议使用代理。

客户端

git clone https://github.com/ultrasev/stream-whisper
apt -y install portaudio19-dev
cd stream-whisper
pip3 install -r requirements.txt

注：

portaudio19-dev 是 pyaudio 的依赖，如果系统已安装，可以忽略。

同样需要把 .env 文件中的 REDIS_SERVER 改成自己的 Redis 地址，在本地机器上运行 python3 -m src.client，客户端就启动了。运行前先测试一下麦克风是否正常工作，确认能够正常录音。

可优化方向

缩短静音间隔，提高实时性。默认静音间隔是 0.5 秒，可以根据自己的需求在 client.py 中调整。
使用更好的语音识别模型，提高识别准确率。

Q&A

Redis 地址怎么搞？

自己有带有公网 IP 的服务器的话，使用 docker 可以很方便的创建一个；
或者通过 redislabs 注册账号，创建一个免费实例，获取连接信息。免费实例有 30M 内存，足够使用。建议选择日本 AWS 区域，延迟低。

为什么要用 Redis？

Redis 不是必须的，从 client 端往 server 端传输数据，有很多种方法，可以根据自己的需求选择。

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
docs		docs
src		src
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

使用 Faster-whisper 模拟实时语音转写

使用方法

服务端

客户端

可优化方向

Q&A

Redis 地址怎么搞？

为什么要用 Redis？

About

Releases

Packages

Languages

SniperM99/stream-whisper

Folders and files

Latest commit

History

Repository files navigation

使用 Faster-whisper 模拟实时语音转写

使用方法

服务端

客户端

可优化方向

Q&A

Redis 地址怎么搞？

为什么要用 Redis？

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages