【github 有趣项目】语音识别 Buzz 本地计算机上离线转录和翻译音频文件应用
Buzz 是一个开源的桌面应用程序(使用python开发,依赖PyQt6 、openai-whisper、pyinstaller 、torch、whisper.cpp、ffmpeg、ffprobe等库),旨在在本地计算机上离线转录和翻译音频文件,支持 macOS、Windows 和 Linux 系统。该项目由 Chidi Williams 开发,利用 OpenAI 的 Whisper 模型进行语音
Buzz
-
Buzz 是一个开源的桌面应用程序(使用python开发,依赖PyQt6 、openai-whisper、pyinstaller 、torch、whisper.cpp、ffmpeg、ffprobe等库),旨在在本地计算机上离线转录和翻译音频文件,支持 macOS、Windows 和 Linux 系统。该项目由 Chidi Williams 开发,利用 OpenAI 的 Whisper 模型进行语音识别和翻译。
-
优点:支持多种Hugging Face、OpenAI等多个whisper库,支持默认导出文件名偏好设置,支持GPU推理等
-
缺点:Windows系统上安装包1.5G,安装完成需要5.03G空间(不包含模型参数文件)。如不经常使用,推荐网页端侧离线推理的 whisper-web(https://huggingface.co/spaces/Xenova/whisper-web),模型参数数据也会保留在电脑本地,每次运行无需重新下载,但当前的whisper-web仅支持tiny和base模型。
特性:
- 离线转录与翻译
- 多语言支持
- 跨平台兼容
- CUDA GPU 加速支持
安装
Windows
-
下载安装程序:访问 GitHub Releases 页面 下载最新的
.exe安装文件。 -
通过 Winget 安装:
winget install ChidiWilliams.Buzz
其他系统
macOS
-
通过 Homebrew 安装:
brew install --cask buzz -
从 App Store 下载:适用于 Apple Silicon 的用户可从 App Store 获取原生版本,提供更好的性能和用户体验。([chidiwilliams.github.io][5])
Linux
-
通过 Snap 安装:
snap install buzz -
从源代码安装:高级用户可克隆 GitHub 仓库 并按照文档进行构建和安装。
使用
安装





使用

- 双击查看结果和导出文件

更多推荐




所有评论(0)