Vibe是一款专注于自主转录的开源多媒体处理工具。它以高效的语音识别算法为核心,支持几乎所有主流语言的转录。不同于其他工具,Vibe 强调“本地优先”:所有的计算都在你的电脑(GPU/CPU)上完成。从简单的麦克风录音整理到复杂的电影级字幕制作,它提供了一套完整的生产力解决方案。
软件图片


软件特色
- 🔒 绝对隐私,全线离线:数据永远不会离开你的设备。无需联网即可完成高质量转录,是处理敏感资料的理想选择。
- 🚀 GPU 加速全制霸:针对 macOS (CoreML)、Windows 和 Linux (Vulkan) 进行了深度优化。无论你使用的是 Nvidia、AMD 还是 Intel 显卡,都能体验到闪电般的转录速度。
🎙️ 全能素材抓取
- 本地文件:支持批量转录多个音视频文件。
- 网页音频:一键抓取 YouTube、Facebook、Twitter 等流行平台的音频进行转录。
- 系统与麦克风:支持录制系统内部声音或通过麦克风实时输入。
🧠 AI 智能联动
- Ollama 支持:通过本地 AI 引擎(Ollama)对转录文本进行总结和分析,真正实现全流程本地化 AI 工作流。
- Claude 集成:也支持使用 Claude API 获取更精准的多语言摘要。
- 📝 专业级导出规范:支持导出 SRT、VTT 字幕格式,以及 TXT、PDF、DOCX 等办公文档格式。
- 🎬 电影级时间轴:内置 VAD(语音活动检测)驱动的稳定时间戳模式,专门为视频剪辑和 Reels 优化字幕长度。
- 👥 说话人识别 (Diarization):自动区分并标记不同的发言人,让会议记录一目了然。
🛠️ 开发者与高级
- CLI 支持:提供完整的命令行接口,方便接入自动化脚本。
- HTTP API:内置 Swagger 文档,支持作为服务器运行,为其他应用提供转录接口。
软件教程
- 选择模式:选择“文件导入”、“系统音频”或“麦克风”作为输入源。
- 配置模型:在设置中选择适合你硬件的 Whisper 模型(支持自定义模型链接)。
- 开始转录:点击开始,右侧会实时预览转录文本。
- AI 分析:转录完成后,点击总结按钮,调用本地 Ollama 模型生成要点摘要。
- 导出成果:根据需要选择导出为带时间轴的字幕文件或结构化的 PDF 文档。
版本日志
v3.0.19
🎙️ Remember selected audio device across sessions
🧠 Improved CPU compatibility check (clear message if AVX2 is not supported)
📂 Fix batch transcription when folders contain files without extensions
🔌 Properly stop background audio process when quitting the app
⚙️ Various internal improvements and cleanup
软件下载
开源地址:https://github.com/thewh1teagle/vibe
夸克网盘:https://pan.quark.cn/s/7166fc046a51
迅雷网盘:https://pan.xunlei.com/s/VOrXZuhyKbuPMcIsiAYo54QyA1?pwd=43yn#
百度网盘:https://pan.baidu.com/s/1wqns1gGDbZdXn6h-XET11Q?pwd=z79a 提取码: z79a
本地下载
电报频道:https://t.me/gongjuji_org
代理节点:优质代理节点
安全声明:本站分享的部分软件属于破解激活软件,可能会被杀毒软件误删,这属于正常现象,在意的可以选择不使用破解版!
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,工具集所有文章均包含本声明。

