Vibe|开源本地多媒体转录处理工具安装版 v3.0.19

Vibe是一款专注于自主转录的开源多媒体处理工具。它以高效的语音识别算法为核心，支持几乎所有主流语言的转录。不同于其他工具，Vibe 强调“本地优先”：所有的计算都在你的电脑（GPU/CPU）上完成。从简单的麦克风录音整理到复杂的电影级字幕制作，它提供了一套完整的生产力解决方案。

软件图片

软件特色

🔒 绝对隐私，全线离线：数据永远不会离开你的设备。无需联网即可完成高质量转录，是处理敏感资料的理想选择。
🚀 GPU 加速全制霸：针对 macOS (CoreML)、Windows 和 Linux (Vulkan) 进行了深度优化。无论你使用的是 Nvidia、AMD 还是 Intel 显卡，都能体验到闪电般的转录速度。
🎙️ 全能素材抓取
- 本地文件：支持批量转录多个音视频文件。
- 网页音频：一键抓取 YouTube、Facebook、Twitter 等流行平台的音频进行转录。
- 系统与麦克风：支持录制系统内部声音或通过麦克风实时输入。
🧠 AI 智能联动
- Ollama 支持：通过本地 AI 引擎（Ollama）对转录文本进行总结和分析，真正实现全流程本地化 AI 工作流。
- Claude 集成：也支持使用 Claude API 获取更精准的多语言摘要。
📝 专业级导出规范：支持导出 SRT、VTT 字幕格式，以及 TXT、PDF、DOCX 等办公文档格式。
🎬 电影级时间轴：内置 VAD（语音活动检测）驱动的稳定时间戳模式，专门为视频剪辑和 Reels 优化字幕长度。
👥 说话人识别 (Diarization)：自动区分并标记不同的发言人，让会议记录一目了然。
🛠️ 开发者与高级
- CLI 支持：提供完整的命令行接口，方便接入自动化脚本。
- HTTP API：内置 Swagger 文档，支持作为服务器运行，为其他应用提供转录接口。

软件教程

选择模式：选择“文件导入”、“系统音频”或“麦克风”作为输入源。
配置模型：在设置中选择适合你硬件的 Whisper 模型（支持自定义模型链接）。
开始转录：点击开始，右侧会实时预览转录文本。
AI 分析：转录完成后，点击总结按钮，调用本地 Ollama 模型生成要点摘要。
导出成果：根据需要选择导出为带时间轴的字幕文件或结构化的 PDF 文档。

版本日志

v3.0.19

🎙️ Remember selected audio device across sessions
🧠 Improved CPU compatibility check (clear message if AVX2 is not supported)
📂 Fix batch transcription when folders contain files without extensions
🔌 Properly stop background audio process when quitting the app
⚙️ Various internal improvements and cleanup