OpenWhispr:基于 Whisper 的本地转录工具,适用于 macOS
OpenWhispr,来自Gizmo Labs Inc.,是一款macOS转录应用程序,旨在将录制的音频和视频转换为可搜索的文本,同时保持所有处理在用户的机器上。该应用程序使用Whisper模型转录和翻译超过100种语言,生成时间编码的字幕文件,并接受排队的文件批次。它支持拖放导入、常见的音频/视频格式和Apple Silicon加速,使其适合需要私密、本地转录工作流程的记者、法律专业人士、研究人员和学生。
你实际上可以用它做什么任务?
OpenWhispr 旨在进行转录、翻译和字幕生成,适用于录制的内容,如访谈、讲座和会议。该工具生成可搜索的纯文本转录本和与 SRT 和 VTT 格式兼容的时间编码字幕文件,并包括一种翻译模式,可以从非英语音频输出英语文本,使其适合后期制作和研究工作流程。
实际转录的准确性如何?
该应用程序使用开发者描述为高准确度的 Whisper 模型,macOS 用户社区称赞其与网络服务相比的可靠输出。准确性和说话者分离因所选模型而异:分离质量取决于会话中使用的特定 Whisper 变体,因此多说话者标记在所有运行中并不能保证达到相同水平。
你应该期待什么输入格式和系统限制?
OpenWhispr 接受常见的音频和视频文件类型,并且没有软件强制的文件长度限制;实际限制是可用的磁盘空间和 Mac 的处理能力。支持的格式包括:
系统要求从 macOS 13.0 开始;该应用程序可以在 Intel Mac 上运行,但针对 M 系列硬件进行了优化,以实现更快的吞吐量。
它适合隐私敏感的专业工作流程吗?
OpenWhispr 强调离线处理模型,没有服务器端组件,这消除了在初始模型下载后转录步骤中的云上传。该应用程序提供多个文件的批量排队,并集成到 Mac 环境中,开发者将其定位为适合优先考虑对录音和转录本的本地控制的记者、法律团队和研究人员。
注重隐私的转录清晰选择,带有人工审核的警告
OpenWhispr 是一个适合专业人士的选项,能够生成本地的机器转录和字幕导出,同时将录音保留在设备上。对于清晰的录音,期望强大的自动输出,但对于高风险或法律敏感的材料,计划进行人工验证。将其作为一个生产阶段的工具,减少手动输入,同时保持人工参与最终检查。
赞成
- 设备上的 Whisper 处理保持录音本地
- 转录和翻译超过100种语言
- 导出带时间编码的 SRT 和 VTT 字幕文件
- 将多个文件排队进行批量转录
反对
- 说话者区分质量取决于所选择的 Whisper 变体
- 在 M 系列 Apple Silicon 芯片上性能最佳
- 离线使用前需要下载初始模型