现今虽然已经有不少语音转文字的免费工具,可以将开会、演讲等录音快速转成逐字稿,但大多都是手机 App 版本,如:雅婷逐字稿,线上工具也有,但基本上都要收费,这篇就要推荐一个 Mac 版且基於 OpenAI Whisper 开发的 MacWhisper 免费工具,支援多种档案格式,包括影片格式,甚至连 YouTube 影片也没问题(但只有 MacWhisper Pro 可用)。
MacWhisper 透过 AI 来帮你语音转文字的免费工具,基於 OpenAI Whisper
- 点我取得 MacWhisper 免费工具
MacWhisper 是一款由 Jordi Bruin 开发的免费工具,没在 App Store 上架,需要到开发者页面中取得。进到软体介绍页面後,点击右侧的 MacWhisper,也就是 0 元那一个,Pro 付费版可使用完整功能,包括速度更快的模型和 YouTube:
需要填写电子邮件地址,填完之後按获取:
接着就会获得软体载点和序号,但序号好像不用输入,软体下载後可以直接使用(我是这样):
下载後打开,因为是从网路上下载的工具,首次打开会跳出这讯息,按打开:
接着选择你要下载使用的模型,上方是支援多国语言(Multiple Languages),包括繁体中文,下方则是只有英文(English Only),而免费用户的多国语言只能使用 Tiny、Base 和 Small,Small 的准确度最高但速度适中,不是最快,这我是觉得还好,我测试 15 分钟左右的影片,大概 1 分 10 秒就完成,还可以接受:
既然模型需要下载,那也代表这个 AI 语音转文字动作,都是在本地完成,不需要上传到伺服器之类,就安全性来说相当不错。
下载好後会移到上方,不满意的话也能按 Delete 手动删除:
下图就是软体介面,支援 YouTube URL 网址、打开档案(直接拖曳到视窗也没问题)、以及新的录制活动。档案部分支援 MP3、WAV、M4A、MP4 和 MOV 格式:
YouTube 网址目前仅支援 Pro 付费会员,免费会员转换时会跳出这讯息:
另外如果你改用本地档案,却一样跳出这个讯息的话,请重开软体,重开就能解决。
我测试 15 分钟档案,1 分多钟就完成。有一点要注意是,目前中文的档案名称还不支援,如果你要转换成文字的档案名称有中文,会显示格式不支援的状况,这改成数字或英文即可解决:
Small 的准确度我觉得就很不错了,虽然不是 100%,但至少还是有 95%,这也意味着转好之後记得要检查一下,滑鼠移到该段文字上方,右边会出现功能表,按播放即可聆听讲的话是不是真这样,有错的话按 A:
就能手动修改成对的文字:
没问题按右上角输出(Expert),可输出成常见的文字档,包括 SRT、VTT、Text、CSV 等,HTML 和 PDF 仅限 Pro 付费版用户使用:
Text 会自动把时间戳删除:
转换语言预设为自动,这基本上不需要调整,除非碰到精准度不够高的情况,就可以手动改成指定语言:
New Recording 需要取用麦克风: