从清迈旅行回来后,我很想用 newsletter 和播客这两种形式回顾这趟旅程,可是撰写文字稿和剪辑节目都是费时费力的事情,我决定在制作过程中使用 4 个 AI 工具来提高效率。
这 4 个 AI 工具按照功能类别可以分为两组:
文稿转写及校对:通义听悟,Copilot。
Vocut 是一个网页版 AI 剪辑工具,分为国际版和中国版,国际版可以用邮箱注册(主打 AI 剪辑视频),中国版还可以用手机号和微信登录(主打中文播客制作),注册后免费账户的 quota 是 120 分钟/每月,支持视频和音频。当然也有付费方案,每个月 1200 分钟,完全可以满足每周更新的节目需要,而且中国版远比国际版便宜。点击以下优惠链接订阅会员可享 9 折优惠,我也可以从中获得小小的分成 🙏
我主要用 Vocut 做音频初剪。把录制好的音频上传到网页后,它会自动将音频转写为文字,接着我可以根据页面左边显示的“文本视图”来剪辑对应的音频,选中某一段文字时右侧的音频视图会高亮对应的音频,点击“删除线”即可删除音频。同时它还有一个“ AI 助手”功能,对音频中的停顿、语气词、重复词进行检测 ,这些都是我们在录制节目时常见的问题,点击 AI 助手后既可以选中一处也可以一键删除全部。
不过,我建议不要一次删除全部,适当的停顿和语气词会让节目听起来更自然。按照文本完成一集节目的初剪后,直接导出音频到电脑。我会听一遍看看有没有没剪干净的部分,再用 Audacity 快速修剪。
Auphonic 只有英文网页版,注册后免费账户的 quota 是 2小时/每月,免费账户的功能足够用了,时间不够用就多注册几个账户,付费账户主要是多了音频转写(接入各类音频转文字服务)和节目发布(集成各大播客托管平台)等功能。
我会用 Auphonic 来完成更精细的后制。打开 Producations 页面,上传初剪音频,根据需要选择Presets(预制方案),如果只有人声,建议选“ Vocie Cleaner ”,如果音频中加入了大量的环境声,选“ Adaptive Leveler ”更合适,这个环节还可以添加片头和片尾音乐,选好方案之后 它会自动进行后制流程,不用一直开着网页, Auphonic 会在后制完成后会邮件通知你。
如果你对预设好的 Presets不满意,还可以调整各种参数创造出个性化的 Presets。后制完成后,你会在页面上同时看到输入和输出音频的波形对比和各项参数,点击在线播放按钮,直观感受到 Auphonic 在后制时做了什么,对效果不满意可以继续编辑,满意了再输出音频。
现在一集播客已经剪好了,我还需要文字稿用于撰写 newsletter,这时候就要用到第二组工具。
把节目音频上传到通义听悟,等待几分钟转写,完成后我得到了内容总结、章节摘要和完整文字稿,但是转写准确率不够高,有些名词识别错误,断句和分段有问题,不能直接用,要把文稿导出来校对。
人工校对录音稿要花很多时间,我想到用 Copilot 来校对。因为文稿字数较长,为了一次输入更多,以及控制 Copilot 胡乱发挥,我选择的是“更精确”对话模式。多次实验之后,我总结出了一套提示词,第一轮对话让 Copilot 了解“校对员”要做哪些事情,第二轮对话给它一个校对好的文稿的案例,领会我对校对的要求。
整体上 Copilot 的校对质量还不错,能够对语句的重复啰嗦进行脱水,问题在于对话轮次多了,它就会开始对文稿进行评论,需要及时提醒它不要输出观点做好校对。分几次让 Copilot 完成校对,合成完整的文本,最后还需要人工浏览一遍,查漏补缺确保文稿读起来通顺自然。