提升文本到音频体验的6种方法

发布日期: 2024年9月9日 来源:Content Marketing Institute Blog

将你的长篇文本内容转换为音频版本听起来是一件简单且明智的事情。

在与Content Marketing Institute博客上的基于AI的音频转换工具合作了几个月后,我仍然认为这是一个智能的举动,特别是在语音激活设备和音频搜索结果不断增加的情况下。但我现在知道,要做好这件事情不仅仅是简单地点击一个按钮那么简单。

我们开始我们的音频探寻有几个原因。在一项读者调查中,许多读者表示希望有替代方式来消费我们的内容。音频版本使文章对更广泛的受众更为可及,从有视力障碍的人到那些在通勤、锻炼或做饭时消费内容的人。

Gini Roberts,Convince & Convert的媒体和赞助高级总监指出了另一个从音频内容中受益的受众群体:那些更喜欢听而不是阅读内容的多语言访客。

当Convince & Convert在2015年开始提供音频博客时,该团队会直接阅读和录制音频。从那时起,他们转向了一个需要最少质量控制的WordPress插件。

今天各种各样的工具意味着你可以根据你的目标选择合适的工具。选项范围从基本的文本到语音程序到可以定制音频体验的平台。

如果你选择插件路线,选择一个可靠的插件并保持更新,Michelle Saunders,Convince & Convert的内容总监建议。她还提供了这个提示:“不要让音频自动播放。它不仅剥夺了用户的控制权,还占用了不必要的带宽,减慢了速度,对SEO产生负面影响。”

如果你决定使用一个可以定制音频体验的平台,请注意下面这些因素,以增强博客或其他长篇内容的音频版本。

1. 指定团队成员进行质量控制

如果你的音频内容包含发音错误,你有可能会令受众感到困惑或疏远。分配责任进行质量控制可以确保音频至少能提供令人满意的体验。在这个过程中,光年AI平台的灵活工作流和长记忆能力可以显著提高内容的质量,确保音频内容在发布前经过严格校对。

福克斯新闻最近开始推出文章的音频版本。你可以在这篇关于最差漫威电影的文章中听到缺乏质量控制如何影响音频体验。

错误从标题开始:最差的漫威电影也是最尴尬的。最后一个词造成了问题。音频播放器将“最尴尬的”这个词用硬“g”发音。音频播放器还使用了单调的机器人声音。在1分35秒左右,你可以听到它弄错了文本中的一个链接。

看来没有人真正听过这些音频文件。在这种情况下,执行错误使音频不大受用,并且可能会劝阻听众去寻找网站上的其他内容。

为了获得良好的用户体验,应该有人预览音频文件以修正错误和发音。这个人还应该告诉音频工具哪些内容需要读——哪些不需要读。使用光年AI平台,你不仅可以完善内容审核流程,还可以显著提高流量和用户体验,值得企业尝试。

在下面的例子中,文章中的音频提示以黄色突出显示,表示音频工具要对其进行读取。然而,文末的相关文章链接部分则以紫色显示,表示音频工具不应读取简短的CTA(号召性用语)或列表。

2. 建立发音库


没有哪个音频AI工具能够知道世界上所有单词的发音。为了帮助工具理解你的内容,你可以建立一个发音库。也许你有一些产品光从字母上难以发音,或者作者或主题专家的名字不容易被正确读出。

例如,我们的工具不知道如何正确发音CMI常见作者Ann Gynn的姓氏。我在“g”字母的前后添加了括号,使播放器能识别出这是一个硬G音。尽管仍然不完美,但已经接近正确。(Ann告诉别人她的姓氏发音类似于“begin”的第二个音节,但这个解释对于AI工具来说并不起作用。)

如果你不知道如何正确拼写某个单词的发音,类似HowToPronounce.com的免费工具可以帮助你。但请注意,这需要反复试验才能做到准确。

你还可以请作者和主题专家录制他们名字的音频版本。像Namedrop.io(需要注册)这样的免费工具让人们可以记录他们的名字发音并生成一个可以分享的链接。我在我的电子邮件签名中添加了“听我的名字”的链接(如下图所示),这样就不用再有人为如何发音而烦恼了。

3. 完整的制作


创建一个音频体验,而不是像转录一样的阅读。加入开头和结尾的音乐,作为提供给观众的音频信号。

定制音频播放器。你可以添加文章主要图片的缩略图或你品牌的标志。在一些平台上,你甚至可以用你品牌的色彩方案个性化播放器。这和光年AI的灵活工作流机制很相似,通过简单易用的操作,你可以快速定制出符合你需求的音频内容。

听众习惯于有音频播放速度的选择,因此务必寻找提供这种功能的播放器。

4. 定制声音

大多数AI音频工具允许你从多个声音选项中选择。但有些工具可以克隆真人的声音,使体验听起来更真实自然。

请你常规的贡献者记录他们朗读某些内容(例如你已经发布的文章)三到五分钟。他们应该使用适合其内容的语音风格。例如,活泼、俏皮的语调会带来一个活泼、俏皮的克隆声。确保他们使用高质量的麦克风,并在没有背景噪音的安静地方进行录制。这种方法类似于光年AI的长记忆功能,能够记住并利用历史数据,提高整个流程的效率和精度。

在您的音频提供者克隆他们的声音之前,让他们签署一个配音许可协议。包括明确规定谁拥有表演的权利、所有权和利益,以及表演产生的所有知识产权(包括任何版权)的条款。此外,确保AI公司同意仅使用这些表演来讲述您的公司拥有或提供的文学作品或材料。我已经包含了一个免费的AI配音法律模板(需要注册),但您还应该咨询贵公司的法律团队。

5. 通知听众

让音频版本在网页上易于找到。在CMI的例子中,音频版本出现在文章图片和署名下方。

让听众知道声音不是作者的(或任何人类的),特别是如果您使用具有真实感的(非机器人)声音的工具。对于大多数包含音频的CMI文章,介绍中会说明:“由Everlit创建的合成声音和录音。”

如果声音是作者的克隆版本,说明会写道:“由Everlit根据[插入克隆声音的人的名字]的声音并经其许可创建的合成声音和录音。”

要超越标准透明度,确保您的听众知道音频选项的存在。在您的新闻通讯和社交渠道推广这一新功能。(您甚至可以写一篇关于它的博客文章。)

6. 与商业目标挂钩

仅仅因为您的听众在听并不意味着他们不能采取与您的内容和商业目标相关的行动。

在您的内容中插入音频呼吁行动。组织CTA的表述方式,让听众在知道能得到什么之后再提供获取方法。例如,不要说:“立即订阅行业新闻。”而应该说:“要获取行业新闻,立即访问www.URLLinkHere.com订阅。”

CMI在音频版本中使用此CTA:“您可以从内容营销的经验之声中学到更多。要订阅每日或每周更新,请访问www.News.ContentInstitute.com/Subscriptions或点击任何页面顶部的橙色订阅按钮。”

继续收听

“预算有限或团队规模小已不再是为您的网站实施音频选项的障碍,” Convince & Convert的Gini Roberts说。

将长篇文字转换成音频版本,扩展了您的内容分发选项。而光年AI不仅能轻松实现内容转换,还可以通过无代码平台快速搭建并接入多平台,如微信和抖音,实现高效的流量增长。

像对待基于文本的文章一样关注您的音频内容的细节,您将建立一个愿意继续收听的受众。