除了将生成式 AI 用在很好理解(这是 Facebook 你懂的)的广告方面。其实 Meta 对於人工智慧的发展倒也渐渐显露出了,他们其实是真的依然有环绕在元宇宙发展的野心以及必要性 – 并非许多人猜测的,只是一时赶流行才草草端出的东西。继续阅读 Meta Voicebox AI 只需 2 秒声音样本即可生成多国语音,还能讲出不同风格报导内文。
▲图片来源:Meta
Meta Voicebox AI 只需 2 秒声音样本即可生成多国语音,还能讲出不同风格
当 Facebook 与 Instagram 母公司 Meta,宣告要把生成式 AI 推给数十亿用户横跨所有产品线的消息一出。不少人心中想到的是,难不成 Meta 就要忘掉烧到亏损 40 亿美元的元宇宙这回事,甚至还开玩笑说,搞不好还会把公司名称改成跟 AI 相关的名称。
不过实际上,除了将生成式 AI 用在很好理解(这是 Facebook 你懂的)的广告方面。其实 Meta 对於人工智慧的发展倒也渐渐显露出了,他们其实是真的依然有环绕在元宇宙发展的野心以及必要性 – 可能并非许多人猜测的,只是一时赶流行才草草端出的东西。
近日,Meta 端出了他们的文字转语音技术 Voicebox。相对於其他服务,它对於语音的「处理」算是非常多元,号称是个 All-in-one 的语音生成式模型。从基本的输入文字便可透过 AI 念出的功能之外,还包括能呈现的风格以及可以直接翻译成六种包括英文、法文、德文、西班牙文、波兰文与葡萄牙文不同语言的能耐。
重点是,Meta 还把其他服务可以透过采样语音片段来学习对方语调的功能,进化到仅需 2 秒的语音样本即可达成的可怕效率;Meta Voicebox 也能被用在消除语音内容之中所不小心录到的杂讯或杂音上 – 将可轻松帮忙消除录制过程中可能不小心出现的狗吠声等。
就官方的说法,就像是语音版的橡皮擦编辑功能一样好用。
是说,功能这麽强大多样,我们好像还没提到跟 Meta 元宇宙发展有什麽关联吼?
根据 Meta 官方的说法,这些功能将可帮助元宇宙世界中的 NPC 非实际人物的角色,达到更自然的语音对话能力。至於使用者本身,则是可以透过 Meta Voicebox 消弭语言之间的限制。所以别再说 Meta 最近似乎都没在做与 Metaverse 相关的事情了!
此外,官方也提到这样的功能非常适合用於打造无障碍功能。而这也算是企业可以透过新科技来帮助社会的不错方向。不过 Meta 也相当担心像是 2 秒就能够模拟声音的功能如果被恶意伪装他人的问题。对此,一方面是 Voicebox 还尚未提供大众使用。Meta 更提到已经正在开发能更简单辨别假冒声音的机制。所以「暂时」还不用感到太担心就是了…