追随 Sora 热潮,新创 ElevenLabs 预告推出 AI 生成影片音效

追随 Sora 热潮,新创 ElevenLabs 预告推出 AI 生成影片音效

OpenAI 近日推出能以文字转成影片的全新模型 Sora,能够产生具有多个角色、不同运镜和背景细节的 60 秒高画质影片,尽管 Sora 能够创造逼真电影场景,但目前成果都是无声电影。对此,另一新创公司 ElevenLabs 的技术可为 Sora 生成影片添加背景音效。

ElevenLabs 正在开发一款新产品,可以根据用户提供的影片场景描述产生音讯,伴随原本的无声影片。

ElevenLabs 虽未透露生成音效的细节,但为展示技术实力,Elevenlabs 结合一些 Sora 影片实例展示 AI 生成的逼真音效,从繁忙街道上的脚步声和城市中的嘈杂声,仿佛能以好莱坞风格的宣传音效呈现电影叙事,这些声音是由提示文字产生音讯。

“我们使用提示文字如‘海浪拍打’、‘金属撞击’、‘鸟鸣’、‘赛车引擎声’等产生音讯,并与我们喜欢的一些 Sora 生成影片剪辑在一起”,ElevenLabs 透过官方部落格文章表示。

▲ Elevenlabs 结合一些 Sora 影片实例展示 AI 生成的逼真音效。

Google 前机器学习工程师 Piotr Dabkowski 和 Palantir 前部署策略师 Mati Staniszewski 在 2022 年共同创立 ElevenLabs 这家新创公司,随后推出以 AI 技术驱动的文字转成语音软件,以及能够自动翻译的 AI 配音工具,可将影片翻译成 20 多种语言,并且保有原本谈话的语气和风格,现在更着手开发 AI 生成音效方面的应用。

值得观察的是 ElevenLabs 生成音效的技术与 Sora 一样,仍有一些问题有待解决,尤其有关防范诈骗和建立安全协议等。有鉴于 AI 发展脚步如此之快,OpenAI、ElevenLabs 以及整个产业将会找出具体解方。

  • Stunning new AI adds realistic sound effects to any video

(首图来源:影片截图)

延伸阅读:

  • 新创 ElevenLab 推出 Multilingual v2 模型,能用你的声音说 30 种语言

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。