追随 Sora 热潮,新创 ElevenLabs 预告推出 AI 生成影片音效

▼
OpenAI 近日推出能以文字转成影片的全新模型 Sora,能够产生具有多个角色、不同运镜和背景细节的 60 秒高画质影片,尽管 Sora 能够创造逼真电影场景,但目前成果都是无声电影。对此,另一新创公司 ElevenLabs 的技术可为 Sora 生成影片添加背景音效。
ElevenLabs 正在开发一款新产品,可以根据用户提供的影片场景描述产生音讯,伴随原本的无声影片。
ElevenLabs 虽未透露生成音效的细节,但为展示技术实力,Elevenlabs 结合一些 Sora 影片实例展示 AI 生成的逼真音效,从繁忙街道上的脚步声和城市中的嘈杂声,仿佛能以好莱坞风格的宣传音效呈现电影叙事,这些声音是由提示文字产生音讯。
“我们使用提示文字如‘海浪拍打’、‘金属撞击’、‘鸟鸣’、‘赛车引擎声’等产生音讯,并与我们喜欢的一些 Sora 生成影片剪辑在一起”,ElevenLabs 透过官方部落格文章表示。
We were blown away by the Sora announcement but felt it needed something…
What if you could describe a sound and generate it with AI? pic.twitter.com/HcUxQ7Wndg
— ElevenLabs (@elevenlabsio) February 18, 2024
▲ Elevenlabs 结合一些 Sora 影片实例展示 AI 生成的逼真音效。
Google 前机器学习工程师 Piotr Dabkowski 和 Palantir 前部署策略师 Mati Staniszewski 在 2022 年共同创立 ElevenLabs 这家新创公司,随后推出以 AI 技术驱动的文字转成语音软件,以及能够自动翻译的 AI 配音工具,可将影片翻译成 20 多种语言,并且保有原本谈话的语气和风格,现在更着手开发 AI 生成音效方面的应用。
值得观察的是 ElevenLabs 生成音效的技术与 Sora 一样,仍有一些问题有待解决,尤其有关防范诈骗和建立安全协议等。有鉴于 AI 发展脚步如此之快,OpenAI、ElevenLabs 以及整个产业将会找出具体解方。
- Stunning new AI adds realistic sound effects to any video
(首图来源:影片截图)
延伸阅读:
- 新创 ElevenLab 推出 Multilingual v2 模型,能用你的声音说 30 种语言
▼

特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。