谷歌AI击败棋王后再进化!会开口说话、语调超像真人

谷歌AI击败棋王后再进化!会开口说话、语调超像真人

谷歌人工智慧(AI)系统“AlphaGo”,先前击败南韩围棋棋王Lee Se-dol扬名国际。如今研发AlphaGo的团队再下一城,宣称能让电脑说话的声音更贴近人类,或许未来人们能和AI对话聊天

CNBC、每日邮报、英国金融时报报道,谷歌母公司Alphabet旗下的DeepMind 8日宣布研发新技术,能让电脑合成语音和人类声音的差距减少一半。DeepMind表示,长久以来,人机互动的梦想就是让人类能和机器对话。

当前的语音合成技术录制人们实际说话的声音,存放在资料库,需要时把字句打散重组,合成为完整句子,此种方式生成的语音听起来生硬不自然,也缺乏感情。

DeepMind的“WaveNet”技术,能分析原始声波,使用类神经网络(Neural Network)加以修正。此种技术需要庞大的运算能力,每秒要1.6万个范本才能转成数据、合成为语音。DeepMind表示,WaveNet生成的中英文,听起来比谷歌现行技术自然许多。

英文


https://storage.googleapis.com/deepmind-media/pixie/us-english/wavenet-1.wav

中文

https://storage.googleapis.com/deepmind-media/pixie/mandarin-chinese/wavenet-1.wav

DeepMind说,Wavenet能模仿所有人的声音,还能加入感情和语调,让电脑生成语音听来更丰富多变。不此如此,他们还用该技术制造出类似钢琴的琴声。不过内情人士指出,WaveNet需要极大的运算能力,可预见的未来或许还无法使用在真实世界,目前也未用于谷歌产品。

人工智慧(AI)再次缔造里程碑,谷歌人工智慧系统“AlphaGo”,3月9日击败世界围棋棋王Lee Se-dol,写下历史新页。

英文、中文说话品质比较

英文、中文说话品质比较

金融时报(FT)、卫报报道,电脑早已征服西洋棋,1997年IBM深蓝(Deep Blue)打败了西洋棋王Garry Kasparov。围棋比西洋棋更复杂,有上兆种可能性,需要靠直觉推演情势,即便超级电脑都不容易上手。研发AlphaGo的谷歌DeepMind执行总裁Demis Hassabis说,AlphaGo的胜利是历史性时刻。韩国解说员认为,AlphaGo下法神秘莫测,致胜关键在于不会受到情绪干扰。AlphaGo就算犯错,仍能保持冷静,不影响后面棋局。相反的,Lee因为一开始的失误,苦吞败仗。

AlphaGo的胜利,可能意味人工智慧将更广泛运用,人类工作岌岌可危。CNBC报道,人工智慧不断进化,新创公司Thumbtack报告称,当前所谓的“零工经济”,将在20年消失。未来物流公司无需聘请人类驾驶,改用自驾车和无人机取代,叫车软件优步(Uber)、零售巨擘亚马逊(Amazon)都会加入此一潮流。另外,当前的高阶工作者,如律师、会计等,工作也不再稳固,将成为新的零工经济成员。

(本文由 MoneyDJ新闻 授权转载;首图来源:Google)

 

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。