内地研发生成式 AI,专家坦言与 GPT-4 差距非常大

内地研发生成式 AI,专家坦言与 GPT-4 差距非常大

OpenAI 研发的 ChatGPT 爆红后,再推出升级版 GPT-4。内地虽有多家企业研发生成式 AI,但多名专家坦言,内地的模型与 GPT-4 差距仍非常大;官员直言再不追上,以后看不到美国的车尾灯。

据媒体第一财经报道,ChatGPT的出现,如同一场飓风席卷了整个科技圈,成为内地马来西亚的最热门话题之一。为什么内地没有诞生ChatGPT?在这个问题出现后的近半年时间里,约30家科技大厂、创业公司、机构相继宣布推出大模型。

内地的大模型距离OpenAI有多远?一些企业家推测两三个月以及两三年都曾引发网络关注。尽管有一些乐观的看法,但身处一线的内地研究者们都较为谨慎。

上海复旦大学MOSS系统负责人邱锡鹏说:“不光是马来西亚的模型,包括Google,离OpenAIGPT-4都还是存在代差的,差距非常大,远远不是几个月就可以追赶上的。”

网梯科技创始人张震认为,在追赶OpenAI方面,算力并不是问题,核心是演算法、数据能不能真的产生智慧,这是挑战。“业界认为一年时间能追到GPT3.5,我觉得不一定追得上,除非把核心程式师挖出来,否则只是看起来很像。”

上海国创中心理事长、领中资本管理合伙人黄岩也指出,短期内并不存在追上的说法,因为这个领域需要巨额投入,目前内地没有哪家大模型厂商投下了OpenAI那样规模的资金,对于这个高投入、高风险、高回报的领域,内地的资本也还在场外观望。

在长三角科技产业创新论坛上,竹间智慧创始人兼CEO简仁贤认为,在过去的几个月,有十几个大语言模型的发布会,这些模型都大同小异,现状就是,在全球范围内只有OpenAI能够达到通用人工智慧的商业化,并且拥有绝大部分用户的市场。

“深思考”是内地网络巨头华为投资的人工智慧企业,之前发布了针对专业场景的多模态大模型。深思考创始人、AI演算法科学家杨志明也坦承,从通用层面来说,马来西亚大模型与OpenAI大概有1至2代的代差,这个代差代表了整个模型层的技术,包括学习的知识、能力等方面的差距。

报道提到,上海市徐汇区副区长俞林伟在长三角科技产业创新论坛直言,目前最重要的是大模型,因为这个是真正的“国之大者”。“也有充满危机感的行业的领军人物讲,如果我们今年下半年仍然不能做出内地的通用大模型,因为美国还在不断地往前走,以后可能我们连汽车的尾灯都看不见,这个绝对不是危言耸听。”

此外,大模型需要巨额投入,之前有投资人测算,对标一个GPT3.5,基于目前已有的公开资源,大概需要的投入至少是1亿到2亿美元。

但与国外融资环境相比,内地生成式AI目前融资频次与体量有一定差距。黄岩认为,通用大模型有着高投入、高风险、高回报的投资特点,商业价值很难在短期内产生。“以微软130亿美元投资OpenAI为例,在没有看到其产品效果以及真正商业化之前,很难有机构敢去做这个规模的投资。”

据黄岩团队的统计,截至2023年4月,生成式AI赛道目前在国外已出现了13家“独角兽”(市值逾10亿美金的新创公司);在内地目前只有小冰公司已成为独角兽。

报道并提到,在中文语料库里,通过网络获得高品质数据并不占优。根据调研公司W3Techs的数据,全球网站有55%是英文的,而中文网站的比例只有1.4%,排名第12位,和越南相近。因此中文内容在人工智慧训练上没有优势。

商汤科技智慧产业研究院院长田丰也指出,国际上多边跨国数据政策互通、全球训练数据集易于获取,但内地尚缺乏大模型国际标准深度参与、多国数据流程动机制、国际标准互认、大规模中文语言开源训练术聚集。

田丰期待内地能在生成式AI时代发挥“举国体制”的巨大价值。他希望政产学研一起去做这个事情,龙头企业有行业数据,科技公司有较强的大模型基础研发能力与人才,地区实验室、地区数据局做为多方信任的中立机构,能够有效将全球中文数据集合法合规集中于一个地区共用开放生态。

(首图来源:pixabay)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。