AI 竞赛亚马逊不缺席,新开发大型语言模型准确率胜过 GPT-3

AI 竞赛亚马逊不缺席,新开发大型语言模型准确率胜过 GPT-3

OpenAI 以 GPT-3.5 系列模型之一微调,2022 年初完成训练,年末推出 ChatGPT 引发热议,带动全球 AI 热潮。亚马逊新开发的大型语言模型(Large Language Models,LLM)宣称只用 10 亿个参数建立模型,准确率还比最先进 GPT-3 高 16%。

亚马逊近期发布《Multimodal Chain-of-Thought Reasoning in Language Models》论文,资深产品经理Assaf Yablon指出,LLM 经过 10 亿个参数训练,达 91.68% 的惊人准确率,相较火红的 GPT-3,它是以 1,750 亿个参数训练而成,准确率是 75.17%,亚马逊 LLM 准确率比 GPT-3 高 16%,这令人印象深刻的成就是在 Chain-of-Thought(CoT)提示帮助下达成。

AI 竞赛亚马逊不缺席,新开发大型语言模型准确率胜过 GPT-3 AI与大数据 图2张

▲ 亚马逊 LLM 推论答案流程。(Source:Assaf Yablon)

亚马逊方法是透过两阶段架构整合语言(文字)和视觉(图像),架构分成基本理由和推断答案,如此答案推论过程受惠于多模型资讯。简而言之,亚马逊 LLM 能根据更多知识产生更有洞察力的基本理由和答案。

看来这波 AI 竞赛亚马逊并没有打算缺席,LLM 架构不算复杂且完整开源。想像如能进一步开发成类似 ChatGPT 的对话式 AI,可用于亚马逊电商客服,一问一答解决消费者 App 操作、付款、到货等问题,也能推荐商品,使购物体验最佳化。此外,由于架构整合文字和图像,或许也能帮助品牌供应商或第三方卖家产生商品文案。

(首图来源:shutterstock)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。