代写论文 ChatGPT,背后 Open AI 揭密

代写论文 ChatGPT,背后 Open AI 揭密

11 月开放使用,一周就涌进百万用户的聊天机器人 ChatGPT,全球网友发现可代学生写论文、老师看不出来;还能代读研究报告选股;代回客服信函,甚至帮工程师写程式码,通中英文,简直会害文组理组一起失业。如此强大的 AI 工具,开发公司是 Open AI,马斯克竟是创办人之一。Open AI 还有哪些厉害 AI 服务等着推?又为何被马斯克半途抛弃?一文完整揭密。

开放大众使用的对话式语言模型ChatGPT后,人工智慧研究实验室OpenAI再度让普罗大众惊艳人工智慧的威力,且记住它的名字。这也是自2020年推出GPT-3以来,OpenAI开发出的服务又一次席卷社群,也擦亮人工智慧领域的领先招牌。不过说起OpenAI发展,这次ChatGPT的耀眼表现,并不适合用“十年寒窗苦心钻研无人闻问,而后一夕成名”来描述,探究其发展经历,更可说是厚积而薄发。

究竟OpenAI是什么来头?为什么创办人之一最终退出?科技巨头微软看上它什么?除了ChatGPT以外,OpenAI还开发出什么人工智慧的有趣应用?《远见》整理OpenAI的发展脉络,并盘点其面向人们贴近生活的服务,带你一次看。

OpenAI是什么背景?

OpenAI专攻人工智慧,由非营利OpenAI Inc.和营利OpenAI LP组成。创办人大有来头,分别是特斯拉执行长暨Twitter新老板马斯克(Elon Musk),以及素有新创孵化器美名的创投Y Combinator前总裁亚特曼(Sam Altman)。

据官网所述,OpenAI希望让通用人工智慧(artificial general intelligence,AGI)造福全人类,致力打造安全且对人类有助益的AGI。

通用人工智慧又称强人工智慧(strong AI),指的是接近甚至超越人类的人工智慧。预想通用人工智慧能像人类具备认知能力,能逻辑推理,甚至拥有自我意识,可执行不同任务,用途广泛。概念上与应用人工智慧(applied AI)或弱人工智慧(weak AI)相对,后者用途相对狭窄,机器仅能学习有明确目的任务,如辨识脸部、下棋、医疗影像判读、自动导航等。

代写论文 ChatGPT,背后 Open AI 揭密 AI与大数据 图2张

▲ 专攻西洋棋、IBM开发的Deep Blue,还有专供围棋、DeepMind开发的AlphaGo,都属弱人工智慧。(Source:影片截图)

人工智慧发展史上,开发通用人工智慧一向是电脑科学界始终无法实现的渴望。纵使近年因电脑运算能力发展成功度过AI寒冬,深度学习便宜且有效落地,主宰人工智慧领域,但目前许多应用仍是弱人工智慧范畴,科幻电影和人类培养深厚感情的通用人工智慧,仍是研究者的失落圣杯。

不过,OpenAI并没有放弃,挖掘顶尖人才、引入资金,挑战各类AI任务,希望朝终焉之地迈进。

科技巨头微软看上它什么?

创立之初,OpenAI属非营利组织,2019年时OpenAI表示,未来希望增加运算能力和人才投资,如大规模云端运算、建造超级电脑等,同时又要与梦想平衡,两者都需要资金,为了增加募资能力,OpenAI决定成立营利公司OpenAI LP。

虽然OpenAI LP重视营利,但OpenAI当时表示,相信能专注发展新AI技术,不只将重点放在商业产品,同时有非营利和营利企业组织架构,不用只看眼前利润,更能深入研究,追求长期回报。

除了初创时投资者与创办人共同承诺投资的10亿美元,2019年微软(Microsoft)加码投资10亿美元,希望透过此次和OpenAI合作共同发展通用人工智慧,微软想利用OpenAI先进人工智慧研究的力量,并相关技术民主化。

当然,强强联手不只是做公益,微软不只成为OpenAI的独家云端系统供应商,两者更合作开发微软公有云服务Azure的超级运算技术。之后微软也推出Azure OpenAI的相关服务,整合至Open AI开发的产品。举例来说,行销领域和媒体界的使用者能借此工具,据球赛评论快速产生精华摘要,进而迅速发稿。不仅如此,微软也把“望文生图”的DALL-E加入旗下创作服务和Microsoft 365,让微软用户也享受OpenAI的世界级产品。

代写论文 ChatGPT,背后 Open AI 揭密 AI与大数据 图3张

▲ DALLE产生的图片风格各异,能写实也能童稚或科幻。(Source:DALLE by OpenAI)

为什么马斯克半路退出?

微软投资OpenAI时勾勒愿景如此动人:民主化人工智慧技术、共同开发对人类有益的通用人工智慧,然2020年9月,OpenAI把集结科学家心血、耗费巨资开发的GPT-3独家授权微软,引来外界挞伐。虽然走向商业化之路无可厚非,但因OpenAI承诺过要开放,因此不是所有人都能接受与微软合作。

创办人之一马斯克2019年2月宣布离开OpenAI,除了要专注处理特斯拉和SpaceX的工程与制造问题,马斯克指出,特斯拉与OpenAI争取同领域人才,有潜在利益冲突,此外“我并不认同OpenAI团队想做的事”。

2月马斯克前脚刚走,3月OpenAI便成立营利公司OpenAI LP,很有可能就是马斯克所说的道不同不相为谋。因此2020年时看见微软取得GPT-3独家授权,马斯克在Twitter推文抨击“OpenAI已被微软俘虏”,纵使微软技术长暨副总史考特(Kevin Scott)指出,外界仍可持续使用GPT-3及其他OpenAI开发模型,但马斯克仍说,如此行为看起来并不像誓言“开放”的组织会做的事。

OpenAI开发出什么有趣的人工智慧服务?

OpenAI并没有让投资人和社会大众失望,陆续开发人工智慧创造内容(AI generated content)模型,并公开部分成果给大众使用。

以图像和文字来说,分别推出输入文字便能产生图像的DALL-E,以及给图后产生文字的CLIP。DALL-E和Midjourney相似,使用者输入各种指令(prompt)组合,人工智慧便会产生精美程度甚高的图片,虽然有时会出现和物理世界不符的情况,如不符合人体工学的肢体角度、动物拥有四肢以外躯干、不可能存在的光影等,但“以文产图”结果已能符合大众审美。

至于CLIP模型,是利用对比让电脑认识不同图片的差异,产生判断,再依此生产文字。实用性也不容小觑,平常人们整理照片时,时常要花时间整理相簿,如将相片照过往参加过活动分类,甚至有些要重新命名方便日后查找。然而,真的要找特定的照片还是很艰难,因为图片与文字并不共通,如“自己与家中小狗的合照”或“塞车街景”,即使搜寻栏位输入小狗或塞车,也不会跳出正确的结果。

代写论文 ChatGPT,背后 Open AI 揭密 AI与大数据 图4张

▲ 利用CLIP生成的模型,能够“以文找图”。(Source:GitHub)

以文搜图超方便

有了CLIP模型之后,我们便能够像Google图片搜寻一样,利用以文搜图的方式查找自己的相片。听起来不是什么新发明,但CLIP其实已经做到了物体辨识,它不再只是传统的“这张照片是狗”、“这张图里面有动物”,而是能够正确的认出单张图片中的不同概念,例如“狗在玩雪”、“夜晚的台北市交通打结”等。

不只图像上的突破,OpenAI陆续开发了MuseNet和Jukebox,前者能够依照使用者输入的音乐,进一步融合不同风格的演奏,甚至增添乐器,产出新的音乐,它可以模仿莫札特与披头四,也能用乡村音乐或者女神卡卡的风格作曲。

代写论文 ChatGPT,背后 Open AI 揭密 AI与大数据 图5张

▲ 使用者可以到OpenAI的官网使用MuseNet,除了自行上传MIDI档案以外,也能从预设的列表选择乐曲,接着还能改变风格与乐器。(Source:OpenAI)

Jukebox则往前跨了一步。使用者连音乐都不用上传了,只要提供类型、音乐人、歌词,Jukebox便能够产出接近典型CD品质的音乐片段(即取样 Sampling 的“样”),时长约为4分钟。不过,因为Jukebox产出的品质相对较高,因此训练时间长达数小时,不像MuseNet仅花以秒计的时间便可完成。

除了音乐以外,OpenAI也开发了将文字描述转译为程式码的Codex,还有擅长玩电动的OpenAI Five。不过,OpenAI最厉害的还是其开发出的GPT相关模型,例如第三代GPT-3,它能够理解人类语句并做出回应,同时也是这次ChatGPT的基石。

随着人工智慧的逐步发展,人类在“以文生图”后反思创作、在“以字产乐”后回顾音乐风格,ChatGPT则让人们寻找机器与人类相似与相异之处。

有了科技巨头的鼎力相助,我们要问的问题或许不再是有生之年能否见到通用人工智慧的到来,而要改问还要多久就会到来。到了彼时,人类应该如何自处?又要如何寻找或者认可生而为人的价值?藉着他者,更能够观照自身。在科技奇点来临之前,我们还有时间能够不断反思。

(本文由 远见杂志 授权转载;首图来源:shutterstock)

延伸阅读:

  • 马斯克大赞!聊天机器人 ChatGPT 用户破百万,OpenAI CEO:对话成本不到 1 美元
  • ChatGPT 爆红!Google 高层警告:过快发展 AI 聊天技术,公司商誉恐受影响
  • V 神实测 ChatGPT 写程式心得:AI 还无法取代人类工程师
  • 出一张嘴 ChatGPT 帮你找答案,专家评估有机会商用化

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。