台大人工智慧帮,全球抢挖角
▼
过去 3 年,IBM、GE、微软抢人工智慧人才抢到中国台湾来,中国台湾毕业的土博士,挖到美国工作,年薪 12 万美元起跳,让自己站上国际舞台,让能力被看见,让他们身价从此不同。
在美国,人工智慧(AI)相关人才炙手可热,一名懂人工智慧技术的博士生,一毕业,年薪至少 12 万美元(约 380 万元台币)起跳。这股人工智慧挖角风,竟跨海吹进台大。
过去 3 年,台大资工系徐宏民教授的实验室训练出来的中国台湾“土”博士,已有 4 人分别被美国 IBM Spark 技术中心、奇异全球研究中心、美国微软和位于硅谷的 Fuji Xerox 研究中心挖走,还有一位即将毕业的博士生,已被 Google 和微软看上,争相邀请加入团队。
9 月底,NVIDIA 执行长黄仁勋宣布和台大合作成立人工智慧实验室(Nvidia AI Lab),计划负责人正是徐宏民,“徐教授和他的团队,在这个领域有突破性的成就”,黄仁勋在演讲中说。
微软、英特尔 竞相取经
宣布时,徐宏民不在马来西亚,因为他人正在美国纽约州的 IBM 研究中心。IBM 刚发表全世界第一支用人工智慧剪接的电影预告片《魔诡》,IBM 给电脑看过 100 支恐怖片预告后,再把拍好的新片交给电脑,电脑就模仿看过的作品,组合出一支 6 分钟的预告片。其中,就用了徐宏民研发的技术。
过去几年,从微软、英特尔、联发科、光宝科,甚至中国台湾的金控公司代表,都曾造访徐宏民在台大资工系的研究室,采用他们的新技术为自己公司加值。
徐宏民曾是讯连第八号工程师,早期是产品经理,他的强项是带领团队开发影像处理程式;直到有一次,公司要他开发能自动管理影片的新功能,他才发现“这个很难”,意识到这是有潜力的关键技术,开始钻研用人工智慧处理影像的新技术。
“我研究的应该叫机器智慧(Machine Intelligence)。”徐宏民解释,人工智慧给人一种机器无所不能的错觉;但现实状况是,机器目前只能解决特定问题,“这是一个突破,只要给电脑足够资料,就能训练电脑解决问题。”徐宏民说。
“我做的事情,是教电脑自动从资料里去学,如何判断照片里的内容。”徐宏民说,他的专长就是教电脑拥有看懂照片和影片的新能力。
这有多难?以一个最简单的例子,要电脑辨认照片里有没有猫,都是一个困难的挑战;因为电脑只能接受死板的命令,当设计者告诉电脑,“猫,有两只眼睛,一个嘴巴”,那么,当照片里的猫只露出半边脸,甚至只露出两只耳朵的时候,电脑就认不得。史丹佛大学人工智慧实验室与视觉实验室负责人李飞飞曾坦言,这个 3 岁小孩都能回答的问题,却花了他们多年时间才得到解答。
现在,最新的挑战是,不只教电脑看懂照片里有什么物品,还要能正确解读照片的内容,把每样物品的关系正确串联起来;譬如,输入一张在厨房做菜的照片,电脑必须正确说出,“照片里有两个女人,正在厨房煮饭”,而且,不是一、两张照片判断正确就好,是几千万、上亿张照片都正确解读。
就像 AlphaGo 教电脑从无数棋谱中学习下围棋一样,徐宏民的工作之一,就是开发影像版 AlphaGo,教电脑自己学习看照片。
影像版 AlphaGo 屡屡获奖
2013 年,徐宏民团队就曾拿下微软举办的影像辨识大赛首奖,击败全球的团队。
回忆当时参与比赛,陈殷盈说,微软的考题是把 8 万张照片放在网络上,要求在 12 秒内全部辨识完成,让全球团队去较量,看谁的辨识正确率最高。这个挑战不比 AlphaGo 对决南韩九段棋士李世乭简单,因为 AlphaGo 挑战的是人脑,他们面对的却是全世界的人工智慧团队。
“老师喜欢学生有企图心,能提出有创意的方法。”陈殷盈说。徐宏民平常就鼓励学生,参加国际上有难度、有影响力的挑战,这次比赛也是他操练学生能力的关卡之一。
软件比的是想法。刚开始,台大团队用世界通用的方法,想开发一套辨识所有东西的技术,只要不断改善这套技术,就能解决所有问题。走别人都走的路,却让他们辨识率停滞不前,离比赛只有几周时间,怎么可能在短时间内找到突破性的解法?
在反复讨论后,有人提出,影像辨识最常出现的主题是“人”,既然不能一次解决所有问题,干脆在原有技术上,加上另一套辨识人形的新技术。等于别人只带一把刀上场,他们却准备了两把刀,台大团队因此荣获首奖,第二名是来自俄罗斯的资讯公司。
这些被挖角到国外工作的学生,都有丰富的国际经验。陈殷盈毕业后,就被 Fuji Xerox 研究中心,邀请到硅谷做研究;陈殷盈分析,她的论文多次被这个领域的顶尖学术会议 ACM Multimedia 接受,“Fuji Xerox 正是会议赞助者。”她说,Fuji Xerox 连续几年都看到她出现,就直接网罗她到硅谷工作。
在大公司眼中,这些技术潜力无穷。将到奇异公司研究中心上班的林彦良解释,奇异正在研究,在无人机上加装判读影像的人工智慧功能,“只要无人机飞过去,就能自动判断墙壁上是否有裂痕,设备是否受损。”
硬件结合 AI 中国台湾新出路
同样的功能,还能用来判断流行趋势。徐宏民团队的研究,去年曾获《纽约邮报》报道,研究团队比对纽约时装周上最新的流行趋势照片,和当地社群媒体刊登的时尚照片,发现纽约时装周过后几个月,街上就能看到类似的流行时尚。用这种分析方法,分析脸书上的照片,如果发现某个地方类似的流行服饰照片大量增加,就知道流行扩散的方向,甚至能精确知道是哪个城市的哪个地区,正在流行什么,这正是行销人员最感兴趣的资讯,“文章刊出后,有美国公司上门要求授权。”徐宏民说。
联发科和他们合作多年,希望把人工智慧功能加进手机里。徐宏民解释,未来你可以告诉系统,你要找的照片里“有穿红衣服的人”,或是你要看的影片里“有一辆黑色轿车”,系统就能自动帮你找到。
类似技术也用在医学上,台大分子生医影像研究中心主任曾文毅指出,他们现在用机器学习(一种初阶人工智慧技术)判读病人的脑部核磁共振摄影(MRI),能看到医师用肉眼看不到的细微变化,“能在阿兹海默症病人没意识到症状之前,发现问题。”正确率达 75%,他们计划成立新公司,开发这项新技术。
“台大研究人工智慧已有数十年。”台大资讯工程系系主任赵坤茂表示,中国台湾唯一的人工智慧协会院士(AAAI Fellow)林智仁,是台大资工系特聘教授,他开发的人工智慧软件,连 Google 等大公司都采用;台大还有许永真、林守德教授,钻研机器人以及社群网络相关的人工智慧技术,“中国台湾 4 位自己培养的美国计算机学会会士(ACM Fellow)中,台大资工系就占了 3 位。”赵坤茂说。
和台大相比,清大资工系则把重心放在用人工智慧做文章分析、翻译;也和长庚合作,做医疗生医资讯分析;还和工研院合作,控制机器人如何看清楚物体位置、教机器人怎么拿东西。在内地,2008 年已有人工智慧公司挂牌交易,这家公司叫科大讯飞,今年在人工智慧竞赛中,勇夺语音辨识类别 3 项冠军。
赵坤茂认为,中国台湾有好的研究基础,让硬件产业和人工智慧技术结合,是中国台湾相关产业的大未来。高科技产业的下一波竞赛,就要靠实验室的顶尖头脑,才能胜出。
(本文由 财讯 授权转载)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。