特斯拉自动驾驶之父离职教线上课程,AI 大老原来热爱授业解惑
▼
几年前史丹佛大学博士生 Andrej Karpathy 做了一件让 AI 社群非常敬佩的事:创办深度学习大学课程,且全部影片免费公开。
身为深度学习早期研究者和教育者之一,Karpathy 赌对了方向。经过十多年快速发展和技术创新,深度学习技术已驱动搜寻、图像辨识、社群网络、工业自动化、自动驾驶等关键领域和产业。
由于研究成就突出,Karpathy 自己也成为应用 AI 技术发展的受益者。走出学术进入业界的第一份工作,就是特斯拉 AI 部门总监,领导 Autopilot 及整个特斯拉自动辅助驾驶技术研发,并带领公司深入机器人等更多领域。
7 月 Karpathy 宣布离开特斯拉。当人们还在关注他下一站去哪,他却毫不意外地“重操旧业”当起老师。
把“锤子”交到每个人手上
上周 Karpathy 重新启用注册多年但从没用过的 YouTube 副帐号,上传一支长达 2 个半小时的教学影片,标题“一步步带你入门神经网络和反向传播:构建 micrograd”。他表示,反向传播(神经网络的基础演算法之一)及构建神经网络,这支影片是目前门槛最低、最全面的讲解。他还宣称,只要观众对 Python 有基础了解,且还记得一点高中阶程度微积分,就能轻松入门:
如果看完还不了解反向传播和神经网络核心,那我就直播吃鞋子。
(Source:Andrej Karpathy)
Karpathy 用基本 Python 语言及他自己开发的 Micrograd 引擎,带领大家完成神经网络构建、编写损失函数、手动最佳化等基础操作,且对反向传播等关键知识系统性介绍。
至于授课风格,Karpathy 也非常理解当代年轻工程师写程式时的烦恼,贯彻“talk is cheap, show me the code”理念:整堂课大部分时间就是直播萤幕画面,一步步教大家写程式码。
Karpathy 曾在多伦多大学、史丹佛大学就读,师从 Geoff Hinton、李飞飞,都是深度学习领头羊。他也是 OpenAI 创始成员之一,曾在早期 Google Brain、Google Research、DeepMind 等知名研究机构实习。
身为深度学习领域的知名学者和从业者,Karpathy 出镜相当频繁,经常受邀至 CVPR、NeurIPS 等知名学术会议发表论文和演讲,还曾受邀为 Nvidia Geforce 技术大会主嘉宾。
颇搞笑的是,2014 年他以“血肉之躯”在 ImageNet 挑战赛对卷积神经网络发起挑战,并获得胜利,因此被学术界和业界戏称为 ImageNet 的“人类基准” (the human benchmark of ImageNet)。
然而很多人对 Karpathy 印象最深、最感激他的,是他读博士期间一件大善事:创办 CS231n,史丹佛第一门开给大学生的深度学习课程。
CS231n 以电脑视觉为主,深入浅出探讨深度学习技术,开课第一年就有 150 名学生报名,到 2016 年上升一倍,次年又再升一倍。目前这门课为史丹佛所有院系报名人数最多、最受欢迎的课程之一,助教就有 16 人,和 Karpathy 一起创课的李飞飞至今仍担任主讲人。
更重要的是,开课第二年,Karpathy 就把 CS231n 的授课影片、讲义、作业、笔记等大量资源全部公开。不只报名的学生,就算没报到名、其他院校学生,乃至世界任何人,只要有网络就可免费上课。
再往前推 5 年,随着 Udacity、Coursera 等公司的成立,“慕课” (MOOC,大规模开放线上课程)理念广为人知。这些知名公司平台也有不少电脑科学和机器学习课程。然 CS231n 横空出世,特别是更先进和即时课程设计,以及没有任何商业味属性,使其成为前瞻深度学习技术普及的关键点。
关于为何免费开放课程,Karpathy 曾表示,当时非常强烈感觉到深度学习将成为有巨大革命性意义的技术,有望对社会各方各面广泛运用,就像好用的锤子。但当年很多人连锤子都“买不起”,更别提了解能力或掌握用法──是他决定站出来免费发锤子给大家的原因。
这门课最有意思的地方,在于没有提前定好、绝不偏离的课程主轴:“别科目上课,可能讲 19 世纪知识。我们的课程经常今天讨论的论文就是上周、甚至昨天才发表的。我们不是讲核子物理学、不是上太空,你只需要基本微积分和代数知识,就能听懂课程,了解和掌握正在发生的新事物。每次课程都在变,感受非常不一样,但大家都非常享受。”Karpathy 说。
当时 Karpathy 还是博士生,当老师占去他大量时间和精力。每年教两次、每次四个月,一到上课那段时间,他都不得不发动 120% 精力,甚至与博士学位相关研究工作都得停摆。“尽管如此,我还是觉得这门课是我读博士期间的巅峰时刻。”
如果简单浏览 Karpathy 的履历,一般人可能不会以为他是教学型学者,但他真的特别热中传道授业解惑,特别是分享学习结果和掌握技能的独特经验。他曾以博士生过来人身分写过经验谈,发表于史丹佛官网及个人 Podcast。如对大学生备战考试,他真诚告诫大家“熬夜不值得”、“多找多换助教”、“备考初期自学,考前多交流”等。对纠结是否读博士的学生,他写过〈博士生存指南〉万字文,从前期准备、导师选择、研究课题、着述发表、学术演讲等方面,分享大量想法和具体经验。
如果你以为他只讲深度学习,那就太小看他了。
对非本科系内容,他也会用业余时间做长期、系统性研究和测试,然后写成文章。如他 GitHub 帐号写过“生物骇客”文章,分享于体育锻炼、断食、血液检测、体能药物、睡眠研究等方面的测试经验。
鲜为人知的是,Karpathy 还是专业的魔术方块老师。
他有一个 alter ego 名叫 Badmephisto,还有专门讲解魔术方块知识的网站,做过教人如何解魔术方块的 App(iPhone & Android),还在 YouTube 上传大量教学影片,共有 900 多万观看数。
这老哥可真是上课成瘾啊。
▲ Karpathy 在 Google 实习期间利用 Google Glass,录制这段边骑自行车边解魔术方块的影片。
AI 大老都爱上课
值得注意的是,不只 Karpathy,深度学习/AI 领域的大老级人物,都特别爱“上课”。很多人本身就在知名院校有常规或终身教职,一部分进入业界人士也有很强学术和教学背景,即使在业界身居高位忙到不行,仍对深度学习传播和普及充满热情。
如 Karpathy 多伦多大学的老师 Geoff Hinton 教授,是反向传播等深度学习核心演算法的发明人、深度学习领域“三剑客”之一、图灵奖得主。有条评价这样形容他:当其他人还在质疑机器/深度学习时,Hinton 在多伦多一边默默教书,一边持续研究,终于以一己之力复活机器学习研究和业界,堪称深度学习之父。
自从他创立的 DNNResearch 于 2013 年被 Google 收购,Hinton 在 Google 一直有职位,但主要研究工作还是多伦多大学电脑科学系教授。虽然近年他不怎么开课了,但仍然会花很多时间和精力,指导学生研究和参与论文写作,也参与录制深度学习神经网络的免费线上课程。
“三剑客”另外两位成员 Yoshua Benjio 和 Yann LeCun 也有教职。Bengio 是蒙特利尔大学教授,也创办 Mila 人工智慧研究所并担任科学总监。他至今仍在学校和 Mila 研究所带领和指导大量研究生、博士生和博士后研究员。他经常参加各种演讲和授课邀请,之后影片也都会网络公开。
LeCun 在 Meta 担任副总裁兼首席 AI 科学家,还是纽约大学电气和电脑工程系教授。他诚恳表示过,自己可能没办法及时查看、回复学校 Email 和电话留言。不过,至少去年他还在纽约大学资料科学中心(NYU-CDS)教深度学习课程。因疫情等原因,NYU-CDS 所有 LeCun 教授的深度学习课程,2020 年也都全部线上免费公开。
前几年离职回校教书的原腾讯 AI Lab 主任张潼也是例子。他是机器学习领域知名的国际专家,曾经在美国大学拿到终身教职,在 IBM 研究院、雅虎研究院、百度 IDL 担任研究和管理高阶职位,还是 ICML、NIPS 等国际顶级学术会议的主席或领域主席。然而可能是更享受教书和学术界环境,张潼 2019 年初离开腾讯 AI Lab,到香港科大数学系和电脑科学工程系,直接拿到专为特别杰出且成就非凡的学者才设立的讲座教授(chair professor)资格。
当然他也没有完全离开业界,在港科大和创新工场间牵线搭桥,帮助两家机构成立了联合实验室,专注基础科研。现在他在港科大做研究、带学生,这学期还开设 COMP6211E 和 MATH6450J 两个和机器学习最佳化相关的课程。
这些热爱传道授业解惑的顶尖学者让我们看到,即便高度商业化的今天,一项技术、一种知识,仍可藉教育这种古典形式,加上“免费网络课程”新方法,更高效、更具公益性普及。
这种大老请多来一点,最好不要停。
(本文由 品玩 授权转载;首图来源:影片截图)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。