大语言模型让 Databricks 和 Snowflake 开打:逼开发者选边站

▼
大模型风潮不可避免刮到大数据业,火药味还不小。这不快临近有人注意到,两家大数据业“宿敌”Databricks 和 Snowflake,今年双双把一年一度最重要峰会定于同时段:6 月 26~29 日举办。这可是这么多年都没有过的事。
不仅如此,两家还不约而同今年大会主题都定为AI。Databricks直接取名叫“Data+AI Summit”,官网点进去就是大大的“Generation AI”标题:
Snowflake也取了很流行的标题:“全球最大数据、App和AI主题大会”:
这说明两家公司明目张胆逼与会者选择:去完对面大会再来我们这,恐怕来不及喔。
两家公司一家在旧金山,一家在拉斯维加斯,开车要9小时,飞机也得1个半小时。有兴趣者想鱼和熊掌兼得,绝对要花钱花时间花精力。重头戏来了,不仅时间重叠,两家还各请到重量级来宾发表主题演讲:Databricks请来微软CEO萨蒂亚纳德拉(Satya Nadella),Snowflake则是辉达CEO黄仁勋。
网友提醒大家,两家峰会同时间举办,“如果你还没选边站,那么现在就是选择的时候了”。
Databricks Summit and Snowflake Summit are both on June 26-29, 2023. If you haven’t chosen sides, your time is coming .
— Zander (@MathesonZander) December 5, 2022
当然也有准备两边跑的人。Striim公司产品经理John Kutay就两大会都有演讲,不过也“评估拉斯维加斯到旧金山路程和时间”。还没做决定的网友问他Databricks演讲内容会是啥:“我想去,但到时候还得赶去SF,唉。”
Confirmed I’ll be speaking at both Snowflake Summit and Databricks Data and AI…we will test the limits of Las Vegas-San Francisco travel times.
— john kutay (@JohnKutay) May 10, 2023
有网友做了离谱的梦:“刚梦到所有人都在Snowflake大会感染新冠,因Snowflake不想让我们参加Databricks峰会……”
Just had a covid fever dream that we all got covid at Snowflake Summit because Snowflake didn’t want us to attend the Databricks Summit. Yes… I am not well.
— Andy (@notamyfromdbt) June 20, 2022
Snowflake和Databricks都是大数据分析公司的佼佼者。前者2021年创办,2020年9月上市,上市首日收盘股价飙升111.6%,收253.93美元,为美国有史以来规模最大软件IPO。Snowflake股东名单不乏Salesforce和巴菲特等大名鼎鼎投行。
创办于2013年的Databricks是一级市场超级独角兽,2021年连获两轮10亿美元高额融资,估值高达380亿美元。内地业者习惯称它“砖厂”。
两家不仅常被外界比较,彼此也各种明暗较劲。最有名的喊话是2021年,眼看Snowflake靠云端资料仓库就做到千亿市值,Databricks坐不住了,发文称数据湖技术创下TPC-DS基准测试纪录,还强调第三方研究实际性能可达Snowflake的2.5倍。
接着过了十天,Snowflake回应,公布测试结果,同时称Databricks性能比较结论不够完整,研究本身就有缺陷。Snowflake创办人还强调这基准测试没什么意义,这年代公布资料库基准测试结果是“将正常技术交流变成缺乏完整性的行销噱头”。
不甘心的Databricks再次回应,创办人于部落格发文,是更严重的指控:Snowflake为了测试结果竟然更改TPC-DS输入数据。
之后两家互呛就没停过。
2022年和投资人Matt Turck对谈,Databricks联合创办人兼CEO Ali Ghodsi还不避讳谈到与Snowflake的竞争。他先商业性夸夸Snowflake有“可能是市场最好的数据仓库”,且“Databricks与Snowflake共存可能70%客户”。
Snowflake主要技术是数据仓库,Databricks是数据湖,也是两家技术最主要的不同点。接着Ali Ghodsi就宣传自家数据湖,“公有云计算供应商有动力推动更多人资料存到他们的数据湖……我认为数据湖模式将获胜”。
产品性能你追我赶还没完,现在Databricks和Snowflake又暗地较劲大模型。
Databricks 3月公布“Dolly”(据说是致敬第一只复制羊多莉)开源大语言模型,称“只需30美元、一台服务器和3小时,我们就能教Dolly与人类互动”。这摆明针对ChatGPT等门槛更高产品,意思就是AI不再只有大型科技公司才负担得起,不用太多融资,任何人都能开发出像人类的AI。Databricks接着又在4月公布大语言模型开源反复运算版Dolly 2.0。
Snowflake也不断炒作大模型,4月发文称生成式AI和大语言模型搭建以数据为中心的平台,并详细解读这么做的依据和影响。5月Snowflake宣布收购新创公司Neeva,以数据云端平台添加基于AI的搜寻。
虽然AI大模型两家公司还没有踏进对方领域,不过这次年度峰会举办时间重叠已说明态度。有趣的是,有人在Google搜寻Snowflake conference,第一个结果却是Databricks大会连结,其次才是Snowflake。等于Databricks买竞争对手关键字,卖自己的广告。
Google搜寻输入“Databricks+Snowflake”,前两条都是广告(这结果是动态展示)──Databricks依然在竞价排名的第一位置宣传成绩,但第二是某家技术服务商,宣传帮客户迁移到Snowflake服务,甚至比两家直接竞价更有意思,Databricks依然可解读为(商业攻势)进攻性更强、更有战斗力,但两家竞争时某些技术服务商也寻找商机,且似乎更认为转移到Snowflake需求更大。
不论如何,一场大战又要开打了。现在大模型领域不缺参加者,到了Databricks和Snowflake这,或许就变成谁先干掉谁的问题。
(本文由 品玩 授权转载;首图来源:Snowflake/ Databricks)
▼

特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。