美西时间今天早间,大数据巨头Databricks 宣布已签署最终协议,将以13亿美元的价格,收购位于旧金山的人工智能初创公司MosaicML 。
该收购之后,MosaicML 将成为 Databricks Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入Databricks旗下,为企业提供统一的平台来管理数据资产,并且能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。
值得注意的是,MosaicML是一家非常年轻的生成式AI公司,它于2021年成立于旧金山,目前只公开披露过一轮融资,员工仅62人。在上一轮的融资中,其估值为2.2亿美元,也就是说,此次收购MosaicML的估值直接跃升了6倍。
(相关资料图)
此笔交易是截至目前今年生成式AI领域内所公布的*一笔收购案。就在不久前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。在经历了几个月的投资热之后,大型企业对生成式AI初创公司的大规模并购潮似乎正在开启。
1、MosaicML是谁?
MosaicML 由曾在 Intel 担任人工智能产品负责人、Nervana Systems 的联合创始人 Naveen Rao 以及英特尔AI实验室的高级主管Hanlin Tang创立。
MosaicML的创始人,Hanlin Tang(左一)、Naveen Rao(左二),图片来自MosaicML
Naveen Rao 1997年毕业于杜克大学的计算机科学专业,后取得布朗大学神经科学的博士学位,长期致力于人工智能神经网络的学习和开发。他曾在高通担任过神经形态机器的研究员,并曾在2014年创立了人工智能公司Nervana Systems。
或许现在很多人并不熟悉Nervana Systems,但在深度学习和AI芯片领域,Nervana可以说曾经风头无两。Nervana 的目标是通过其云服务和硬件产品来改善深度学习的计算效率,它在2015年推出了*性能的深度学习底层框架Neon在业界一炮而红,紧接着在2016年推出了Nervana Cloud深度学习云平台,以及Nervana Engine专用硬件加速器。
Nervana 表示,在Nervana Cloud中把Neon框架运行在Nervana Engine芯片上后,该组合能够比英伟达Titan X的性能高出10倍。Nervana的强劲表现在当时也引起了芯片霸主英特尔的注意,而英特尔在AI领域所迈出的*个大动作就是——花4亿美元收购Nervana。
2016年关于英特尔收购Nervana的报道,图片截自于Vox
被收购之后,Naveen Rao成为了英特尔人工智能产品的负责人,Neon架构和Nervana的相关产品也被整合到英特尔的产品线中,Nervana Engine被定名为Crest系列。
此后,在2017年-2019年间,英特尔多次发布Nervana Lake Crest的进展,并多次公布包括Nervana NNP-T系列等相关芯片产品。但就在大家等待着该系列芯片量产时,2020年,英特尔突然宣布将用自己后来花20亿美元收购的以色列公司Habana系列产品取代原定的Nervana服务器端AI加速芯片。当时业界分析的原因是Habana的技术和设计更具可扩展性,并且已经具有量产交付能力。
而在英特尔决定“抛弃” Nervana后,Naveen Rao和Nervana的前核心员工Hanlin Tang也离开了英特尔,两人另立门户创立了MosaicML。根据LinkedIn的信息,Hanlin Tang应该是一名华裔,曾在哈佛大学取得生物物理学博士学位,目前担任MosaicML的CTO。
那么,从英特尔“出走:后的MosaicML主要做什么业务呢?
MosaicML仍然致力于帮助企业提高AI效率上,只是这次他们不再在硬件上投入过多精力,而是专注于生成式AI。简单来说,MosaicML提供了一个平台,让各类型企业都可以轻松地在安全的环境中训练和部署 AI 模型,并且帮助企业降低AI系统的开销。
他们的产品组合产品组合包括开源的、商业授权的MPT Foundation系列模型和MosaicML 推理和训练服务,为企业提供了一系列的工具。
比如,MosaicML Explorer可以帮助开发人员探索和理解不同的云服务和硬件选项之间的时间、性能和成本,以简化和评估实施选项。推出MosaicML Composer开源的深度学习库,提供20种用于计算机视觉和自然语言处理的方法,包括模型、数据集和基准。推出MosaicML AI开发平台,提供了成本效益高的模型部署和定制训练,同时保证数据安全,使用户能够拥有模型的所有权等。
图片来自MosaicML官网
2、瞄准企业服务,Databricks也要用生成式AI出招
回看MosaicML的创始团队,可以说他们的业务选择一直都比潮流*了一步。在大家都还在观望时做AI芯片,在AI行业的低谷中做率先探索生成式AI的商业化。
凭借着强大的团队技术背景和行业经验,MosaicML刚成立不久就得到了知名风投DCVC、Lux Capital、Future Ventures等投资者3700万美元的融资,之后的融资总额攀升到了6400万美元。据了解,Databricks收购MosaicML,主要还是看中其生成式AI模型在企业端的商业化能力。
MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。
而此次收购之后,Databricks的Lakehouse 平台和 MosaicML 技术的联合产品将能够让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,可以进行自定义 AI 模型开发。
图片来自MosaicML官网
MosaicML 的模型训练自动优化承诺比传统方法快 2–7 倍的训练速度,资源的近线性可伸缩性确保了具有数十亿参数的模型可以在几小时内训练,而不是过去的几天。根据Databricks的相关说法,在 Databricks 和 MosaicML的平台和技术支持下,企业训练和使用 LLMs 的成本将显著降低,预计可以降至数千美元左右。
值得注意的是,在MosaicML加入之前, Databricks曾基于EleutherAI 的 Pythia-12b 开发了一个名为 Dolly-2 的120 亿参数语言模型,而伴随着此次 MosiacML的加入,Databricks未来将提供 Dolly-2 和 MosaicML MPT两个*的大语言模型。
“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。Databricks 和 MosaicML 有一个难以置信的机会来实现人工智能的民主化,并使 Lakehouse 成为构建生成式人工智能的*场所。”Databricks 联合创始人兼首席执行官 Ali Ghodsi 在新闻稿中表示。
3、60名员工喜提“大礼包”,AIGC并购潮拉开帷幕
MosaicML收购是目前生成式 AI 领域里目前公开披露的*交易,高达13亿的收购额对于目前仅有62员工的MosaicML来说也无疑是天降“大礼包”。
根据Levels.fyi的数据,此前MosaicML的软件工程师的薪资平均水平在75万美元到85万美元之间。员工的期权会以现金折现或是转成Databricks的期权目前还尚不清楚,但而此次收购之后,MosaicML的整个团队都将加入Databricks。
图片来自Levels.fyi
在当前的AI热潮下,大型公司对于生成式AI初创公司的并购或许才刚刚拉开帷幕。
不久前,云数据管理领军企业 Snowflake刚宣布收购了由两位前 Google 员工创立的生成式AI搜索初创公司 Neeva,交易额并未向外公布。Neeva主要业务是利用生成性 AI 进行搜索,并且主要聚焦在企业搜索领域。加入Snowflake之后,Neeva将帮助服务企业客户利用AI去快速搜索和分析数据点、数据资产,获得数据洞察的能力。
从Snowflake和Databricks接连的收购步伐中我们可以看到,大型科技公司对于生成式AI技术正在从自主研发、战略投资逐步迈向兼并收购阶段。这也给一些初创型生成式AI公司提供了更多的机会,不出意外的话,我们还会在今年下半年看到更多类似的收购案出现。
此外,无论是这两笔大型收购的应用方向,还是、Anthropic等近期高歌猛进的独角兽,其业务重点都主要是在生成式AI技术的企业级应用方面。
在消费端热闹了大半年之后,生成式AI技术开始大举朝着企业用户进军。