94亿,aigc最大并购案诞生-博天堂ag

 

                                   圳纵横集团有限公司

                     shenzhen zongheng   group co,ltd

   
快速导航   quick navigation
94亿,aigc最大并购案诞生

时间:2023-07-23    信息来源:纵横集团
-------------------------------------------

62人的公司,卖了94亿。


近日,大数据巨头公司databricks宣布亿13亿美元的价格(约合94亿人民币)收购生成式ai初创公司ml。该笔发生在美国硅谷的收购案,为年内生成式ai领域内公布的最大一笔。引来业界高度关注。

mosaicml于2021年成立于美国旧金山,其刚成立不久便成功完成了第一轮融资,知名风投dcvc、lux capital、future ventures等投资机构参与,mosaicml共获得3700万美元的融资。

第一轮融资时,mosaicml公司估值为2.2亿美元,但在此次收购中,mosaicml的估值直接提高近6倍,令业界感到惊叹。

成立不到两年,估值便如此之高,这家生成式ai初创公司到底有何“看家本领”?

01

ai模型服务企业端

产品质优价廉

根据公开资料显示,mosaicml的产品组合包括开源的、商业授权的mpt foundation系列模型和mosaicml 推理和训练服务。

其推出的mosaicml composer开源的深度学习库,提供20种用于计算机视觉和自然语言处理的方法,包括模型、数据集和基准。推出的mosaicml explorer可以帮助开发人员探索和理解不同的云服务和硬件选项之间的时间、性能和成本,以简化和评估实施选项。推出的mosaicml ai开发平台,提供了成本效益高的模型部署和定制训练,同时保证数据安全,使用户能够拥有模型的所有权等。

值得一体的是,mpt基础模型系列是mosaicml 提供的一系列开源、商业可用的大型语言模型,它们可以作为用户构建自己的生成式ai应用的基础。

mosaicml 的mpt基础模型系列包括mpt-7b 和mpt-30b 两个模型,分别有70亿和300亿个参数。

mpt-7b是mosaicml在今年5月5日发布的类chatgpt开源大语言模型。mpt-7b 在mosaicml平台上进行了9.5天的训练,零人工干预,成本仅用了20万美元。该模型具备可商业化、高性能、资源消耗低、1t训练数据、可生成代码等技术优势。

ai2、generally intelligence、hippocratic ai、replit 和 scatter labs等知名厂商皆使用mpt-7b开发各种生成式ai产品。

截至目前,mpt-7b开源项目的下载量超过300万次。收购方databricks表示,这也是其收购mosaicml的重要原因之一。

另一款模型mpt-30b推出之后,同样引来业界关注,十分受欢迎。其训练成本远低于其他竞争对手,有望推动ai模型在更广泛领域的应用并逐步降低训练成本。

mosaicml首席执行官兼联合创始人naveen rao表示,mpt-30b的训练成本仅为70万美元,远远低于类似产品如gpt-3所需的数千万美元训练成本。该模型由于成本低、体积小,可以更快速地进行训练,并且更适合在本地硬件上部署。

mosaicml还介绍称,公司用 2 个月的时间训练了 mpt-30b,通过数据混合进行预训练,从 10 个不同的开源文本语料库中收集了 1t 个预训练数据 token,并使用 eleutherai gpt-neox-20b 分词器对文本进行分词,并根据上述比率进行采样。

需要注意的是,开发者可以从hugging face下载并使用开源的mpt-30b基础模型,还可以使用自己的数据在本地硬件上进行微调。

mosaicml同时表示,将模型参数扩展到300亿只是第一步,随后他们将以降低更低成本推出更大体积、更高质量的模型。

mosaicml另一个比较有亮点的产品是今年推出的面向企业的mosaicml推理。

mosaicml首席执行官兼联合创始人naveen rao表示:“一些初创公司已经在使用mosaicml的模型和工具来构建自然语言前端和搜索系统。mosaicml允许企业使用公司的模型架构根据自己的数据训练模型,然后通过其推理api部署模型。如果客户训练了一个模型,他们可以放心,他们拥有该模型的所有迭代,该模型就是他们的。我们对此不拥有所有权。使用 mosaicml 的新推理产品,企业客户可以部署用于文本完成和文本嵌入的 ai 模型,其成本比使用openai的llm低4倍,而图像生成的成本比使用openai的dall-e 2便宜 15倍。”

“我们希望让尽可能多的人了解和使用这项技术,这就是我们的目标。这并不是排他性的。这不是精英主义。”naveen rao同时表示。

02

由英特尔前高管创立

mosaicml起点不低

作为初创公司的mosaicml,为何会连续推出爆款产品,这当然很其创始人有很大关系。

mosaicml是由曾在英特尔担任ai产品负责人、nervana systems 的联合创始人 naveen rao ,以及英特尔ai实验室的高级主管hanlin tang创立。

mosaicml的创始人naveen rao ,1997年毕业于杜克大学的计算机科学专业,后取得布朗大学神经科学的博士学位。naveen rao长期致力于人工智能神经网络的学习和开发,曾在高通担任过神经形态机器的研究员,并在2014年创立了人工智能公司nervana systems。后来这家公司在2016年以4.08亿美元被英特尔收购。

hanlin tang毕业于哈佛大学,研究人类视觉中的递归神经网络。他在普林斯顿大学取得物理学学士学位,随后在哈佛大学取得生物物理学的博士学位,研究人类视觉中的递归神经网络,hanlin tang少年时代在台北度过。后来加入英特尔后,在英特尔ai实验室担任高级主管,在此期间hanlin tang负责算法工程和深度学习研究,并参与了mlperf基准测试的开发。

hanlin tang在国际顶级期刊和会议上发表了多篇论文,涉及计算神经科学、计算机视觉、自然语言处理和强化学习等领域。

还有一位值得一提的团队成员是mosaicml的首席科学家jonathan frankle,他是mit计算机科学与人工智能实验室的博士后研究员,也是哈佛kempner研究所的附属教员。jonathan frankle的研究方向是神经网络的学习动力学和训练算法,旨在提高大型语言模型(llm)的效率同时降低训练成本。这一研究方向也正是mosaicml的核心竞争力所在,可以说jonathan frankle是mosaicml能卖到94亿的关键人物。

naveen rao和hanlin tang之所以能在英特尔任职,是因为nervana systems开发了neon 这一高性能的深度学习框架,以及后来推出的nervana cloud深度平台、nervana engine专用硬件加速器,英特尔认为这些产品非常有价值,就把nervana systems收购了。naveen rao和hanlin tang也一起加入英特尔,一位成为了ai产品集团的负责人,一位成为了ai实验室高级主管。

不过,2020年英特尔宣布放弃原计划的nervana服务器端ai加速芯片,去耗资20亿美元收购以色列公司habana的产品。

在英特尔决定“抛弃” nervana后,naveen rao和nervana的前核心员工hanlin tang也一起离开了英特尔,两人另立门户创立了今天的mosaicml。根据linkedin的信息,目前hanlin tang担任mosaicml的cto。

03

databricks收购mosaicml

强强联合?

databricks收购mosaicml不仅仅是因为商业价值,更是为了两个公司可以强强联合,实现技术上的突破,加码ai大模型。

先来看看收购方databricks,这是一家数据存储和分析领域的巨头公司,由美国加州大学伯克利 amp 实验室的 spark 大数据处理系统多位创始人联合创立。databricks 的客户遍及大中小企业,以及各个行业。截至 2023 年 03 月,其全球已有超过 9000 家企业用户。包括 at&t、壳牌、巴宝莉、丰田、walgreens、adobe、康泰纳仕和再生元制药等。

2021 年,databricks拿下了摩根士丹利旗下counterpoint global领投的16亿美元h轮融资。2023年4月18日,databricks以298亿美元亿的估值入选《2023·胡润全球独角兽榜》,名列第七。

业内专家表示,收购完成之后,mosaicml 将成为 databricks lakehouse 平台的一部分,mosaicml 的整个团队和技术都将纳入 databricks 旗下,为公司提供统一的平台来管理数据资产,助力 databricks更好的开发生成式ai技术。同时能够使用自己的专有数据来构建、拥有和保护自己的生成式 ai 模型。

databricks 的 ceo ali ghodsi 也表示,收购 mosaicml 将进一步增强 databricks 的数据分析平台。

databricks收购mosaicml是为加码ai大模型是主流观点,原因是mosaicml因其尖端的mpt大语言模型而受到认可,mpt-7b和mpt-30b都是今年开发的爆款产品,下载量均突破百万。

值得一提的是,mosaicml的模型训练自动优化使得训练速度比标准方法快2-7倍,而资源的近线性扩展允许在几小时内训练多十亿参数的模型。

借助于双方的联合产品,databricks和mosaicml的目标是将训练和使用llms的成本从数百万美元降低到数千美元。

由此可见,databricks正试图加码ai大模型,去挑战openai、微软、谷歌等大公司的市场地位,为行业带来新的选择。

但也有反对观点认为databricks 整合 llm 的价值主张是不太明确,因为databricks主营lakehouse,主要是用spark来处理大规模集群数据,因此其整合大语言的价值并不明确。还有业内人士认为,databricks 是在借当前大模型热度进行炒作,收购对技术方面不会有明显的突破,mosaicml 迟早会被databricks放弃。

这起收购案能否能获得良好的效果,在实现商业价值的同时,也能有技术突破,可能仍需要等待时间去验证。

财经方面专家认为,收购mosaicml的交易可能是这家ai独角兽公司为ipo之路打下基础。

04

ai大模型并购潮拉开大幕

去年末chatgpt的横空出世,拉开了ai竞赛的大幕,半年之后,又出现了ai并购潮。

原因无外乎是生成式ai经过一段时间的野蛮生长,然后大型企业取得一定的进展,同时也发现了现有技术和人才的不足,而那些ai初创公司,相对来说要专业一些,既有人才也有技术,但存在资金不足、资源稀缺等问题。所以ai并购潮现在出现是必然的,对于整个行业来讲也是正向的、有利的。

除了本文介绍的databricks收购mosaicml之外,今年5月,云计算巨头snowflake宣布收购了由两位前google员工创立的生成式ai搜索初创公司neeva。业内专家认为,此次收购将使snowflake能够利用尖端的搜索技术,并将其注入到数据云中,充分客户、博天堂登陆的合作伙伴和开发者的需求。

值得一提的是,neeva的领导团队成员在创建youtube货币化和google的搜索广告等产品时,起到了非常重要的作用。不出意外的话,此次收购将把snowflake中的搜索和对话提升到一个新水平。不过此次收购的金额并没有对外公布。

6月26日,全球最大的专业信息服务提供商汤森路透宣布,以6.5亿美元现金收购ai初创公司casetext,该公司主营业务是为法律人士提供ai助理服务。

公开资料显示,casetext员工数为104名,客户包括1万多家律师事务所和企业法务部门。其主要产品cocounsel是一款于今年推出的人工智能法律助理,由gpt-4提供支持。该笔收购将有效补充汤森路透现有的ai路线图。

6月29日,ai初创公司inflection宣布完成13亿美元融资,该轮融资由微软、英伟达等牵头投资,其融资总额达到15.25亿美元。

再看中国的ai市场,6月29日,美团发布公告,宣布已完成光年之外境内外主体100% 的股权收购,耗资20.65亿人民币。

对于此次并购,美团在公告表示,光年之外是中国领先的agi创新者,其目前的管理与技术团队具有开发深度学习框架的高水平经验。公司通过收购事项可以获得领先的agi技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。

美团方面表示,并购完成后,将支持光年团队继续在ai大模型领域进行研究和探索。

无独有偶,今年6月16日,发布公告称,旗下控股子公司star group拟发股收购全部股权。

singularity ai致力于实现通用人工智能,目前聚焦于自然语言大型预训练模型及开发者api的研发工作,主要产品及服务包括通用开发者api、聊天机器人和知识抽取。

国外出现ai并购潮,释放出了一个强烈的行业信号,意味着国外aigc的发展已经开始升级,无论是技术、业务、场景还是商业化,都随时可能出现颠覆性的创新。

对于国内ai市场,投资人持谨慎乐观态度。总的来说是b端应用面临企业端数字化缓慢,软件付费意愿不强,商业化缓慢等问题,对比国外ai市场依然差距不小。

不过我们也要看到,中国是美国市场之外唯一一个拥有完整的aigc产业链的国家,在这场第四次工业革命之中,大家都没有退路。

参考资料:https://baijiahao.baidu.com/s?id=1770181890496791618&wfr=spider&for=pc

硅谷老钱和中国巨头,ai并购潮的同行不同命http://t.10jqka.com.cn/pid_294033785.shtml

aigc领域最大收购:databricks 13亿美元买下mosaicml,成立仅2年员工60人。

办公环境   office environment
博天堂登陆的合作伙伴   partner
    
网站地图