
昨天中午12点,马斯克的AI公司xAI举办的发布会,发布了史上最强的AI模型GROK 3。发布会一共42分钟,有人代我全部看完了,真的是干货满满。接下来我把重要的内容给大家总结一下。发布会全程都是4个人,马斯克加上3个工程师。发布会没有任何的排场,就是四个人坐那儿纯聊。不过这么朴素的发布会形式,完全没有减少新发布的Grok 3给我带来的震撼。发布会一开始,马斯克就强调了xAI Grok 3模型的使命,他们的使命是了解宇宙的规律,只讲真相,拒绝为了那个政治正确而对事实进行扭曲,这个是狠狠打脸Deepdeek的。简单来说,你可以理解为马斯克想做的是个诚实不会扭曲输出的AI。我一直很好奇马斯克为什么把这个AI模型称为Grok,那这次发布会他解释了一下,Grok来自于一个名叫《异乡异客》的科幻小说,在小说里,Grok是火星语,它的意思是有强大的理解能力和同理心。好,接下来咱们聊聊干货的要点,第一,Grok 3的进步速度极快,比起Open AI和Deepseek都要快的。
Grok 3超过了目前为止现世所有的同类模型,包括刚出的Grok 2PRO、GPT4o,还有中国的deepseek D3。有人可能想问了,Deepseek最新的模型不是R1吗?马斯克不跟R1做对比是不是不公平?其实并不是,R1是推理模型,跟Grok 3不是一个类型,Grok 3也有推理模型,名叫Grok 3 Reasoning,那接下来我们来看一看推理模型的比拼。不难看出,在数学、科学和编程上,Grok 3的推理模型Grok 3 REASONING超过了所有的同类模型,包括刚出的谷歌的GEMINI2FLASH thinking open a I的O3MINI,还有咱们的deepseek c21。为了确保Grok 3是因为真的推理能力很强而得到高分儿,而不是因为过拟合蒸馏萃取,也就是把之前的题都背下来才得高分,团队还额外做了一个测试,发布会的5天前,2025年的艾米数学竞赛刚刚结束。这个竞赛的题没有被用来训练Grok 3包括其他的任何模型,所以说用这次竞赛的题可以测试出各个模型的真实的推理能力。
在数学推理、代码生成等测试中,超越了deepseek C3、GPT4o、GEMINI2等模型。马斯克称,它会像人类一样反思错误,Grok 3.0可以通过反复重读数据。来分析错误信息,并且自主纠错,确保逻辑一致性。马斯特表示,Grok 3.0上线几个月后,将会把上一代Grok 2.0直接开源,并推出了AI游戏工坊。用户可以通过自然语言来生成游戏,打造AI游戏生态系统,同时grok3 还将用于space火星任务的轨道优化,2026年取代传统计算模型,真是太疯狂了。
有人可能会说,分数高有什么用?分数高也有可能是高分低能。那为了客观评价Grok 3的实用性,XCI团队让Grok 3以chocolate的名字匿名参加了一个名叫Cha arena, 也就是聊天机器人竞技场这样的一个比赛。这个平台的运行方式是,用户问一个问题,这个平台会随机挑选两个不同的AI模型,分别给出答案,但是不会告诉用户背后用的模型是什么。在这种盲测里,用户选择他认为哪个答案更好。很明显,在这个比赛里,Grok 3也取得了第一,超过了所有的模型,包括open a I和谷歌的所有模型,以及咱们的Deepseek R1和B3。另外,在发布会现场,XCI的工程师还测试了两个具体案例,第一个是做出从地球发射火箭到火星,再从火星飞回到地球的模拟动画。Can see.Um, animating two different planets, Mars here and then the, 第二个是把俄罗斯方块和消消乐给结合起来,做一个新的游戏。Color I off the color are different.Grok 3都能完美完成任务。
Open AI是花了5年时间推出了GPT4O,而XAI在2023年才成立,只花了一年时间就推出了Grok 2,它的能力跟GPT4O是类似的,也就是说,马斯克花了一年时间干了open ai5年干的活儿。然后XAI的工程师就解释了为什么他们的进步速度这么快,他们认为算力是关键。这里面有一句话,Big intelligence requires bigute, 翻译过来就是强大的智能需要巨大的算力。从事实中确实模型能力和训练用的算力成正比。由于XAI团队有超强的搭建算力集群的能力简单说就是钱多人脉关系强大,所以在算力上,XAI很快就赶上open a I了,算力赶上了,模型能力也就赶上了。在算力上,XI也曾经踩过坑,之前他们也没有想搞自己的算力集群,但是他们发现只能搞到8000张显卡来训练。马斯克觉得这不行,XAI想要成功拥有最强大的AI模型,就必须要建立自己的算力集群。所以去年4月他们开始买入大量的英伟达显卡增加算力。
已使用及正在使用的英伟达显卡数量:据 2025 年 2 月 18 日 Grok 3 发布会上马斯克披露,Grok 3 训练过程累计消耗了 20 万块英伟达 GPU。
历史数量:2024 年 9 月,xAI 的超级计算机 “巨像”(Colossus)最初上线时使用了 100,000 块英伟达 H100 显卡。后续在 2024 年,又增加了一些 H200 显卡,使超级计算机的显卡数量扩充到 200,000 块。
规划数量:xAI 计划将超级计算机的显卡数量扩充到至少 100 万块,并且打算在 2025 年夏天将显卡数量提升到 300,000 块。
所以无论是财力还是无力马斯克都可以做到全球最顶级。
草榴社区是有人对马斯克不感冒,我觉得这些都是在哗众取宠想博取眼球关注而已。