Grok3.0为目前为止最强AI大模型-榴榴杂谈

您现在的位置是：首页 > 榴榴无忌

Grok3.0为目前为止最强AI大模型

| 人围观 |

好寶貝2025-02-22 17:36:53

有人在我的贴乱回复我十分不满故此再发一贴支持马斯克的大模型Grok 3。

昨天中午12点，马斯克的AI公司xAI举办的发布会，发布了史上最强的AI模型GROK 3。发布会一共42分钟，有人代我全部看完了，真的是干货满满。接下来我把重要的内容给大家总结一下。发布会全程都是4个人，马斯克加上3个工程师。发布会没有任何的排场，就是四个人坐那儿纯聊。不过这么朴素的发布会形式，完全没有减少新发布的Grok 3给我带来的震撼。发布会一开始，马斯克就强调了xAI Grok 3模型的使命，他们的使命是了解宇宙的规律，只讲真相，拒绝为了那个政治正确而对事实进行扭曲，这个是狠狠打脸Deepdeek的。简单来说，你可以理解为马斯克想做的是个诚实不会扭曲输出的AI。我一直很好奇马斯克为什么把这个AI模型称为Grok，那这次发布会他解释了一下，Grok来自于一个名叫《异乡异客》的科幻小说，在小说里，Grok是火星语，它的意思是有强大的理解能力和同理心。好，接下来咱们聊聊干货的要点，第一，Grok 3的进步速度极快，比起Open AI和Deepseek都要快的。

Grok 3超过了目前为止现世所有的同类模型，包括刚出的Grok 2PRO、GPT4o，还有中国的deepseek D3。有人可能想问了，Deepseek最新的模型不是R1吗？马斯克不跟R1做对比是不是不公平？其实并不是，R1是推理模型，跟Grok 3不是一个类型，Grok 3也有推理模型，名叫Grok 3 Reasoning，那接下来我们来看一看推理模型的比拼。不难看出，在数学、科学和编程上，Grok 3的推理模型Grok 3 REASONING超过了所有的同类模型，包括刚出的谷歌的GEMINI2FLASH thinking open a I的O3MINI，还有咱们的deepseek c21。为了确保Grok 3是因为真的推理能力很强而得到高分儿，而不是因为过拟合蒸馏萃取，也就是把之前的题都背下来才得高分，团队还额外做了一个测试，发布会的5天前，2025年的艾米数学竞赛刚刚结束。这个竞赛的题没有被用来训练Grok 3包括其他的任何模型，所以说用这次竞赛的题可以测试出各个模型的真实的推理能力。

在数学推理、代码生成等测试中，超越了deepseek C3、GPT4o、GEMINI2等模型。马斯克称，它会像人类一样反思错误，Grok 3.0可以通过反复重读数据。来分析错误信息，并且自主纠错，确保逻辑一致性。马斯特表示，Grok 3.0上线几个月后，将会把上一代Grok 2.0直接开源，并推出了AI游戏工坊。用户可以通过自然语言来生成游戏，打造AI游戏生态系统，同时grok3 还将用于space火星任务的轨道优化，2026年取代传统计算模型，真是太疯狂了。

有人可能会说，分数高有什么用？分数高也有可能是高分低能。那为了客观评价Grok 3的实用性，XCI团队让Grok 3以chocolate的名字匿名参加了一个名叫Cha arena, 也就是聊天机器人竞技场这样的一个比赛。这个平台的运行方式是，用户问一个问题，这个平台会随机挑选两个不同的AI模型，分别给出答案，但是不会告诉用户背后用的模型是什么。在这种盲测里，用户选择他认为哪个答案更好。很明显，在这个比赛里，Grok 3也取得了第一，超过了所有的模型，包括open a I和谷歌的所有模型，以及咱们的Deepseek R1和B3。另外，在发布会现场，XCI的工程师还测试了两个具体案例，第一个是做出从地球发射火箭到火星，再从火星飞回到地球的模拟动画。Can see.Um, animating two different planets, Mars here and then the, 第二个是把俄罗斯方块和消消乐给结合起来，做一个新的游戏。Color I off the color are different.Grok 3都能完美完成任务。

Open AI是花了5年时间推出了GPT4O，而XAI在2023年才成立，只花了一年时间就推出了Grok 2，它的能力跟GPT4O是类似的，也就是说，马斯克花了一年时间干了open ai5年干的活儿。然后XAI的工程师就解释了为什么他们的进步速度这么快，他们认为算力是关键。这里面有一句话，Big intelligence requires bigute, 翻译过来就是强大的智能需要巨大的算力。从事实中确实模型能力和训练用的算力成正比。由于XAI团队有超强的搭建算力集群的能力简单说就是钱多人脉关系强大，所以在算力上，XAI很快就赶上open a I了，算力赶上了，模型能力也就赶上了。在算力上，XI也曾经踩过坑，之前他们也没有想搞自己的算力集群，但是他们发现只能搞到8000张显卡来训练。马斯克觉得这不行，XAI想要成功拥有最强大的AI模型，就必须要建立自己的算力集群。所以去年4月他们开始买入大量的英伟达显卡增加算力。

已使用及正在使用的英伟达显卡数量：据 2025 年 2 月 18 日 Grok 3 发布会上马斯克披露，Grok 3 训练过程累计消耗了 20 万块英伟达 GPU。
历史数量：2024 年 9 月，xAI 的超级计算机 “巨像”（Colossus）最初上线时使用了 100,000 块英伟达 H100 显卡。后续在 2024 年，又增加了一些 H200 显卡，使超级计算机的显卡数量扩充到 200,000 块。
规划数量：xAI 计划将超级计算机的显卡数量扩充到至少 100 万块，并且打算在 2025 年夏天将显卡数量提升到 300,000 块。
所以无论是财力还是无力马斯克都可以做到全球最顶级。

草榴社区是有人对马斯克不感冒，我觉得这些都是在哗众取宠想博取眼球关注而已。

继续查看作者相关内容：[db:标签]

上一篇：[图说] 在科学被攻击的时候，所有的科学家都有义务站出来（02.11）

Grok3.0为目前为止最强AI大模型

随便看看

内容排行

内容推荐

内容更新