虽然马斯克本人一脸疲态 ,但他亲自坐镇,给Grok 4的噱头拉到顶配 。
“宇宙最强模型 ”“它比所有领域的人类博士都聪明,无一例外”“Grok 4还没发明新科学或新物理定律只是时间问题”“Grok 4解决代码问题 ,比Cursor更好用 ”……
以上宣言,是马斯克为旗下AI公司xAI最新旗舰大模型Grok 4的定调。
Grok 4也确实争气,在“人类最后的考试”(Humanity's Last Exam)中 ,拿到了38.6%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3的21%。多智能体版本Grok 4 Heavy拿到了44.4%,如果进一步使用工具辅助 ,则能达到50.7% 。
这背后,是“暴力计算美学”,xAI耗时6个月搭建起来的10万块H100 GPU超级算力中心正在给出回报,Grok 4的训练量是Grok 3的10倍 ,是Grok 2的100倍。
回归商业世界的马斯克火力全开,接下来还计划 8 月推出代码模型,9 月上线多模态智能代理 ,10 月发布视频生成模型。
据悉,Grok已经被配置在了特斯拉最新固件里,未来也将通过人形机器人与现实世界交互 。
AI大模型 、自动驾驶、人形机器人、商业航天 ,马斯克的AI帝国正在越来越宏大,节奏也更甚从前。
Grok 4有多能打?
在多个高难度基准测试中,Grok 4表现出色。
马斯克在直播中强调 ,Grok 4在人文 、数学、物理、工程等学科均达到博士以上水平,“比几乎所有学科的研究生更聪明 ” 。
推理能力刷新纪录。Grok 4 拿到历史高分的“人类最后的考试”,是一份被称为“AI 世界终极试炼”的测试合集 ,这份专门针对AI的考卷,覆盖了数学 、化学、语言学、自然科学等一百多个学科,大模型在这份测试中无法依赖网络搜索,只能凭自己的理解和推理能力作答。
能应对这份考卷的Grok 4 ,推理能力有大幅提升,可以减少对现有知识框架的依赖。
除HLE测试领先外,Grok 4在GPQA(研究生级问答)中拿到了88.9% ,在美国数学邀请赛(AIME25)中拿下满分,ARC-AGI-2测试中以16.2%得分登顶(超第二名Claude Opus 4近一倍) 。
商业场景的落地验证方面,在名为 Vending-Bench 的商业模拟任务中 ,Grok 4 也表现突出,经营自动售货机时平均净资产达到 4684.15 美元,是第二名的两倍 ,证明了长期规划和多步骤推理能力。
值得注意的是,Grok 4的创新点在于“工具原生融合 ”架构。与多数模型后期接入工具不同,Grok 4在训练阶段嵌入了搜索 、代码执行等工具 ,使其能灵活调用资源解决复杂问题 。例如直播演示中,它通过检索学术论文、调用模拟工具,生成了黑洞碰撞的可视化动态模型。
不过,业内人士认为 ,Grok 4 的强项主要集中在推理和复杂知识整合方面,而在代码、多模态、图像和视频生成等方面还有进步空间。
“最贵”模型的想象空间
xAI同步推出了行业最贵订阅计划:Super Grok Heavy月费高达300美元,较OpenAI顶级订阅贵50% 。API定价同样激进 ,每百万token输入3美元 、输出15美元。
高定价背后其实是训练成本的陡增。Grok 4百倍于前代的训练量,依托10万块H100 GPU集群完成,xAI并未披露单次训练耗资 ,但马斯克提到的“我们快没有合适问题考验AI了”,侧面印证了模型能力已逼近当前测试极限 。
Grok 4的终极目标是与现实世界交互。马斯克透露,今年Grok 4还将融合有限元分析、流体动力学等工具 ,构建高精度物理模拟器(如黑洞模拟)。在他的规划中,Grok 4将通过Optimus(马斯克旗下的擎天柱)人形机器人连接现实,“让AI接受物理定律的最终检验” 。另有消息显示 ,目前特斯拉最新固件已预埋Grok,未来或将作为车载语音助手及自动驾驶的“大脑 ”。
“我们正站在智能大爆炸的开端。”马斯克表示,对AI的最终测试是现实世界,未来AI技术将会放到改进汽车或火箭等领域验证有效性。
“睡在算力中心”的掌舵人归来
从特斯拉Robotaxi(无人驾驶出租车)秀肌肉 ,到Grok 4的暴力美学,近10天,马斯克已经称霸舆论场两回 ,他正以标志性的激进节奏推进业务 。
马斯克所布局的自动驾驶、AI大模型 、人形机器人、商业航天,逐渐形成闭环。Grok大模型作为“大脑 ”,驱动特斯拉自动驾驶、Optimus机器人行动决策;特斯拉车辆与机器人反馈的真实场景数据 ,反哺模型迭代;其旗下SpaceX星链提供全球低延迟通信,支撑实时AI交互。
OpenAI的ChatGPT-5还在酝酿中,目前AI军备竞赛进入“马斯克节奏” 。马斯克的算力碾压 、多场景捆绑 ,确实具有更宽广的应用想象力。
但在AI大模型快速迭代的当下,有多少用户愿意为了300美元月费的Grok 4买单,还是未知数。
高调背后也暗藏风险 。Grok近期因发表反犹言论遭土耳其封禁、波兰政府投诉 ,迫使xAI紧急删除不当内容并调整审核策略。在“AI寻求真理”的路上,如何在开放性与安全性间平衡,不只是OpenAI 塞姆·奥特曼的难题,也是马斯克的。
马斯克在今天的直播中说:“安全是最重要的事 ,我们需要确保AI是一个好AI 。你可以把AI看作是超级天才的孩子,它最终会比你聪明,但我们仍然要灌输正确的价值观。 ”
官网股票配资:炒股票软件下载排名-AI模型首次出现“抗命不遵”!AI安全公司称OpenAI o3模型出现异常
股票的app哪个好:中国十大杠杆配资公司-生肖行情轮到“马”!5天股价接近翻倍 市场热钱频频“扫货” 这些已获融资客重仓
股票开户网上怎么办理:关于股票交流群-中央网信办深入开展“清朗·整治AI技术滥用”专项行动第一阶段工作
炒股配资排名:股票开户第二天几点能买入-【业绩会直击】小米重磅发布 又“史上最强”!营收大增近50%!
股票:中国期货开户条件-摩尔线程精彩亮相2025中国移动云智算大会,以全栈AI赋能智算新时代
中国股票配资网官网最新信息:股票要怎么买,怎么开户呢-十大券商策略:市场行情有支撑!权重指数有望迎来重估
十大股票杠杆排名:股票配资配资配资-炸锅了!“有钱没货” 价格一个月飙升53%!全球前三大巨头集体停产 这些受益股高成长
卓信宝配资提示:文章来自网络,不代表本站观点。
【隔夜行情】•周四(2025年3月20日),A股三大指数集体回调,截至收盘,上证综指跌0.51%,报3408.9...
记者|张乔遇骑行热潮的兴起,直接带动了自行车及相关装备市场的火爆。去年以来,自行车尤其是高端自行车以及相...
界面新闻记者|龙力开年两个多月,不少头部量化私募都在积极“上新”。Wind数据显示,截至3月17日,...
作者:华人家族财富夏言 1.根据莱坊国际发布的最新报告,全球高端物业2021年的升值速度创下...
根据新股发行安排,今日有2只新股申购,浙江华远(301535.SZ)发行价格为4.92元/股;胜科纳米(688757.S...
界面新闻编辑|江怡曼4月11日,江苏证监局发布公告称,因苏州银行基金托管业务存在问题,对其采取出具警示函的监...