“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?
财经观察员
2024-09-20 23:30:16
0

甚至原本要给特斯拉用的GPU,也被马斯克要求优先供应给xAI。

图片

有个怪事儿,前段时间,大模型竞技场上,一位代码为 sus-column-r 的匿名模型横空出世。

没人知道它师出何门,但在过去的一个月里,它却称得上是过关斩将。。。

累计一万多人的投票,硬生生让它挤进了排行榜前列。到现在,综合能力已经和 5 月 13 号发的 GPT-4o ( API 版本 )并列第三了。

看这势头,当时就有不少人猜测,这可能是 OpenAI 那个迟迟没向大众公布的,神秘的 “ 草莓 Q* ” 项目。

然而,就在昨天,这个困扰大伙儿很久的谜语,终于有答案了。但解开它的,不是 OpenAI ,而是经常被大家忽略,但也在搞 AI 的马斯克。

这个匿名的 sus-column-r 模型,其实就是 xAI 要推出的新模型 Grok2 ,现在已经上线会员版的 X 了。

而之所以在大模型竞技场上整这么一出,说白了,是想给昨天的发布热热场子。

像是在官宣推出 Grok2 的博客里,就明晃晃地展示了之前 sus-column-r 积累的战绩,甚至还做了对战胜率表。

按照他们自个儿的说法,表里面除了谷歌的 Gemini 1.5 Pro 外,其余无论是 GPT-4o ,还是 Claude3.5 Sonnet ,都只能是 Grok2 的 “ 手下败将 ” 。

当然了,其他的纸面成绩, Grok2 答得也挺不错。光从各个基准的数据来看,它的各项能力,都和市面上最先进的 AI 差不多,这一线大模型的行列,也算是被 Grok 给挤进去了。

不过在世超的标准里,一个模型好不好,光看这些数据也还不行,最重要的是,得看大伙们的实际使用体验。

相较于上次的还只能文字开开玩笑的 Grok1.5 ,这次 Grok2 最明显的一个升级,就是新增了图片功能。

但和其他家自己动手搞多模态 AI 不一样,这次马斯克倒挺罕见地选择了和别人合作。

合作的对象,差友们应该还有点印象,就是前两天咱刚写过的 FLUX.1 。

看到这,世超也没对 Grok2 的图片功能抱太大的期待,毕竟是前脚刚试过的 AI 。。。

但没想到集成到 Grok2 里面的 FLUX.1 ,还真撞出了一点不一样的火花。

倒也不是说,在性能上它一夜之间飙升了一大截。而是相较于市面上的其他图片 AI , Grok2 的整活能力可以称得上是一骑绝尘。

同样是迪士尼公主的一个提示词, Grok2 在尺度上就比其他模型要大胆的多。

而且, Grok2 还能直接对着自己的老板恶搞,比如这是一个爱吃甜品,吃到发胖的马斯克。

转眼,他还能穿越到权力的游戏里,玩角色扮演。

更搞的是,还有网友直接拿 Grok2 生成的图,和视频 AI 配合起来,做起了视频。

不过, Grok2 这么肆无忌惮地恶搞各种公众人物、卡通人物,风险肯定还是有的。

像是有网友生成马里奥抽烟喝酒、观望 “ 911 ” 事件的图片,就已经有人督促任天堂起诉了。

除了新增有图片功能外, Grok2 这次提升的基础能力,咱肯定也得上手测测,看看实力。

考虑到目前 X 上线的,还只是性能差一点的小杯 mini 版,于是世超在大模型竞技场上,试用了下能力更强的 Grok2 ,还拉来了最新版本的 GPT-4o 作比较。

比试第一招,先从 AI 容易犯错的题目开始。前段时间,大模型集体在 “ 小数比较 ” 上翻车,大伙应该都听说过了。

这次再来波经典重现,让它俩来比比 9.5 和 9.11 的大小。

没想到的是, GPT-4o 依旧是死性不改,结果对了,但一看解题思路,完全就是一塌糊涂。反倒是 Grok2 倒有理有据,给出了正确答案。

还有经典的数数问题, GPT-4o 依旧让人大跌眼镜, “ 我一把把把把住了 ” 它竟然数出来 5 个把字, Grok2 这边倒还是稳定发挥。

不过紧接着问它俩这句话的意思, Grok2 就有点露怯了,乱说了一大堆,没一个踩到得分点。而这次 GPT-4o 简单几句话就给解释清楚了。

接下来世超又试了一些比较基础的常识性问题,比如说 “ 李政道是谁 ” ,它俩回答的,都还算正确。就是不知道为啥, GPT-4o 很容易犯懒,草草几句话就结束了。

而 Grok2 这边,每次给出得答案都挺详细,还贴心地分了类。

反正世超在实际用的时候,是真有感觉到 Grok2 能力的提升。

另外,按照官方给的数据,这次 Grok2 在数学这块儿,也能算得贼溜了。

于是我就又翻出了之前 Grok 做错的那道数学题,是一道求导的问题。

结果马斯克还真没忽悠咱,它俩都把这道题给整明白了。

而把 Grok 奶成现在的模样,马斯克在背后出得力可不止一星半点儿。

但有意思的是,马斯克主打的,就是薅自己其他公司的羊毛。。。

先是员工这块儿, xAI 统共就只有 50 来个员工,其中有 11 个都是在特斯拉工作的,而且里面还有 6 个是在 Autopilot 团队工作的,是一点儿都不想避嫌。

据华尔街日报消息,甚至原本要给特斯拉用的 GPU ,也被马斯克要求优先供应给 xAI ,还冠冕堂皇的说,特斯拉现在也没地儿用,在仓库里放着也是放着。

偷完特斯拉的家,还不过瘾,马斯克把手也伸到了 X 上。

就在前两天,科技媒体 Techcrunch 称,为了 “ 悄悄 ” 用用户们的数据训练 AI , X 在更新的时候,还偷摸着把用户的默认设置给改了,而且要关掉还得专门登录网页版。。。

不过总这么偷家,难免会吃上官司。像是马斯克和他的 X ,就被特斯拉的股东,还有好几个国家的数据保护机构给起诉了。

目前,关于特斯拉的案件,已经在特拉华州的一个法院审理了。

而另外几个数据保护机构,也把 X 告得,暂停用用户数据训练 Grok 了。甚至 X 还有可能遭到 “ 4% 平台营业额 ” 的罚款。

但无论如何,在大模型这块儿,马斯克的 Grok 也算是真正赶上大家伙的进度了。和其他大模型比,不管是图片生成,还是其他基础能力上, Grok2 都不算差,甚至还整出了一点儿自己的特色。

据说, xAI 下一步会把 Grok 更深入地揉到 X 平台上面,而且还要再发一个多模态理解的预览版 AI 。

不知道为啥,世超已经有点期待,马斯克还能整出什么花活儿来了。。。

相关内容

“偷”X数据,用特斯拉显卡...
甚至原本要给特斯拉用的GPU,也被马斯克要求优先供应给xAI。 有...
2024-09-20 23:30:16
考考大模型视频理解能力,中...
测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准...
2024-07-24 23:04:06
第二十五届中部农博会向粤港...
日前,第二十五届中国中部(湖南)农业博览会,向粤港澳大湾区发出战略...
2024-06-22 00:01:36
东材转债上涨005%,转股...
(原标题:东材转债上涨0.05%,转股溢价率50.46%)3月28...
2024-06-03 23:15:08
冠城大通(600067SH...
智通财经APP讯,冠城大通(600067)(600067.SH)公...
2024-05-18 14:53:03
每天这个时间运动,更有助于...
人们常说运动是抗病的“良药”,你通常选择什么时间进行运动?选对运动...
2024-05-17 09:59:19

热门资讯

新春送祝福!蕉岭县退役军人事务...   为营造欢乐喜庆的新春氛围,弘扬拥军优属光荣传统,2月4日,蕉岭县退役军人事务局会同县爱国拥军促进...
Shake Shack(SHA... 金吾财讯 | 截至发稿,Shake Shack(SHAK)盘前涨超3%,报59美元。消息面上,Sha...
散裂中子源二期、先进阿秒激光设...   东莞持续重磅布局重大科技基础设施建设,进一步提升城市科创能级。东莞近日公布2024年重大项目计划...
冬季气候干燥,又到了这几种疾病... 最近气温骤降,王女士看气温变化有点大,于是就赶紧给自己2岁的宝宝加了一件厚外套。可是即便如此,宝宝还...
首销23分钟打破行业记录,2亿... 虽然我们都知道手机摄影无法和专业单反相机比拼影像,但我们在入手一款手机时,还是会关注这款手机的摄影能...
小摩:维持中国旺旺(00151... 摩根大通发布研究报告称,维持中国旺旺(00151)“中性”评级,受惠于原料奶及奶粉价格下跌,预测20...
异动快报:通达电气(60339... 证券之星8月5日盘中消息,13点31分通达电气(603390)触及跌停板。目前价格8.78,下跌9....
供需关系有望迎来优化 功率半导... 近日,多家芯片厂商陆续宣布涨价。记者采访多家芯片原厂、分销商获悉,大容量存储芯片真正开启了涨价通道,...
华锋转债下跌209%,转股溢价... (原标题:华锋转债下跌2.09%,转股溢价率36.25%)3月4日,华锋转债盘中下跌2.09%,报1...
38家公募2023财报 过半净... 2023年年报披露季进入最后一个月。据不完全统计,截至4月3日,已有38家基金公司去年的财务数据随控...