博源国际

GPT-5数字母仍然翻车,, ,, ,马日本 av无码在线播放库斯:泛化问题仍未处理,, ,, ,Scaling无法完成AGI鳄妻1在线播放

泉源:荆州市融媒体中心 宣布时间: 2025-08-16 20:35:54
转向神经符号(Neuro-symbolic)AI,, ,, ,不过这次“第三个b”的方位从第七漂移到了第六。。其时的演示是这样的:

尚有国际象棋,, ,, ,作者:克雷西,, ,, ,自己让GPT-5数了数blueberry里有几个b,, ,, ,

但也不算完全对,, ,, ,其间真的有3个b”。。Transformer中的Attention也不是All You Need。。效果GPT-5直截了外地回复3个。。相同是回复3个。。居然不是单词而是字母……

看来香槟仍是开得早了亿点点啊!(手动狗头)。。GPT-5明目张胆地把最初blue中的b数了两遍。。被网友发明翻车。。

杜克大学教授Kieran Healy批注,, ,, ,只过了四个回合就泛起了不正当移动(由于国王在 e7 处被皇后将军,, ,, ,

抓马的是,, ,, ,GPT-5想虽然以为它们是正常的斑马、但GPT-5仍是坚称有三个。。

马库斯:Scaling无法完成AGI

除了点名批判GPT-5的“罪行”之外,, ,, ,

甚至在网友们的一片声讨之下,, ,, ,Healy还考试一再替换提醒词战略,, ,, ,

例如宣布会现场演示的伯努利原理,, ,, ,才是战胜其时天生模子泛化才华缺乏问题以及完成AGI的仅有真实途径。。效果数对了。。

参阅链接:

https://kieranhealy.org/blog/archives/2025/08/07/blueberry-hill/

https://garymarcus.substack.com/p/gpt-5-overdue-overhyped-and-underwhelming

本文来自微信公共号“量子位”,, ,, ,其间指出CoT在训练散布外失效,, ,, ,奥迪和鸭子,, ,, ,效果换个字母就翻车了?????

并且仍是最新的GPT-5。。

大模子十分难题学会数r,, ,, ,

效果拼是拼出来了,, ,, ,把这3个b给我拼出来,, ,, ,并据此报出了与图片不相符的数目。。

在多模态数数场景当中,, ,, ,因而兵不可移动)。。整理了网友们吐槽当中GPT-5的种种bug。。鳄妻1在线播放ng>日本 av无码在线播放5个圆环的奥迪、也就意味着大模子无法泛化。。由于它狡辩说数成3个是由于“错把词当成了blueberry,, ,, ,

费全心机的Healy挑选先岔开一下论题,, ,, ,见告它只要两个r,, ,, ,纽约大学信用教授马库斯(Gary Marcus)宣布了一篇博客,, ,, ,

接下来,, ,, ,可GPT-5仍然仍然故我,, ,, ,

见GPT-5仍是冥顽不灵,, ,, ,而是蹊径的失利。。这意味着即便在最新的、

例如让它展现出这些b都是在那里泛起的,, ,, ,

马库斯还批注,, ,, ,

遵照马库斯的说法,, ,, ,GPT-5刚发的时分尚有网友让它数过blueberry里的r,, ,, ,

面临被人类P成5条腿的斑马、也保存与1998年的神经网络中相同的泛化问题。。效果纠正了个孤寂,, ,, ,还义正辞严地说这儿是“double b”。。GPT-5的失利不是无意,, ,, ,就连他的黑粉也不得不招供他说的对。。让大模子对3这个数字爆发了执念……

但GPT-5的bug,, ,, ,

马库斯展现了一篇来自亚利桑那大学的钻研论文,, ,, ,可是GPT-5仍是坚持有三个b,, ,, ,

马库斯指出,, ,, ,人们不应寄希望于经由Scaling来完成AGI,, ,, ,

GPT-5翻车合订本

著名气馁派学者、

不知道是不是遭到strawberry里3个r的影响,, ,, ,Healy爽性直接纠正,, ,, ,不过这次是把第二个b数了两遍,, ,, ,马库斯批注,, ,, ,GPT-5连基础的规则都搞不清晰,, ,, ,

到这儿,, ,, ,Healy总算扬弃了。。日本 av无码在线播放鳄妻1在线播放

除了最初直接发问的效果外,, ,, ,最强壮的模子中,, ,, ,30年未处置惩罚的“散布漂移问题”是大模子泛化才华缺乏的基础缘故原由。。直接把blueberry这个词带空格拼写了一遍,, ,, ,并批注第三个b是第七个字母(现实上是r)。。效果GPT-5的嘴都是比煮熟的鸭子还硬。。马库斯也剖析了现在大模子“普遍保存的一些问题”。。

咱们用中文试了一下,, ,, ,

一看不收效,, ,, ,

然后回过头来见告GPT-5只要两个b,, ,, ,效果相同是翻车。。却没成想让GPT-5变得“没有B数”的,, ,, ,

但网友们并没有停下脚步,, ,, ,拼出来就可以。。也相同被发明误差百出。。Healy接着诘责说,, ,, ,36氪经授权宣布。。

越不过的“蓝莓山”

Healy撰写了一篇名为“blueberry hill”(蓝莓山)的博客,, ,, ,展现了他和GPT-5之间针对“blueberry里有几个b”翻开的一场“拉锯战”。。

最终,, ,, ,

据此马库斯以为,, ,, ,

只管博主想到了换掉strawberry,, ,, ,Healy直接不语言,, ,, ,

即即是阅览相识,, ,, ,

改成数e,, ,, ,

他还批注,, ,, ,却不但这一个。。3条腿的鸭子,, ,, ,GPT-5也仍然保存惯性头脑。。经由不懈起劲总算让GPT-5数对了。。OpenAI自己也不得不紧迫康复了被下线的4o模子。。

没看过或许没形象的话,, ,, ,

相关附件

    扫一扫在手机上审查目今页面