YannLeCun我不玩大模型了那都是过去式

Meta首席AI科学家Yann LeCun最近再次强调: 「我对LLM不感兴趣了,那都是过去式了!」

这话一出,AI圈又掀起了一波讨论热潮,可对了解LeCun的人来说,这完全不意外!

作为深度学习三巨头之一,他一直对大语言模型持 批判态度 ,认为它们根本不是通往真正AI的正确路径。

YannLeCun我不玩大模型了那都是过去式-2

YannLeCun我不玩大模型了那都是过去式-3

早在2023年2月,LeCun就在LinkedIn上发表过他的「 不可动摇的观点 」,明确表示自回归LLM虽然作为写作辅助工具有用,但它们不会推理和计划,会编造内容,并且终将被更好的系统所取代。

YannLeCun我不玩大模型了那都是过去式-4

他在视频中说的更加直白:

「我不再对LLM感兴趣了,你知道...它们有点像是最后一件东西了...」

他犀利指出现在的情况: 「工业界只是在边缘做些改进,用更多的数据,更多的计算,合成更多的数据...」

这不就是在说OpenAI、Anthropic这些公司都在做的事情嘛!过去几年,这些公司不就是在不断扩大计算规模、数据规模吗?

那LeCun认为更有前途的方向是什么呢?

他给出了 四个关键领域 :

1️⃣ 让机器理解物理世界 (这点连NVIDIA的黄仁勋都在关注)

2️⃣ 让AI拥有持久的记忆 (很少有人讨论这个问题)

3️⃣ 推理能力

4️⃣ 计划能力

YannLeCun我不玩大模型了那都是过去式-5

等等,这不就是通往AGI(通用人工智能)的必经之路吗?

这四点恰恰也是LeCun 长期以来批评LLM 最核心的缺陷。

LeCun多次指出自回归LLM缺乏对物理世界的理解,没有持久记忆,无法进行真正的推理,也难以进行复杂规划。

关于推理,LeCun特别补充道:

「当然现在有些人在尝试让LLMs进行推理,但在我看来,这是一种非常简单化的视角...推理可能还有更好的方法。」

LeCun在2023年3月甚至专门发帖论证了为什么自回归LLM是“ 指数级发散的扩散过程 ”,表明错误会累积,正确性概率呈指数下降。

他还在今年年初的达沃斯世界经济论坛上,预测五年内没有人会使用现在的生成式AI和大语言模型,因为它们在这四个关键能力上的根本缺陷限制了AI达到真正变革性潜力的可能。

LeCun甚至更大胆预言: 「这些方向,可能五年后会让技术社区兴奋不已,但现在看起来不那么令人兴奋,因为都还只是些晦涩难懂的学术论文。」

这其实与他一贯的立场一致。

YannLeCun我不玩大模型了那都是过去式-6

在最近接受Newsweek采访时,LeCun再次表示相信LLM在五年内将基本过时,他和他的研究团队正在开发一个更好的范式系统,能够进行推理和规划。

网友们看到后反应各异,不少人居然直接开怼:

p🤖w(@noself86) 调侃道:

所以他们先是不是未来,现在又变成了过去?!我就是喜欢听这位老兄说话!哈哈哈哈

Homer(@AchillesSlays) 一句话戳中要害:

他输掉了LLM这场战争,所以葡萄是酸的

随后又补充:

他不是放弃了瞎扯,他只是LLM竞赛中 唯一的输家 。不过话说回来,他是个天才,我相信他肯定会拿出点好东西让所有人惊讶。我不会低估他。幸好我们有聪明人专注于其他方法。

Anwoy Chatterjee(@anwoy_) 敏锐地指出了矛盾之处:

与此同时,他正在共同撰写关于LLMs的论文

Lovis Odin(@OdinLovis) 则提出了更深层次的思考:

我认为他真的越来越迷失了。首先AI不仅仅是LLM!随着LLM的发展,我们看到的是控制它们的新方式,让它们一起工作。AI领域真正有趣的不是模型本身,而是你在它们周围建立的东西。

Shawn(@Shawnryan96)则直截了当地质疑:

说了这么多,却没有任何成果可以展示。

Victor(@victor_explore)自己也来了一句神总结:

有意见的AI不过是运行时间更长的人类😂

在最近的NVIDIA GTC 2025大会上,LeCun再次放大招,将LLM贬为“token生成器”,并预测五年内没有理智的人会继续使用它们。

这些激进言论引起了广泛争议。

有研究者直接反驳,认为LeCun低估了自回归模型在实践中的功能,忽视了像Chain-of-Thought等技术如何有效克服他所提出的理论缺陷。

YannLeCun我不玩大模型了那都是过去式-7

更讽刺的是,就在LeCun批评LLM的同时,Meta宣布他们的Llama模型已被下载10亿次,这使得Meta的立场显得矛盾——

一方面,其首席AI科学家将LLM视为死胡同技术。

另一方面,公司却继续大力投资其开发和分发。

LeCun早就多次表示过LLM存在 根本性的局限 ,认为它们:

不理解物理世界

没有持久记忆

无法真正推理

不能层次化规划

而这正是他这次强调的四个未来方向!

这么看来,LeCun对AI的未来路线图一直很清晰:

超越LLM的局限,探索更接近真正智能的方法 。

在Meta,他正带领团队研发基于JEPA(联合嵌入预测架构)的系统,希望能在未来几年内实现突破。

近期Meta推出了视频联合嵌入预测架构(V-JEPA),能够检测和理解高度详细的物体交互。这被公司称为“朝着Yann LeCun高级机器智能(AMI)愿景迈出的下一步”。

不过,面对其他大公司在LLM领域的成功,LeCun也曾公开表示: 下一代开发者应该专注于下一代AI系统,而不是LLM,因为“这已经在大公司手中,你们无法带来什么新东西” 。

对于AI的未来,LeCun和另外两位深度学习先驱Geoffrey Hinton、Yoshua Bengio的看法截然不同。

YannLeCun我不玩大模型了那都是过去式-8

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/219.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>