AI大模型仍然只是复读机？这是蚂蚁集团CTO的几点最新研判

http://www.chaguwang.cn 2024-05-30 蚂蚁集团内幕信息

来源 :钛媒体2024-05-30

　　“如果将蚂蚁集团的上一个十年总结为金融，那么下一个十年是科技。”

　　在近日的蚂蚁技术日上，蚂蚁集团CTO何征宇发言分享了该公司“未来十年的科技战略”以及对于AI大趋势的判断，并在会后与钛媒体App等展开了对谈。蚂蚁技术日源起2015年5月27日，当日因光纤被挖断，部分支付宝用户两个小时无法登录账户，是蚂蚁历史上的一次重大技术事故。

　　据何征宇介绍，蚂蚁集团的长期科技战略将围绕两大技术方向：大模型与隐私计算：

　　一是重投AI全栈布局大模型，让AI像扫码支付一样便利每个人的生活。二是探索下一代隐私计算技术，让数据价值的流动像自来水一样即开即用。

　　二者构成表里，包括大模型技术在内，AI本质上是数据驱动，当前的AI大模型正是过去几十年来积累的数据和知识所涌现的结果。但现在数据孤岛化严重，如果将数据形容为水流，那么隐私计算帮助联通水网的“管道”技术。

　　蚂蚁大模型当下重点围绕三个应用，分别是“支付宝智能助理”、“安诊儿”和“支小宝”，分别定位为生活管家、就医助理和金融管家。从目前来看，这三个应用均聚焦在to C业务场景，且当前的服务入口较深，并未在首页显示。

　　何征宇表示，大模型仍处于钻木取火阶段，规模落地需要攻坚三大挑战：可靠性、经济性、易用性。

　　钛媒体App总结了何征宇发言及对谈中的核心观点，略经钛媒体编辑：

　　AI，仍然是一个复读机

　　在大模型、在AI范式变迁下，最新的一波浪潮跟上一波没有什么区别。因为本质上它是数据驱动的AI，大模型今天的出现是一种历史的必然。它建立在前面的诸多科技突破和创新的基础之上。首先得有文字把你的知识、经验传承下来。近20年来，互联网让全世界将近70亿人能够连接起来，这些数据成了我们今天所有大模型最关键的原材料。大模型就是通过不断的吸收数据里面的知识，才能够让它仿佛有了智能。

　　至少从我的视角看来，今天的AI与人类的差距非常远。它就是一个复读机，因为它学的东西不够多。人之所以成为人是因为人的思维模式或者是智慧，而不只是人会讲话本身。

　　举个例子，大家看到很多机器人在模拟人的动作，但是它真正是不是学习到我们的脑干。今天从语言到大脑的数据能够被AI学习出来，但是脑干、小脑的数据基本上采集不到的。大脑和小脑之间怎么配合，跟脑干之间怎么配合，人的突发性的反应、灵感是很复杂的过程。我认为我们还没有到那个能力。所以基于这个理解，我们觉得AI目前来说就是一个基础技术，它也不是为了代替人。

　　有了AI，我们的很多产业发生一些效率提升或者一些变化，我觉得就已经非常伟大了，不需要贬低也不需要夸大了。

　　AI太贵，是由于它不够聪明，依然在钻木取火

　　AI贵有它的原因，我认为今天大模型产生效果的方法，是有点笨拙的、不聪明的。

　　所谓Scaling law（大模型的 Scalinglaw 最早由 OpenAI 在 2020 年的一篇论文中提出,其内涵是,大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关，而与模型的具体结构（层数/深度/宽度）基本无关）其实是在逃避一个现实——我们今天并没有找到AI产生如此效果的本质原因，或者没有人能够用数学的方法去描述它，能够找到它的规律。

　　这跟原始人看到了火一样，因为我钻木取火了，我看到了火，然后火很有用，毋庸置疑。但是这个方法一定不是最好的方法，我有一个打火机更好了。但是什么时候发明一个打火机才是一个突破。今天来看，我们依然是处在一个钻木取火的阶段，所以它的成本特别高，你得准备两根棍子，还得消耗你大量的体力，才能把这个AI这个东西给取出来。所以，经济性我觉得是一个很大的问题。

　　AI如果不找到新路，那试图弯道超车非常难

　　如果大模型产品要支持亿级规模的用户，这个成本按照今天互联网的模式其实很难。但是，不代表我们今天要放弃努力，从蚂蚁来看我们有几条路：

　　第一条是沿着今天这条路，在今天巨大资源投入之下，很多云厂商的API都免费了，我认为这是一个逆市场的行为，但也代表了大量的资源在涌向这个领域。我没想到AI时代以这么快的方式进入到了补贴互联网时代。但是本质上来讲，它的技术价格一定会下降。

　　另外，我们需要去尝试寻找一条真正的路，今天站在中国科技的角度，而不只是站在全世界大同的角度，我认为我们迫切需要第二条路。如果我们紧跟着Transformer加英伟达的这套紧耦合的算法结构+芯片的配合上，我们试图弯道超车是非常难的，我们必须要有新的方法、新的理念、新的探索。

　　将聚焦原生多模态，聚焦对人的理解

　　我们很早开始就把原生多模态定为努力的方向，但这不同于谷歌的全模态，因为我们认为我们还是聚焦在对人的理解。我们过去的人工智能发力是在风控领域、人脸识别等领域，对人的理解是我们的擅长所在，我们对多模态的投入也是聚焦如此。AI与人在交互时，如何理解人在干什么、如何理解语言、表情和手势，这就是我们理解的多模态。

　　因此，今天的标注工作已经不再是上一个AI浪潮里的CV标注。我们的标注师团队中里面有医生、有投资顾问以及很多专业人士。甚至今天很多代码工程师就是标注师，或者是人工智能训练师。我认为这也可能是人类在使用工具上的一个范式的改变——你在标注它时其实就在训练这个模型，你是在使用一个工具去帮你完成事情，而不是直接去完成某个事件。

　　数据孤岛化非常严重，隐私计算是帮助数据传输的管道技术

　　今天来看，数据的孤岛化还非常严重。此前一个产品形成的数据能够自产自销，就像是自家“水井式”的数据使用方式。现在开始有一些跨行业、跨机构的数据流通开始出现，可以类比为“桶装”，数据可以通过某一种方式让另外一个行业在多场景里面得以释放它的价值。

　　未来，数据的流通应当像是“自来水网”。水是生命之源，数据也是未来数据经济之源。打开水的时候你如果还想着这个水从哪儿来的？意味着你的生产力不会得到真正的释放。所以，我们的愿景是，未来应该有数据“自来水网”，数据就像自来水一样即开即用。在这个过程中，隐私计算是一个管道技术，要能到做到更便宜，质量更好，更安全，传输效率更高。