新闻中心

院士说 | 宋梁:在线自主学习才是大模型真正的智能

时间:2024-01-29 来源:世界5G大会

“未来的通信网络将是人工智能的基础,未来网络本身就是分布式的智能体,未来的人工智能系统也会以网络的形式存在。让人工智能系统从单机版基于大数据的人工智能,变成一个分布式的基于人工智能的网络,最终实现多智能体的在线进化学习的新的人工智能范式。”

2023世界5G大会日前在河南省郑州市圆满落幕。加拿大工程院院士、复旦大学教授、国际智联网络系统学会理事长宋梁在大会上重点提到了如何让大模型实现主动的在线进化学习

640 (11).jpg

以GPT为代表的大模型是否达到了通用人工智能的能力,宋梁院士指出,目前还有两个基本的问题大模型尚没有解决。

一是如何做到在线进化,如何学习未曾接触过的知识。宋梁院士介绍,自然语言处理有一个典型的特点即通过前面几个单词去预测后面一个单词是什么,这方面人类已经给机器做了很好的数据整理,可以让大模型迅速吸收大量的知识。但对于一些未标注过的其他知识,目前机器学习范式无法实现自学。在人类的成长历程中,所谓读万卷书行万里路,大概20%的知识是看书学习得来的,80%是通过实践工作(行万里路)掌握的,这种人类的智能大模型还不具备。

二是如何自主挖掘人类没有标注过的数据,让它能产生新的知识。宋梁院士解释,大模型做训练需要花费很长时间,面向通用人工智能,让一个智能体看了所有相关的书之后就可以开车、给人做手术等等,显然还是不能的。

这两方面问题与通讯网络相关,伴随着5G和计算网络的发展,物联网实时产生很多新的数据,一方面这些数据随着时间而变,另一方面也需要实时去处理,同时这些数据产生后本身是没有被人工标注的。

如何通过分布式式海量计算方式,能够对网络中、物理世界中的实时产生数据进行非标注的在线进化处理,来实现机器学习“从读万卷书到行万里路”的过程,宋梁院士表示,让算法和模型本身与物理世界、人类社会做更深度的耦合,首先需要构建智能环境——智联网络系统,通过多智能体协作,把物理环境、信息环境和人类社会做一个智能环境的耦合,让其能够对每一个智能体的自主训练和进化做监督,从而实现人工智能在非人类干预的情况下,能够自主挖掘非标注数据,形成新的知识。

“从5G到5.5G,到未来新空口等技术,需要一个实时、可私人定制的多模态网络支撑各类应用发展,在应用和网络中间架个中间层,让动态的网络和动态的应用做适配,让人工智能系统从单机版基于大数据的人工智能,变成一个分布式的基于人工智能的网络,最终实现多智能体的在线进化学习的新的人工智能范式。

宋梁院士还提到,大模型要进入行业领域,面临最大的问题是行业数据跟互联网数据相比没有大量的数据,是一个中规模数据,也没有那么多准确的标注,这种情况下可以通过多智能体对不同场景的数据集进行分析。“最终我们希望能够实现通用人工智能‘从读万卷书到和实践相结合’,跟行业相结合,深入行业挖掘非人类标注过的数据整理和挖掘,最终形成控制、感知和生成一体化的可自主、可适应的新的通用人工智能的框架。

宋梁院士总结,在线进化学习跨越大模型的目的,在于把静态大模型变成动态可进化、可以深入每个行业的跟物理场景相结合的通用人工智能新范式,达到网络跟计算相结合的新生态。


返回上级