跳动百科

WAIC 2024丨周伯文:攀登可信AGI的“因果之梯”

安莺莺
导读 经济观察网 记者 钱玉娟 连续7年参与世界人工智能大会(下称“WAIC”)的周伯文,今年以全新的角色——上海人工智能实验室主任现身。上...

经济观察网 记者 钱玉娟 连续7年参与世界人工智能大会(下称“WAIC”)的周伯文,今年以全新的角色——上海人工智能实验室主任现身。

上海人工智能实验室是中国人工智能领域新型科研机构的领头羊。在7月4日的WAIC 2024开幕式论坛上,周伯文代表上海人工智能实验室,提出了一个技术主张——人工智能45°平衡律。

周伯文分析,总体上,AI模型在安全能力方面的提升,远远落后于性能的提升。从研究是否体系化,以及人才密集度、商业驱动力、算力投入度等方面看,安全方面的投入远远落后于AI能力。这种失衡导致AI的发展是跛脚的。

周伯文建议,行业应该追求可信AGI(通用人工智能),以兼顾安全与性能。AI安全优先,但又能保证AI性能长期发展的技术体系,即为人工智能45°平衡律。平衡是指短期可以有波动,但不能长期低于45°(如同现在),也不能长期高于45°(这将阻碍发展与产业应用)。这就要求强技术驱动、全流程优化、多主体参与以及敏捷治理。

实现人工智能45°平衡律有多种技术路径。上海人工智能实验室在探索的路径是可信AGI的“因果之梯”,它将可信AGI的发展分为三个递进阶段:泛对齐、可干预、能反思。

泛对齐主要包含当前最前沿的人类偏好对齐技术;可干预主要包含通过对AI系统进行干预,探究其因果机制的安全技术;能反思则要求AI系统不仅追求高效执行任务,还能审视自身行为的影响和潜在风险。

周伯文称,目前AI安全和性能技术发展主要停留在第一阶段,部分在尝试第二阶段。要真正实现AI的安全与性能平衡,必须完善第二阶段并勇于攀登第三阶段。

除了在AI的安全与性能平衡方面提出全新主张,周伯文还强调大模型的通专融合,即将大规模的人工智能模型(大模型)与特定领域的专业知识(专用模型)进行整合,以提高模型的效率、准确性和适用性。

在周伯文看来,大模型当前在专业能力的进展上极其缓慢,同时带来了能源消耗、数据消耗、资源消耗。而通专融合是通往AGI的战略路径。

他希望,通过通专融合,AI不只可以提出科学假设,还可以掌握科学知识、分析实验结果、预测科学现象,进而在反思的基础上,提升AI提出科学假设的能力。

周伯文在产学研的深厚积累使得他的主张一直广受关注。

早前在美国担任IBM人工智能基础研究院院长的周伯文,归国后加入京东集团,成为了京东发力AI的灵魂人物。他为京东组建起了技术委员会,并主导京东云与AI两大事业部数年。

2021年,周伯文离开京东,在北京成立了衔远科技有限公司(下称“衔远科技”),聚焦生成式AI的产业应用落地。

当时,中国的产业界鲜少有人对这一前沿技术展开探索。当2022年末ChatGPT如一只蝴蝶在大洋彼岸煽动起翅膀,引致国内卷起AI大模型的创业浪潮时,周伯文已经扎根其中摸索了一年有余。

2022年5月,周伯文被聘为清华大学电子工程系长聘教授、清华大学惠妍讲席教授。

2023年7月,周伯文在接受经济观察网专访时表示,自己是“非共识者”,更主张AI技术探索与产业经济的耦合。

基于技术要有商业化闭环的思维,周伯文带领衔远科技自主研发了品商大模型和多模态大模型“摹小仙”,双模型在2024年1月末通过了备案,并在4月末实现了模型应用产品的首发。

彼时,周伯文回顾了自己过去20多年专注在做的两件事:一是探索人工智能的终极之路,二是思考如何将通用人工智能和产业相结合。

周伯文在本届世界人工智能大会提出的两大主张,正与此一脉相承。