下一个AI王炸,别只盯着OpenAI,DeepMind也在憋大招

阅读 2435  ·  发布日期 2023-04-10  ·  来源:网络

过去几个月,OpenAI风头无两,各大科技公司力争上游地跟进大言语模型(LLM)这一技术道路。

比照之下,OpenAI的老对手DeepMind,显得有些低调和缄默。微软靠OpenAI打了一场胜仗,而谷歌推出的Bard翻了车,和谷歌同属AlphaBeta的DeepMind却没有出来力挽狂澜的意义。

同样是半学术、半企业科研性质的前瞻性AI Lab,DeepMind也瞄准了通用人工智能AGI,但完成途径上,却有着和OpenAI不同的选择。

这段时间我们能看到科技圈在集体“追风口”,大量资源(留意力、算力、人才、政策等)都被投入到OpenAI引领的大言语模型热潮中,有些高校以至呈现了“不做LLM就没有算力用”的场面。“中国没有本人的OpenAI”也被以为是创新滞后的理想证明。

有人说OpenAI的AI属于“精英教育道路”,一路砸钱供它读到博士,一毕业就是王炸,冷艳全场,这点的确没错,也是十分值得很多国内AI Lab学习的。

追逐OpenAI的赛道曾经非常拥堵。别忘了,DeepMind默默烧钱、长期锚定的很多研讨方向,也十分具有前沿性和想象力,2016年的AlphaGo、2020年的AlphaFold都曾一鸣惊人。下一个“AI王炸”,可能就是DeepMind做出来的。



大家晓得有种新闻叫“震惊体”,每一次呈现“AI王炸”级产品,就会有大量“震惊体”呈现,比方“阿尔法狗要取代人类”“AlphaFold抢了生物学家的工作”“有了ChatGPT人类还有价值吗?”

感到“震惊”,有时真的只是由于晓得的太少、太晚,在这些“AI王炸”技术尚在生长阶段,无视了它们,等才能开展到适用水平,又开端恐慌、焦虑。

届时,我们会不会又会堕入新一轮的追逐跟风,接着埋怨“中国没有本人的DeepMind”呢?

所以,我们无妨来预测一下,DeepMind正在憋的大招里,哪些可能成为下一个王炸,读者们能够有个心理准备,提早对“震惊体”脱敏。

AI要取代科学家,够不够震惊?

ChatGPT走红之后,很多白领人士都担忧本人的岗位要被取代了。而科学家可是智力程度站在金字塔顶端的人类,职业生活肯定稳稳的吧?

AI+科学,正是DeepMind长期锚定的赛道,曾经产出了很多打破性的研讨成果,掩盖了数学家、物理学家、生物学家的专业范畴。

曾经问世的AlphaFold和AlphaFold 2就在生物学界掀起了海啸级的影响,彻底改动了蛋白质构造预测的传统办法,也引发了各大高校和科研机构的复现、优化、应用。基于这一新技术,DeepMind一夜之间改动了生物制药行业,也因而成为“数字生物学”这一新兴范畴的先驱。

目前,AI+生物学的潜力还没有完整释放出来,AI技术在生物制药和生命科学中的应用,还停留在少数环节中探究、案例级尝试的阶段。DeepMind也正在与行业展开协作,比方与Isomorphic Labs 协作,以“AI-FIRST”准绳重构药物发现过程,在著名的生物医学研讨中心弗朗西斯·克里克研讨所(Francis Crick Institute),建了一个湿实验室,增强AI技术与生物实验的分离,同时还在不时扩展AI for science团队,加快根底生物学的研讨。

或许,下一个抗癌新药、生物计算范畴的大打破,就会在DeepMind降生。



(AlphaFold提醒了蛋白质宇宙的构造)

你可能会说,生物学是一门实验科学,有成熟的程式,被AI技术改动很合理。数学、物理这样的根底科学,打破简直来自天才式的直觉和灵感,有的数学家以至是在梦中获得打破。比方阿基米德就是在洗澡时灵光一现,发现了浮力定律;拉马努金在梦中发现了3900个公式……AI估量就不好使了吧?

数学、物理,这些触及笼统世界和人类深层直觉的范畴,DeepMind也曾经获得了打破。

协助数学家发现他们从未发现的发现——DeepMind发表在《自然》杂志上的一篇论文显现,研讨人员与顶级数学家协作,为一个几十年来都没有结局的数学猜测,经过机器学习(ML)找到了打破口。

运用AI来处置海量或无法直接推理的数据,能够大大加强数学家的洞察力,从而更快地找到证明猜测和新公式的办法,曾经被DeepMind证明是可行的。

牛津大学数学系教授Marcus Du Sautoy形容AI技术在纯数学中的应用,“就像伽利略拿起望远镜,可以深化注视数据宇宙,看到以前从未发现过的东西”。

将来随着探究的增加,很多未被证明的数学猜测,都有可能因AI的参加而打破。希望届时大家不会又以为AI进化出了什么超才能,被“AI取代数学家”之类的标题给骗了。




AI参与核聚变的研讨进程——核物理无论从学术还是社会政治经济的角度,都是十分重要的。大家可能都听过中国核物理学家造原子弹的艰辛故事,其中很多工作和牺牲能不能由AI来代劳呢?DeepMind还真搞成了。

它们与瑞士等离子体中心,协作开发了一个AI系统,经过强化学习,控制系统能够很好地谐和TCV(由许多磁线圈组成),确保等离子体永远不会接触容器壁,这样就能够减少核聚变的热量损失。同时,还能将等离子体准确地雕琢成不同的外形,便当科学家研讨等离子体在不同条件下的反响,从而进步对核聚变反响堆的了解。



总之,在过去的几年里,DeepMind在数学、物理、化学、生物学、量子、气候、资料等多个科学范畴,发明性地探究了大量AI for science的可能,带来了全新的科学研讨办法,必然会催生全新的科学发现和技术打破,下一个“AI王炸”很可能就在其中。

理想版《西部世界》够不够炸裂?

DeepMind的目的也是完成通用人工智能。详细怎样做呢?OpenAI专心搞言语,DeepMind就专注“训狗”——搞强化学习。

弱人工智能,只能在有限的环境中处理特定问题,没有开展出人类身上那种通识智能。那种“通用”智能的机器,大约就相似于《西部世界》或者《底特律》中的机器人,可以在复杂的环境里执行任务。

完成AGI,OpenAI是用大量数据和充沛锻炼来促成大言语模型的“智能涌现”,而DeepMind则选择了“正向教育”——希望经过强化学习,给AI系统以“奖励大化”的刺激,差遣智能体自主去学习复杂的才能。由于只要表现出这些才能,智能体才干取得奖励(比方生存下去)。

听起来,是不是跟工作犬执行主人的口令,主人依据结果来停止奖励或惩罚是一个路子?

在一篇论文中,DeepMind的研讨人员写道:“奖励足以推进智能体表现出通用智能的迹象和行为,包括学习、感知、社会智能、言语、概括和模拟。”

上一只震惊世界的狗是击败人类棋手的“阿尔法狗(AlphaGo)”,而下一只可能就是被DeepMind用强化学习锻炼出来的AI了。


(ANYmal机器人的运动技艺是经过模拟狗MoCap来学习的)

比方这只机器狗,就经过强化学习不时试错,从而具备了两个重要的才能:

一是运用历史经历,普通来说电机控制的AI智能体,一开端不晓得对每个关节施加什么力,需求大量数据才干迈出步子,不然就会随机抽搐并疾速摔倒,而借助RL能够应用以前学到的运动技艺,从而缓解“起步”时的为难。

二是减少特殊行为,此前智能机器人普通会用一种很不自然、不够人性化的方式来避障,固然看起来很有趣,但不够适用。DeepMind采用强化学习锻炼,倾向于让智能体学习更多的自然行为,能够平安高效地控制真实世界的机器人/机器狗,将机械控制与认知聪慧相分离。

相似的强化学习实验还有很多,比方让智能体在网络游戏中展开随机互动,让智能体在模仿的三维世界里搭积木、清扫房间……根本逻辑都是基于人类反应的奖励模型。

ChatGPT只能处理言语问题,《西部世界》里的人机交融新物种,更灵敏的通用家政机器人,可能还真得靠DeepMind的强化学习道路来完成。

像人脑一样考虑的AI,够不够有趣?

DeepMind固然没有跟风推出类ChatGPT的大言语模型,但并不代表它对这个范畴毫无建树,只不过二者关注的技术方向不太一样而已。

随着运用者的增加,大家可能都发现了类ChatGPT模型的一些限制,比方十分注重数据和语料。

深度学习靠范围数据、庞大算力、充沛锻炼而“鼎力出奇观”的暴力美学,在大模型时期发挥到了极致。

这带来了一系列问题,比方中文语料缺乏,训出来的大模型效果不好,有的中文LLM会用英文语料停止锻炼,再将答案翻译回中文,这种做法当然是契合业界常规的,但问题在于很多价值观、常识性的东西,是没有方法对齐和翻译的。

而且“暴力计算出奇观”的大炼模型,打造的言语模型是不可解释的黑盒,金融、政务、工业等行业是不敢用的,无法支撑牢靠的决策。

不晓得OpenAI和国内厂商打算怎样处理“暴力计算”的弊病,反正DeepMind倒是不断在揣摩不同的道路——不搞暴力美学,大搞神经科学。


DeepMind以为大脑才是机器智能模拟的对象,希望经过对脑科学、神经运动学、元学习等“人类本位”的研讨,来提升深度学习模型的鲁棒性、可解释性、牢靠性等,让AI到达人类程度的了解才能。

比方重新认识大脑的工作机制,自创多巴胺经过调理神经元之间突触衔接的强度,提出了一种基于奖励的强化学习理论;

在3D游戏世界中创立了模仿心理学实验室Psychlab,可以施行经典的心理实验,显著改良了智能体UNREAL的性能;

发如今人工神经网络倾向于避开准确设计的代码,倾向于对本钱函数停止暴力优化(不追求奖励大化,而是追求本钱小化,不做错就没有损失),而人脑的机制却常常会专注在任务完成和奖励上,从这个角度去优化深度神经网络的构造。

2023年发表的一篇新论文中,DeepMind则针对大脑中的回放(replay)机制,提出这是一种组合计算的方式,能够衍生出新的学问,在神经网络中整合回放机制,有望让AI用极少的数据学到新东西,进步认知智能,更接近“智能涌现”。

大脑的聪慧让人类爬上了万物之灵的宝座,AI不靠人工而靠智能,为什么不可能呢?


当初OpenAI要走NLP这条“冷门”的路,很多人也觉得不可能,直到产品虽不成熟、但才能非常冷艳的ChatGPT呈现,人们才开端纷繁夸奖OpenAI的长期主义。这些年DeepMind默默搞的研讨,可能就是下一个“王炸”。

我们都希望中国AI也能降生影响世界的元创新,其实AI范畴并没有那么多独门秘技,很多灵感或技术道路都是公开的,但我们为什么总是听过就算、见过就忘呢?

除了灵光一现的idea, OpenAI和DeepMind不时投入的耐烦,强大的工程才能,前沿研讨与商业化的均衡,也是值得学习和自创的。

不能总是百感交集,总是不长忘性,直到下一个《震惊!XXX的XXX又推翻世界了》……