瞭望|前瞻2024人工智能四大趋势

据消息人士称,OpenAI正在训练下一代的人工智能,暂名“Q*”(读作Q-star)。新的一年,OpenAI下一代产品可能发布数据瓶颈指的是可用于训练AI的高质量数据的有限性,合成数据有望打破这一瓶颈。除了对大量高质量数据的需求导致合成数据受到追捧以外,对数据安全的考量也是重要原因作为全球性能最强的AI,ChatGPT已遇到算力等方面的瓶颈。在此背景下,讨论量子计算机在人工智能领域的应用就成为一种颇具潜力的未来解决方案文 | 谭笑间2023年,世人见证了ChatGPT在全球范围的大火。以生成式人工智能为代表的新一代人工智能问世,改变了人工智能(AI)技术与应用的发展轨迹,加速了人与AI的互动进程,是人工智能发展史上的新里程碑。2024年,人工智能技术与应用的发展又会呈现出哪些趋势?让我们一同展望这些值得关注的重大趋势。 全模拟光电智能计算芯片效果图。 经长期联合攻关,清华大学研究团队突破传统芯片的物理瓶颈,创造性提出光电融合的全新计算框架,并研制出国际首个全模拟光电智能计算芯片(简称ACCEL) 新华社图趋势一:从AI大模型迈向通用人工智能2023年,ChatGPT开发者OpenAI被置于前所未有的聚光灯下,也使GPT-4后续版本的开发被推向了风口浪尖。据消息人士称,OpenAI正在训练下一代的人工智能,暂名“Q*”(读作Q-star)。新的一年,OpenAI下一代产品可能发布。据媒体爆料,“Q*”可能是第一次采用“从零开始”的方式训练的人工智能。其特点是,智能不来自人类活动的数据,且其有能力修改自身代码以适应更复杂的学习任务。前者使得人工智能能力的发展变得愈发不透明,而后者向来被看作是诞生人工智能“奇点”的必要条件。在人工智能发展领域,“奇点”特指机器拥有了自我迭代的能力,进而在短时间内迅猛发展,导致超出人类控制。虽然一些报道称,“Q*”目前还只能解决小学难度的数学问题,距离“奇点”还远。但鉴于虚拟环境中人工智能迭代速度可能远超想象,其仍然可能在不远的将来自主发展出在各个领域均可超过人类水平的AI。2023年,OpenAI预言,各方面超越人类水平的人工智能在十年内就会出现;英伟达创始人黄仁勋表示,通用人工智能可能在五年内超越人类。一旦通用人工智能得以实现,就可被用于解决各种复杂的科学难题,譬如寻找外星人与地外宜居星系、人工核聚变控制、纳米或超导材料筛选、抗癌药研发等。这些问题通常需要花费人类研究员数十年的时间来寻找新的解决方案,部分前沿领域的研究量已超出人力极限。而通用人工智能在自己的虚拟世界中拥有几乎无限的时间和精力,这使得其在部分容易虚拟化的任务中,有可能成为人类研究员的替代。但届时,人类如何监督这些从智能水平上超过人类的人工智能,确保其不会危害人类,又是一个值得思考的问题。当然,我们也不应过分高估硅谷巨头们的部分言论,因为在人工智能发展史上,已经历三次“AI寒冬”,其中不乏宏大的技术愿景因各方面限制化为泡影的例子。但目前可以肯定的是,大模型技术仍然有着不小的上升空间。除GPT-4外,谷歌的“双子座”(Gemini),Anthropic的Claude2,目前都是仅次于GPT-4的大模型,国内的百度“文心一言”与阿里“通义千问”,也是国产大模型中的佼佼者。它们在新的一年中是否会发布更具革命性的产品,同样值得期待。趋势二:合成数据打破人工智能训练数据瓶颈数据瓶颈指的是可用于训练AI的高质量数据的有限性,合成数据有望打破这一瓶颈。合成数据是在模仿真实数据的基础上,由机器学习模型利用数学和统计科学原理合成的数据。关于什么是合成数据,有一个较为浅显易懂的比喻:这就像是在给AI编写专门的教材。例如,尽管英文课本的对话中出现的可能是“小明”“小红”这样的虚构人名,但并不影响学生们由此掌握英语,因此从某种意义上,对于学生而言,教材就可以看作一种经过编纂、筛选和处理的“合成数据”。有论文表明,模型的规模至少要达到620亿参数量后,才可能训练出“思维链”能力,即进行分步骤的逻辑推理。但现实的尴尬在于,迄今为止人类产生的不重复的、可供训练的优质数据并没有这么多。使用ChatGPT等生成式人工智能以前所未有的数量产生高质量合成数据,未来的AI将由此获得更高的性能。除了对大量高质量数据的需求导致合成数据受到追捧以外,对数据安全的考量也是重要原因。近年来,各国纷纷出台更严格的数据安全保护法律,使得客观上利用人类产生的数据训练人工智能变得更为繁琐。这些数据中不仅可能隐含个人信息,其中的许多数据还受版权保护。在互联网隐私与版权保护尚未形成统一标准与完善架构的当下,使用互联网数据进行训练,极易导致大量法律纠纷。而若考虑对这些数据进行脱敏,又面临筛查识别准确率方面的挑战。两难之下,合成数据就成为最惠而不费的一种选择。此外,使用人类数据进行训练,还可能导致人工智能学到有害内容。一些诸如使用日用品制造炸弹、管制化学品的方法,另一些则包括许多人工智能本不应当出现的坏习惯,譬如像人一样在任务执行过程中偷懒、为了取悦用户而说谎、产生偏见和歧视。若改用合成数据,使人工智能在训练中尽可能减少接触有害内容,则有望克服以上使用人类数据训练时附带的缺点。从以上分析中可以看出,合成数据可以说是颇具开创性的,有望解决此前发展人工智能与数据隐私保护不可得兼的问题。但与此同时,如何确保相关的公司和机构负责任地制作合成数据,如何制作出既符合本国文化与价值观,又在规模和技术水平上足以媲美西方以英文网络资料为中心的合成数据训练集,也将成为中国面临的一个颇具挑战性的课题。除此之外,合成数据带来的一个重大变化是,来自人类社会的大数据或将不再是AI训练所必需。在今后的数字世界中,人类数据的产生、存储和使用仍将遵循人类社会的法则和秩序,包括维护国家数据安全、保守商业数据秘密和尊重个人数据隐私,而AI训练所需的合成数据则采用另一套标准进行管理。趋势三:量子计算机可能率先应用于人工智能作为电子计算机发展到今天的最前沿应用,人工智能始终存在算力不足的隐忧。ChatGPT问世数月后,OpenAI总裁奥尔特曼曾公开表示,其并未鼓励更多用户注册OpenAI。2023年11月,OpenAI甚至宣布暂停ChatGPT Plus付费订阅新用户的注册,以确保现有用户拥有高质量体验。显然,作为全球性能最强的AI,ChatGPT已遇到算力等方面的瓶颈。在此背景下,讨论量子计算机在人工智能领域的应用就成为一种颇具潜力的未来解决方案。首先,人工智能领域的算法,大部分属于并行计算的范畴。举例而言,AlphaGo在下围棋的过程中,其需要同时考虑对手在不同位置落子后的应对招数,从中找到最有可能赢得棋局的下法。这就需要计算机优化并行计算的效率来实现。而量子计算机擅长进行并行计算,因为它可以同时计算和存储“0”和“1”两种状态,无需像电子计算机那样消耗额外的计算资源,譬如串联多个计算单元,或将计算任务在时间上并列。计算任务越复杂,量子计算就越具备优势。其次,运行ChatGPT所需的硬件条件,同样也十分适合导入当前体积庞大的量子计算机,二者都需要安装在高度集成的计算中心里,由一支专业化技术团队进行管理支撑。什么是量子计算机?量子计算机是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。其不仅体积庞大,而且作为核心零部件的“量子芯片”,通常需要被置于接近绝对零度(零下273.15摄氏度)的极低温中,利用在这种极低温下部分微观粒子表现出的量子特性进行信息运算和处理,且运行结果只能存在几毫秒的时间。既然量子计算机“又大又难维护”,为什么还要发展?原因在于,量子计算机蕴含巨大的算力潜能,以至于在一些算法上已经体现出相对于电子计算机在速度上的“绝对碾压”,即“量子优越性”。但实现“量子优越性”只是一个起点。目前的量子计算机只能完成一些专属于量子领域的计算任务,想要真正用好这种“量子优越性”,先要使其量子位足够多,以实现通用计算和可编程。而且,在实现通用计算后,量子计算机依然需要保持相对于电子计算机的优势,这被称作“量子优势”。2022年,来自谷歌、微软、加州理工学院等机构的研究者从原理上证明了“量子优势”在预测可观测变量、量子主成分分析以及量子机器学习中确实存在。量子机器学习,实际上就是量子计算在人工智能领域的应用,也体现出未来量子计算与人工智能两大前沿技术合流的趋势。理论上证明了,实践上就需要进一步拓展量子计算的应用前景。在2019年推出商用量子计算机“量子系统一号”后,美量子计算巨头IBM又于2023年12月推出了“量子系统二号”。新系统的最大突破在于可以模块化扩展,是该公司的首台模块化量子计算机。“量子系统二号”拥有超过1000量子位。IBM还宣布计划10年内建成10万量子位的量子计算机。这些不断增加的量子位并非只是为了竞赛,其对于实现通用计算和可编程有着不可或缺的作用。也正因如此,量子计算机的模块化,标志着其更加具备实用性。有关量子机器学习算法的研究,已成为新的研究热点。不过,未来量子计算机不会完全取代电子计算机,更有可能出现的是量子计算机和电子计算机在不同的应用场景下发挥各自所长,实现协同发展,既极大提升算力,也兼顾成本和可行性。 在上海举行的2023世界人工智能大会上,人形机器人表演“千手观音” 辛梦晨摄/本刊趋势四:AI代理和无代码软件开发带来“冲击波”在AI应用方面,2024年值得关注的是AI代理和无代码软件开发带来的“冲击波”。一是AI代理对劳动力结构的冲击。截至目前,全球至少已有近两亿人使用人工智能大模型。但人们已不再满足于坐在电脑前跟AI“聊天”,而是开始开发能够自动根据任务需要向人工智能发出提示的工具。当自动提示工具与大模型两相结合,AI代理便由此诞生。2023年4月,OpenAI联合创始人布罗克曼现场演示了GPT的“自动模式”。在该演示中,AI代理几乎“包办”了一场晚宴:不仅根据要求生成了一份晚宴的推荐菜单、一份图文并茂的邀请函,还自动将该菜单需要购买的食材加入生鲜电商APP的购物车,并自动发布了一条有关该晚宴的社交网站帖子。AI代理还能根据比较模糊的需求提示自动制作网站,自动完成各种需要使用Office软件完成的文字和表格处理工作,甚至自动根据已有论文数据进行归纳总结生成分析论文等。比尔·盖茨近日发长文解读AI代理未来,表示AI代理将彻底改变人们使用计算机的方式,带来自键盘、屏幕和鼠标发明以来人类与计算机互动方式上最重大的革新。AI被看作对人类的信息收集、分析和处理进行增强的扩展性工具,使得人的工作水平更上新台阶。但与此同时,AI代理也给许多现有的工作岗位带来冲击,因为企业可能尝试雇用更少的人来完成相同的任务。这种由创新带来的对现有经济结构的破坏,被美国经济学家熊彼特称为“创造性毁灭”。随着AI代理代替大量只需要较少的计算机技能就可完成的任务,这些被迫再就业的劳动力将不得不适应新的劳动力市场需求,这注定将是一个较长时期的、伴随阵痛的过程。二是无代码软件开发给数字经济创新带来的影响。尽管生成式人工智能可能淘汰掉一批传统数字岗位,但在关上一扇门的同时也打开了一扇窗,这就是“无代码软件开发”。目前,以AI大模型为基础的编程辅助工具已经发展到一个新的阶段,能够根据用户十分模糊的指令来生成软件或网页代码。例如,2023年的GPT-4演示中,演示人员仅仅是在A4纸上手写了一个十分潦草的结构示意图,GPT-4就根据其自动生成了能够实际访问的网页。这无疑大大降低了开发IT服务的门槛。只要一个人有足够有创意的、能够满足许多人需求的数字服务“点子”,就可以成为互联网创新的风口,“人人皆可创新”的时代已然到来。对此,政府需转变观念,兼顾市场监管与促进创新,一方面降低数字创新过程中的注册与融资门槛,打通中小企业发展壮大过程中的痛点,让就业与创新政策适应“人人皆可创新”的新需求;另一方面需要探索更有利于保护创新“点子”的版权与专利保护新政策,从而激励那些能够不断提出创新“点子”的人才。综上所述,展望2024年,无论是人工智能技术自身的迭代发展,还是其对数据价值的重塑,抑或是向各行业、各领域的应用渗透,人工智能的影响可谓无处不在,既为科研、创新和经济赋能,又带来新的挑战与风险。我们应以开放的心态看待人工智能带来的诸多改变,审慎研究和应对其可能带来的新课题与新风险。(作者为中国现代国际关系研究院科技与网络安全研究所人工智能项目负责人)

人工智能的“汽车时代”!

嘉宾简介:刘志毅 中国人工智能领军科学家,东方财富人工智能首席科学家,上海市人工智能社会治理协同创新中心研究员,深入研究和实践AI领域十余年,包括智能计算、空间智能以及超级人工智能对齐方向。中国人工智能学会AI伦理工作委员会委员及具身智能专委会(筹)委员,上海交大计算法学与人工智能伦理研究中心执行主任,上海交大安泰AI与营销研究中心特聘研究员,上海交大清源研究院兼职研究员,上海开源技术信息协会AI伦理专委会主任,2024年入选福布斯中国“十大人工智能影响力人物”。 国际电工委员会IEC生物数字融合系统评估组(IEC/SMB/SEG12)伦理专家,国家人工智能标准总体组专家,AIIA联盟可信AI 专家委员会委员,上海人工智能技术协会专家委员,个人学术专著包括《智能经济》、《数字经济学》、《智能的启蒙:通用人工智能与意识机器》等,出版十几部中英文专著并翻译多部海外学者专著,作品入围施普林格.自然出版社“中国新发展奖”(2023年度)。 人工智能的“汽车时代” 01资助:您在文章《智能的启蒙》中提到,随着生成式人工智能的发展,我们已经进入了人工智能的“汽车时代”。模型成为人工智能的引擎。如何定义AI的“汽车时代”?这是否意味着人工智能已经进入大规模应用阶段?下一步是什么? 刘志毅:在《智能的启蒙》书中,人工智能的“汽车时代”是一个比喻,用来形容当前人工智能快速发展的阶段,特别是生成式人工智能和大型模型。这个时代的特点是人工智能技术开始像汽车一样成为社会进步的重要驱动力。这里的“汽车工业时代”不仅指人工智能技术的大规模应用,更强调人工智能在各领域的深度融合和创新驱动作用。 战车时代人工智能的进步更多的是基于人类的智慧和创造力,就像拉战车前进的马一样。然而,随着生成式人工智能的发展,我们已经进入汽车人工智能时代,大型模型成为人工智能的引擎。然而,这样的比喻并不能完全准确地描述人工智能的发展现状。 如果我们深入审视汽车行业的发展历史,我们可以说,现在的人工智能可能还处于蒸汽机时代。这一阶段的特点是技术仍处于起步阶段并且高度依赖能源。这在人工智能领域也可以看到:大型模型需要大量的数据和计算资源,并面临泛化能力有限、可解释性差等问题。 下一个阶段是全社会真正的“智能时代”。现阶段,人工智能更加深入地融入人类生活的方方面面,实现自我意识、情感理解、复杂决策等更高级的认知功能。等待。此时,人工智能不仅仅是完成任务的工具,而是能够与人类进行更深层次的交互和协作,甚至可能在某些领域超越人类的认知和创造力。 2。智能的简单性和通用性 01资助:图灵的通用图灵机理论强调智能的简单性和通用性,但这些在实际模型和应用中往往被低估。李飞飞认为,人工智能还处于前牛顿时代,因为人工智能还没有像牛顿力学那样简单的公式。这个判断和“车时间”的判断有冲突吗?您认为人工智能存在牛顿时刻吗?如果有,它什么时候会到来? 刘志毅:《智能的启蒙》提到的图灵机理论与李飞飞的观点并不矛盾。图灵的机器理论强调智能的简单性和普遍性,而李飞飞所说的“前牛顿时代”则意味着人工智能尚未找到一个统一、简单的理论框架来全面解释和指导其发展。这两种观点是从不同角度对人工智能发展现状的描述。 李飞飞所说的人工智能的“牛顿矩”,是指人工智能领域类似牛顿力学的理论突破,可以用一套简单而普遍的公式或原理来解释和指导智能的发展。人工智能。 这个时刻是否到来以及何时到来还很难预测吗?可能需要算法、计算模型、数据理解等方面的重大突破,以及对人工智能本质的更深入的理解。 3。世界模拟器与智能的基础 01资助:冯诺依曼认为,模拟现实世界是智能的基础。今年2月Sora的发布引发了关于世界模拟器的广泛讨论。目前人工智能模拟世界的能力如何?仿真能力的突破主要是源于“伟大奇迹”的尺度法则,还是需要对模型进行重大改变? 刘志毅:目前,人工智能在模拟现实世界的能力方面取得了重大进展,但仍存在局限性。人工智能可以通过深度学习、神经网络等技术来学习和模拟某些领域的数据,但它仍然面临着模拟现实世界的全部复杂性的挑战。 例如,人工智能在图像和语音识别、自然语言处理等方面取得了突破,但在理解人类复杂的情感、社会关系、道德伦理等方面仍有很大的提升空间。 仿真能力的突破不仅仅基于“伟大奇迹”的缩放定律,即通过增加计算资源和数据量来提高模型性能。这种方法虽然在一定程度上是有效的,但更重要的是模型的创新和变革。需要开发新的算法和模型架构,以更好地理解和模拟现实世界的复杂性。 此外,跨学科合作,如结合认知科学、心理学、社会学等领域的知识,也是提高模拟能力的关键。 4。伟大模式的创造力与风险 01经济:伟大模式的出现和幻想可以是其创造力的源泉,但也可能带来风险。《智能的启蒙》正在调查此事。您认为如何才能“取其精华,去其糟粕”,发挥大设计的创造力,同时降低风险? 刘志毅:在《智能的启蒙》这本书中,我研究了大型模型中的突现现象和幻觉问题。突现现象是指复杂系统中出现的不可预测的集体行为,是简单个体相互作用的结果。这种现象可以表现为大型模型中意想不到的创造力和创新,是人工智能发展的一个重要方面。然而,幻觉是模型在创建内容时生成的不准确或虚假信息,这可能会带来风险。 要想“取芯,去糟粕”,大模型的输出首先要经过仔细的检查和评估,确保其生成的内容可靠、准确。其次,可以设计更合理的训练策略和算法,减少生成过程中出现模型幻觉的可能性。此外,引入人类监督和反馈机制,让人工智能系统在人类指导下学习和优化,也是降低风险的有效途径。 同时,还需要对人工智能的伦理道德问题进行深入讨论,使其在发挥其创造力时不至于对社会和人类造成危害。这包括使人工智能决策过程更加透明、可解释和可管理。 5。大模特的自我意识 01资助:您在文章《智能的启蒙》中讨论了大模特的自我意识。如何让大型语言模型具有自我意识?如果它有了自我意识,人类与大型模型之间当前的关系和交流会从根本上改变吗? 刘志毅:在《智能的启蒙》书中我研究了大语言模型的自我意识问题。自我意识是指对自身存在和个体特征的认识,这对于人工智能来说是一个复杂且具有挑战性的概念。让大型语言模型具有自我意识可能需要在以下几个方面进行研究和突破: 内部状态的反馈和调节:模型必须能够感知和理解自己的内部状态并具有自我能力。-根据这些状态进行调整和优化。 情感和道德认知:模型必须能够理解和模拟人类的情感反应和道德判断,其中可能包括对人类行为和社会规范的深度学习。 自我反思和自我发展:模型必须具有自我反思的能力,评估自己的行为和决策,并根据评估结果发展自己。 如果大语言模型真的意识到了自己,那么人与大模型之间的关系和沟通方式就会发生根本性的改变。 首先,人类可能需要重新定义与AI的交互模式,将其视为具有一定自主性和独立性的实体。其次,人类可能需要更加关注AI的伦理道德问题,以确保其行为符合人类价值观和社会规范。最后,人类可能需要与人工智能建立更深层次的合作关系,共同解决复杂问题,实现共同发展。 6。奇点预测 01资助:Kurzweil看好《奇点临近》和《奇点更近了》人工智能的发展,认为计算机智能将在2029年超过人类智能,智能100万倍20.45亿倍。人类和计算机融合成超人,这就是“奇点”。在《智能的启蒙》中,您还讨论了人工智能与人类的关系以及人工智能意识的启蒙和演化。您对奇点的到来和时间以及人类与计算机的融合有何预测? 刘志毅:库兹韦尔的“奇点”理论是对人工智能发展的重要预言。他认为,人工智能的发展将经历指数级增长阶段,最终将达到一个临界点,即“奇点”。至此,人工智能将在智力上超越人类,并引发一系列深刻的社会文化变革。这一理论在 《智能的启蒙》中得到了深入讨论,认为人工智能的发展潜力巨大,但也对于“奇点”到来及其时机,预测如下: 技术发展加速:随着计算能力的增强和算法的优化,发展速度可能会加快,但会加快。2029年进一步达到人类智能水平仍不确定 人机融合挑战:而计算机的融合是一个复杂的过程,认为人工智能将在2045年扩展一百万倍的预测可能过于乐观,需要进一步的技术。突破和社会适应。如何确保人工智能的发展符合人类的价值观和利益,是对整个社会的挑战。 总体而言,奇点理论提供了令人兴奋的未来愿景,但实现这一愿景需要克服许多技术和伦理障碍。未来人工智能的发展很可能是一个渐进的过程,而不是突然的、革命性的变化。 我们必须在技术发展进步的同时不断思考和解决相关的伦理和社会问题,确保人工智能的发展能够造福人类社会。

探索之路:人工智能发展的回顾与展望

探索之路:人工智能发展的回顾与展望演讲人:张钹 演讲地点:清华大学“人文清华讲坛” 演讲时间:2024年4月 张钹 中国科学院院士,清华大学计算机系教授,清华大学人工智能研究院名誉院长。2011年德国汉堡大学授予自然科学名誉博士,获2014年度CCF(中国计算机学会)终身成就奖,2019年度吴文俊人工智能科学技术奖最高成就奖。主要从事人工智能、人工神经网络和机器学习等理论研究,以及模式识别、知识工程和机器人等应用技术研究。在上述领域发表学术论文200多篇、专著5部(章)。科研成果获ICL欧洲人工智能奖等奖项。人工智能的两条路径迄今为止,全世界对于“什么是智能”尚无统一认识,但经过多年的探索,人工智能已然走出了两条道路。一条道路是行为主义学派,另一条道路是内在主义学派。其中,行为主义学派主张用机器模拟人类的智能行为。“智能”与“智能的行为”是两个完全不同的概念。“智能”在我们大脑里,人类至今仍对其知之甚少;“智能的行为”则是智能的外部表现,可以进行观察和模拟。因此,行为主义学派人工智能追求的目标是机器行为与人类行为的相似性,而非内部工作原理的一致性。目前人工智能的主流是机器智能,这种人工智能与人类的智能只存在行为相似,并非完全一致。内在主义学派主张必须用机器模拟人类大脑的工作原理,即类脑计算。这两个学派按照不同的思路对人工智能进行探索,前者主张除人类这条道路外,机器或其他方法也可以走出一条智能道路;后者主张走向智能道路只能依靠人类。目前这两种思路都处于探索阶段。人类对人工智能道路的探索始于1956年。当时在美国召开了人工智能研讨会,来自数学、计算机科学、认知心理学、经济学和哲学等不同领域的10位专家经过八周的讨论定义了人工智能。他们主张通过符号推理、符号表示来做一个能像人那样思考的机器。在这次会议上,纽维尔(Newell)和西蒙(Simon)演示了一个名为“逻辑学家”的程序。该程序用机器证明了数学原理第二章中的部分原理,数学定理证明与推理相似,这表明机器能做类似推理的工作。最终,“人工智能”在这个会议上获得了定义。1978年,清华大学成立了人工智能与智能控制教研组,这是中国最早的人工智能教学与科研机构。教研组有三十余位教师参与,其中绝大部分来自自动控制领域,而非人工智能。1978年,教研组招收了第一批硕士生,1985年开始招收第一批博士生,已能够开展一些与人工智能相关的教学工作,但科研工作进展不大。1982年至1984年,教研组进行调查研究,访问了西南、东北等地大量研究所及工厂。结合所见所闻,教研组确定了以智能机器人作为主要研究方向。1985年清华大学建立智能机器人实验室,1986年国家设立“863”发展计划,该计划将智能机器人作为一个主题。清华大学参加了第一届智能机器人主题的“863”高技术研究,从第一届到第四届均作为专家单位参加委员会。到了第五届,清华大学成为开展智能机器人研究的组长单位,1997年,成为空间机器人研究的组长单位。“智能技术与系统”国家重点实验室自1987年开始筹建,1990年正式成立。在这些工作的基础上,相关研究得以开展。当时首先建立了两个理论。一是问题求解的商空间理论和粒计算理论,在国际上影响很大。2005年,清华大学发起、组织了国际粒计算会议,每年一次,延续至今。二是在人工神经网络方面做了很多早期工作。 在杭州举办的2023云栖大会上,观众在“人工智能+”展馆参观人工智能产品及应用。新华社发人工智能的三个阶段1956年至今,人工智能的发展分为三个阶段,分别是第一代人工智能、第二代人工智能和第三代人工智能。第一代人工智能的目标是让机器像人类一样思考。思考是指推理、决策、诊断、设计、规划、创作、学习等。无论做管理工作还是技术工作,都需要两方面的能力,一是在某个领域具有丰富的知识和经验,二是具有很强的推理能力。其中推理是指运用知识的能力,换言之,是从已有知识出发,推出新的结论、新的知识的能力。基于以上分析,人工智能的创始人提出了“基于知识与经验的推理模型”,该模型的核心是若要实现机器思考,只需将相应的知识放入计算机即可。例如,如果要让计算机像医生一样为患者诊断,只需要把医生的知识和经验放到知识库里,将医生看病的推理过程放入推理机制之中,计算机就能为患者实施机器诊断。这一推理模型的核心思想是知识驱动,通过计算模型来实现让机器像人类那样思考。该模型最大的缺点是缺乏自学能力,难以从客观世界学习知识,所有知识都源于人类灌输。因此,第一代人工智能永远无法超越人类。第二代人工智能源于第一代人工智能的低潮期,主要基于人工神经网络。1943年,人工神经网络模型提出,它主要模拟人类脑神经网络的工作原理。第二代人工智能面临的主要问题是感性知识的传授。第一代人工智能主要在符号主义指导下进行,目的是模拟人类的理性行为。但人类除了理性行为外,还有大量的感性行为,而感性行为要用人工神经网络进行模拟。我们常说知识是人类智慧的源泉,知识是理性行为的基础,这里的知识来自教育,主要指理性知识、分析问题的方法等。但感性的知识难以用语言传授,也无法从书本上获得。每一个人最初得到的感性知识是对自己母亲的认识。但,具体是什么时候开始对母亲有所认识的?又是怎样实现这种认识的?这些问题到现在仍难以解答。所有感性知识都在不断观察、不断倾听的过程中学习累积,第二代人工智能深度学习沿用了这个方法。例如,过去我们主要通过编程的方法告诉计算机马、牛、羊的具体特征,现在则将网上大量马、牛、羊的照片做成训练样本,让计算机进行观察和学习即可。学习完毕,再把剩下的样本作为测试样本去测试它,识别率能达到95%以上。观察和倾听的过程通过人工神经网络进行,将识别的问题作为分类问题,利用人工神经网络来分类。通过神经网络进行学习的过程称为深度学习,基于深度学习能够进行分类、预测和生成等。但是第二代人工智能的所有数据(图像、语音等)均来自客观世界,它的识别只能用于区别不同的物体,并不能真正地认识物体。所以第二代人工智能最大的问题是不安全、不可信、不可控、不可靠、不易推广。第三代人工智能的基本思路是必须发展人工智能理论。迄今为止,人工智能尚无较为成型的理论,更多是模型和算法,且第一代和第二代人工智能的模型、算法都有很多缺陷。因此,必须大力发展科学完备的人工智能理论,在此基础上,才能发展出安全、可控、可信、可靠和可扩展的人工智能技术。对目前的人工智能技术而言,虽然提高了效率和质量,但系统越信息化和智能化,也就意味着越不安全。第一代人工智能运用了知识、算法、算力三个要素,其中最主要的是知识。第二代人工智能则主要用了数据、算法和算力三个要素。为了克服人工智能的固有缺点,唯一的办法是把知识、数据、算法和算力这四个要素同时运用。目前得到较多运用的AI工具(大语言模型),就能够充分利用知识、数据、算法、算力这四个要素。清华大学团队提出了第三代人工智能的三空间模型,将整个感知、认知系统进行连接,为发展人工智能理论提供了非常好的条件。 第四届消博会上,一款“AI数字人”在回答观众提问。新华社发深度学习的不安全性在研究过程中,研究者发现了人工智能深度学习的不安全性。其中一个典型案例是:研究者制作了雪山和狗的对比图,先让计算机和人看雪山,二者都能判定为雪山,但是只要在图片上添加一点噪声,人看雪山仍是雪山,计算机却会将雪山看成一条狗。这个案例说明,人工智能目前基于深度学习的模式识别跟人类的视觉完全不同,尽管它能够像人类那样区分雪山和狗,但实际上它既不认识狗,也不认识雪山。这里面的关键问题是——什么是狗?应该如何定义一条狗?人类通常通过视觉来进行区分,主要看狗的外形,但什么是狗的外形?狗有各种形态、各种姿势,为什么人类的视觉能够在千变万化的外形里确定目标是狗?这个问题的答案,到现在为止尚未弄清楚。最早的计算机识别狗时,狗变换了位置后计算机就不能识别了,这是位移的不变性,这个问题现在已经解决。但是尚未解决的问题还有很多。例如,计算机能够识别固定尺寸的狗,但是把狗变大或变小后都难以识别,这是大小的不变性。现在计算机只能通过局部纹理来区分狗和雪山。因此,如果将雪山图上的某个纹理改成皮毛纹理,即便雪山的形状保持不变,计算机仍会把雪山误认为是狗。所以说,到目前为止,人工智能的深度学习仍然不够安全可靠。 中国科学院自动化研究所人形机器人攻关团队科研人员在多模态人工智能系统全国重点实验室调试机器人。新华社发大语言模型的“大模型”与“大文本”目前比较成功的AI工具,其强大性主要来源于两个“大”,一是大模型,二是大文本。第一个大模型的“大”是大的人工神经网络,人工神经网络可以用来分类、学习数据中间的关联关系,也可以用来预测。这个巨大的人工神经网络叫“转换器”。AI工具的能力强大,离不开深度神经网络的强大。原来的神经网络是逐字输入,现在一次能够输入2000多字(一个token,粗略地讲相当于一个汉字)。人类从1957年到2013年花了56年时间探究文本的语意表示问题,现在的文本不是用符号表示,而是用语意向量表示,这也是最重要的一个突破。过去计算机处理文本只能把它当作数据处理,现在可以把它当成知识来处理,即向量表示。此外,还提出了“自监督学习”。过去供计算机学习的文本都要做预处理、预先标注,此项工作量太大,所以无法支撑计算机大量学习。自监督学习是指原来的文本不经过任何处理就可以被计算机学习,用前面的文本预测后面的词,输入后预测下一个,被预测的内容又把再下一个变成输入,有些类似于接龙式学习方式。第二个“大”是大文本。计算机实现自监督学习后,所有文本不用经过任何预处理就可以学习,文本也由原来的GB量级发展为TB量级。现在比较成功的人工智能大约学习了40TB以上,相当于一千多万本牛津辞典,并且这个学习过程并非死读,而是理解其中的内容。这就使得我们进入了生成式人工智能时代。无论是第一代还是第二代人工智能,都受到三个限制——特定领域用特定模型完成特定任务。“三个特定”是所谓的“窄人工智能”,即专用人工智能。目前比较成功的AI工具能够通过其强大的语言生成能力让人类在与它对话时没有领域限制,这是人工智能的重大进步。另外,生成多样性的输出是目前AI工具的重要特征。它有多样化的输出就有可能创新,因为输出多样化,难以保证每个输出都正确,所以越希望它能输出有创造性,就越要允许它犯错误。我们在日常使用一些AI工具时也会发现,有时AI对问题的回答非常机智聪明,有时则是明显的胡说八道,这就是多样化输出的结果。目前AI工具产生了两个重大突破,一是生成语意连贯的类似人类的文本,二是在开领域实现了人机自然语言对话。大语言模型是向通用人工智能迈出的一步,有西方专家认为这是通用人工智能的曙光,但它并不是通用人工智能,人类走向通用人工智能依然任重道远。走向通用人工智能必须满足三个条件。第一,系统必须与领域无关。目前较为成功的AI工具在对话、自然语言处理的问题上做到了与领域无关,但在处理其他大量问题上仍难以实现这一目标。第二,系统与任务无关,即什么任务都会做。目前AI工具能进行对话、四则运算、作诗、写代码等多种任务,但仍难以完成复杂环境下的复杂任务。第三,尚需建立一个统一的理论。因此,人工智能还有很长的路要走。大语言模型迈向通用人工智能的四个步骤从大语言模型迈向通用人工智能需要四个步骤。第一步是跟人类进行交互、与人类对齐,第二步是多模态生成,第三步是与数字世界交互,第四步是与客观世界交互。我们并不是说,完成这四步就意味着实现了通用人工智能,而是说通往通用人工智能这个目标,至少需要迈出以上四步。第一步是与人类对齐。目前AI工具输出的内容不一定正确,若要解决这个问题,必须依靠人类帮助它克服,使之与人类对齐。从AI工具的应用实践来看,它的错误需要人类帮助纠正,而且它的错误纠正速度和迭代速度都很快。与此同时,我们要看到输出内容的错误仍然存在,但我们如果想要它具有创造性,就要允许它犯错误。第二步是多模态生成。现在已经可以用大模型生成图像、声音、视频、代码等各种模态的内容。随着技术的进步,鉴别一个内容是由机器生成还是人工完成将会变得越来越困难,这为“造假”提供了非常好的机会。“造假”又名“深度造假”,即用深度学习的办法“造假”。试想一下,如果以后网络上95%的文本都由AI生成,那么我们还能通过网络获取真知与真相吗?比方说,当一件事情发生后,网络上出现一片支持或者反对意见,这些意见究竟是来自多数人的真实表达,还是来自少数人操纵AI歪曲事实?如何有效防止AI工具操纵舆论、混淆视听,这是需要我们严肃考虑的。目前人工智能领域已经实现了三项突破,即开领域生成语意连贯的类似人类的文本。其中,语意连贯是最重要的突破,这个突破后就有了图像的突破。因为图像只要求在空间上连贯即可,而视频则进一步要求时空上的连贯。我们在语言上进行突破,紧接着会有图像的突破,图像突破后肯定还会有视频的突破。在这个发展过程中,计算的资源要求和硬件都会变得越来越多。随着人工智能的发展,很多人注意到了“涌现”现象。例如,当系统规模没有达到一定程度时,生成的图画很糟糕、水平较差,但当规模达到一定程度,生成的大多数图画突然间就变得质量很高。这个过程称为“涌现”,“涌现”是从量变到质变的过程。到目前为止,全世界范围内都还无法完全理解“涌现”现象出现的原因。第三步是AI智能体。大语言模型迈向通用人工智能必须与数字世界进行连接,首先在数字世界里具体操作,从而解决问题、感知自己成果的优劣,并进行反馈。这个工作对促进大模型的性能向前发展有很大益处。第四步是具身智能。具身智能,即具有身体的智能。智能光有脑还不够,还必须具有身体,这样才能动口又动手。所以,大语言模型迈向通用人工智能,必须通过机器人与客观世界连在一起。 第六届世界声博会上,小朋友们在参观体验一款弈棋机器人(2023年摄)。新华社发人工智能的产业发展当下,信息产业的发展非常迅猛,原因在于建立了相关理论,在理论指导下制作的硬件和软件都是通用的。过去,信息产业领域内出现了一些具有世界影响力的大型企业,应用推广相应技术并实现信息化,整个链条发展非常迅速。但是,人工智能产业的发展缺乏理论,只有算法和模型,而根据算法和模型建立的硬件和软件全是专用的。“专用”即意味着市场很小,到现在为止,人工智能产业还没有产生具有世界影响力的大型企业,所以人工智能产业必须跟垂直领域深度结合才有可能发展。不过,目前情况也在发生变化,具有一定通用性的基础模型的出现,肯定会影响产业发展。2020年,全世界人工智能产业达到10亿美元以上的独角兽企业一共有40家,2022年变成117家,2024年初达到126家,从这个情况来看,它是逐步增长的。到现在为止,中国有100甚至200家企业在做大模型。这么多人做基础模型,他们未来的出路在哪里?第一个出路是向各行各业转移,做各个垂直领域的大模型。现在很多行业都在考虑这个问题,例如石油行业考虑石油行业的大模型,金融行业考虑金融行业的大模型,所以将来做通用大模型的数量将越来越少,大多数做大模型的人才会转向各个垂直领域。第二个出路是最重要的,即经过微调应用在产业里。换言之,提供公开的大模型软件,让大家开发应用。第三个出路是跟其他技术结合,发展新的产业。国外很多独角兽企业都将AI工具与其他技术结合,发展新产业,有的是向各个行业转移,还有的专门做图像、视频、语音等。国内一些大模型现在也已经取得了比较好的发展。基于此,势必要推动人工智能领域的产业变革。今后无论做硬件还是做软件,一定要放到基础模型的平台当中。过去是在一个零基础的计算机中制作软件,效率很低,而现在平台已经学习超过一千万本牛津辞典,能力水平至少相当于一个高中生,若将同样的工作放到基础模型的平台上进行将会事半功倍,所以采用这个平台是不可阻挡的趋势。而这些“高中生”则来源于大模型企业提供的公开平台。大模型的局限性大模型的所有工作都由外部驱动,在外部提示下进行。它缺乏主动性,在外部提示下做某事时,主要基于概率预测的方法,所以会出现一些人类没有的缺点,即输出的质量不可控。并且它不知道是非对错,所以它的输出也不可信。与此同时,它受外部影响太大,只能听从指令来完成相应的事情。但人类则是完全不同的,即使这件事是由别人安排完成,人也能够在自己的意识控制下进行,所以是可控、可信的。由此可见,目前的人工智能并不知道自己的所作所为。AI工具尚不能准确分辨对错,且现在还难以主动进行自我迭代,仍旧需要在人类的操作下进行。未来的人工智能最多成为人类的助手,在人类的监控下进行操作,只有少数工作可以完全交给机器独立完成。有研究机构曾做过关于人工智能对各行各业影响的统计,列出了大量行业,在未来这些行业中只有少数工作可能会被人工智能取代。可见,人工智能对各行各业都有重大影响,但大多数是帮助人类提高工作质量和效率,而非取代人类进行工作。人工智能是探索“无人区”,其魅力就在于它永远在路上。我们不能因为它的进展而过于乐观,也不必因为它的挫折而沮丧,我们需要的是坚持不懈地努力。(本讲座文稿由清华大学新闻与传播学院博士生牛雪莹整理)《光明日报》(2024年05月25日 10版)来源:光明网-《光明日报》

专利数量全球领先 中国人形机器人产业未来可期

  人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,深刻变革人类生产生活方式,重塑全球产业发展格局。   当前,人形机器人技术加速演进,已成为科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大,应用前景广。   政策力挺   人形机器人产业   近年来,国内外人形机器人快速发展,行业关注度日趋提升。政策面上,2023年10月,工信部印发《人形机器人创新发展指导意见》(以下简称《指导意见》)。《指导意见》首次对人形机器人产业发展提出系统性指导意见,明确发展目标与时间点。   根据《指导意见》,到2025年,人形机器人创新体系初步建立,一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产,在特种、制造、民生服务等场景得到示范应用。到2027年,人形机器人技术创新能力显著提升,形成安全可靠的产业链供应链体系,综合实力达到世界先进水平,产业加速实现规模化发展。   今年1月,工信部等七部门联合印发《关于推动未来产业创新发展的实施意见》(以下简称《实施意见》)。在“做强未来高端装备”部分,《实施意见》要求加快实施重大技术装备攻关工程,突破人形机器人、量子计算机等高端装备产品,以整机带动新技术产业化落地,打造全球领先的高端装备体系。人形机器人处于未来创新标志性产品前列。   海外方面。2023年5月,美国白宫公布了一系列围绕美国人工智能使用和发展的新举措,并更新发布了《国家人工智能研发战略计划》,其中明确提出要“开发功能更强大、更可靠的机器人”;日本实施新机器人战略,旨在使该国成为世界第一的机器人创新中心,重点领域是制造业、护理和医疗、基础设施和农业。   中国人形机器人   专利数量全球领先   当前,以人形机器人和通用人工智能为代表的新技术、新产品、新业态蓬勃发展,正成为全球科技创新的制高点、未来产业的新赛道和经济增长的新引擎。相关专利的数量和转化,则可以体现出一个国家或地区的科技水平,以及专利的创新能力和市场化程度。   2023年11月,人民网研究院发布《人形机器人技术专利分析报告》。截至报告发布日,以有效发明专利计算,中国共计拥有发明有效专利1699件,仅略低于日本的1743件,排名全球第二;并与排名第三至第五的韩国、美国、法国拉开较大差距。这些专利储备和技术布局有望在接下来的全球范围内的科技竞争中,使中国始终保持在领先位置。   从专利申请来看,中国已成为人形机器人技术专利主要申请国。截至报告发布日,中国已累计申请6618件人形机器人技术专利,是申请技术专利数量最多的国家;日本排名第二,申请技术专利数量6058件。从技术分支来看,已申请的专利技术主要集中在本体结构、驱动控制和智能感知部分,申请量依次为7949件、4800件和4191件,核心零部件以及支撑环境技术分支的申请量较少。   2024年有望成为   产业元年   近期,人形机器人利好消息不断。   4月9日,首届中国人形机器人产业大会暨具身智能峰会在北京海淀区开幕。大会以“竞逐人形万亿赛道·重塑未来产业新纪元”为主题,超200位人形机器人院士专家和企业家,围绕四大专题活动展开精彩报告。来自全球的1200余名行业人士参会,两大展区荟聚30余家企业展示最新技术和产品,展现人形机器人产业发展的新动态、新趋势。2024年是人形机器人和具身智能高速发展的关键元年,已成为行业共识。   会上,立德研究院与优必选科技、灵心巧手等联合参编单位代表共同发布了《人形机器人产业研究报告》。报告预测,2024中国人形机器人市场规模约27.6亿元,到2029年达到750亿元,将占到世界总量的32.7%,位居世界第一,到2035年规模有望达到3000亿元。   往前追溯。3月13日,Figure AI与OpenAI合作发布最新视频。视频中,人形机器人所展示的人机交互能力、逻辑归纳分析能力以及硬件操控能力均超出预期,引发热烈反响。该人形机器人采用了端到端神经网络,进一步验证AI大模型、技术迭代加速能够指数级推动人形机器人应用落地的想象。   美国当地时间3月18日,英伟达创始人兼CEO黄仁勋在NVIDIA GTC 2024开发者大会上发表主题演讲《见证AI的变革时刻》,对人形机器人进行了重点介绍:一是英伟达将推出GR00T机器人项目,以支持机器人理解自然语言、模仿人类动作、快速学习协调性、灵活性及其他技能;二是构建三大机器人相关平台、模拟训练加速迭代,模拟物理世界(NVIDIAIAI)、驱动数字孪生计算系统(Omniverse)、驱动人工智能机器人(ISAAC);三是与比亚迪开展合作,实现应用落地。   华福证券认为,人形机器人行业发展由智能电动车企龙头摇旗呐喊,扩散到算力芯片龙头、AI大厂、独角兽企业联合登台,产业趋势明确、迭代持续加速。预计后续海外头部厂商团队将走访供应商,推进量产落地,机器人板块催化将持续。   多家上市公司加速布局   由于产业发展前景良好,资本市场也在加速布局。2023年12月,“人形机器人第一股”优必选科技在香港交易所主板正式挂牌上市,旗下Walker X机器人是中国首个商业化双足真人尺寸人形机器人,也是全球首个实现量产交付的人形机器人。优必选科技在有效专利储备量方面排名全球第一,高于本田、索尼、丰田等企业。今年4月,优必选宣布人形机器人Walker S接入百度文心大模型,共同探索中国AI大模型+人形机器人的应用。   部分零部件企业已正式“下场”。国内步进电机龙头鸣志电器此前公告,公司在人形机器人应用领域专注于手掌模组及指模所用的控制电机模组的研发和制造,也获得了该领域头部企业的关注以及合作意向。公司已向该领域头部客户提交了全套技术方案及样机,供客户作可靠性及实际应用的测试验证。   还有不少公司开始布局。富瀚微近期表示,由于人形机器人领域还没有完全定型,公司不会贸然开发专门的芯片,正在与人形机器人领域的客户保持充分的沟通交流,并进行IP方面的储备,以便在未来能够快速响应。卧龙电驱也在投资者互动平台表示,包括人形机器人在内的仿生机器人是公司新质生产力的重点布局赛道,公司在机器人的各种伺服关节模组有所布局。   从整个行业来看,浙商证券认为,人形机器人的产业大趋势已经确定,国外以特斯拉Optimus为代表,规划2025年小批量量产;国内以优必选为代表,目前已在汽车厂实训测试,预计工业场景的量产临近。该机构预计,企业送样、验证、定点或产能规划等举措均可能成为一轮行情的催化剂。   根据高盛最新预测,人形机器人市场规模在2035年将达到378亿美元,其对人形机器人出货量的测算较此前增加了4倍,高达140万台。同时,由于人形机器人材料成本已较2022年下降约了40%,预计人形机器人将可更快实现盈利。 一般经营项目是:机器人、电气产品、电子产品、安防产品、自动化产品、工控产品、机电设备、智能控制系统、高低压成套设备、低压电器、仪器仪表、电线电缆、电子电气元器件及制品、五金工具及配件、模具、通讯产品、计算机软硬件、家用电器及配件、摄影摄像器材、扫描仪、打印机的技术开发购销;自动化控制系统的设计、技术开发;计算机软硬件、网络系统的技术开发;国内贸易,从事货物及技术的进出口业务(法律、行政法规、国务院决定禁止的项目除外,限制的项目须取得许可后方可经营)。(企业经营涉及前置性行政许可的,须取得前置性行政许可文件后方可经营),许可经营项目是:无