人工智能 · 2024年3月31日 0

AI代理的发展历程:从哲学思想启发到人工智能实体的实现

AI Agent发展简史,从哲学思想启蒙到人工智能实体。想了解AI智能体的发展历程?这篇AI Agent发展简史必读!终于有人把AI Agent的发展史讲明白了,一定要收藏AI Agent发展简史,解密AI智能体从哲学启蒙到落地人工智能的历程全面了解AI智能体发展历程,一定要看这篇AI Agent发展简史你可能想不到,AI Agent最早出现于《道德经》和亚里士多德哲学。文/王吉伟。自AutoGPT火出圈后,业内对AI Agent的讨论从没停止过。Lilian Weng在其六千字博文中对AI Agent的系统介绍,直接对当代基于大语言模型的AI Agent做了全新定义,至此”LLM+记忆+任务规划+工具使用”就成了全新的AI Agent四件套。搞懂了AI Agent原理,业内外对于AI Agent探索与交流自然就更多。尤其是经历了一段时间的”LLM落地难”声音的洗礼后,现在只要谈到AI Agent,创业者们就会双眼放光,投资人们也是热情高涨,大企业们更是跃跃欲试。由此,AI Agent成了继LLM之后产学研用各界无人不知的崭新焦点。从人人皆谈大语言模型,到张口就是AI Agent,意味着大家对LLM的关注真正落点到了应用层,如何落地也真正成了所有领域探索LLM的压轴戏。谈到AI Agent,很多人都认为它是LLM的产物,毕竟大部分人接触Agent是从基于GPT-4的AutoGPT、BabyGPT、GPT-engineeR等开源Agent程序开始的。但了解AI Agent的人应该知道,Agent概念并不是当今的产物,而是伴随人工智能而出现的智能实体概念不断进化的结果。有人认为AI Agent起源于20世纪80年代WooldRidge等人将Agent引入到人工智能,也有人认为最早的Agent概念应该是上世纪50年代阿兰图灵把”高度智能有机体”扩展到了人工智能。也有论文将最早的Agent概念追溯到了丹尼斯·狄德罗的”聪明的鹦鹉”学说。如果从哲学启迪的角度来看 Agent,大概可以上溯到公元前280年到公元前485年之间的庄子、亚里士多德、老子等思想家的学说与著作。从这些观点、学说与论文中,沿着哲学思想到人工智能实体的发展方向,大体可以梳理出一个AI Agent发展的大体脉络。在此基础上,王吉频道总结了这篇AI Agent发展简史,以让大家更全面地了解AI Agent。全文约7000字,文章略长,建议大家先收藏再阅读。如果感觉对你有用,不要忘了点赞、转发和收藏。起源:哲学启蒙阶段。”Agent”是一个有着悠久历史的概念,在许多领域都得到了探索和解释。关于AI Agent的最早起源,还要从能够启发人类思考的哲学领域开始探寻。一些论文将其追溯到公元前350年左右的亚里士多德时期,当时的一些哲学家就曾在哲学作品描述过一些拥有欲望、信念、意图和采取行动能力的实体。若从古代哲学家的思想著述中寻找Agent踪迹,还可以把时间继续上溯到公元前485年左右的中国春秋时代,老子在其对后世影响深远的思想巨著《道德经》中也可以看到智能体的影子。该书在四十二章写道:”道生一,一生二,二生三,三生万物”。用现在计算科学眼光来看,它所描绘的”道”或许正是一个生生不息、包容万物并且能够自身演化的实体,这种实体小到种子的生发荣枯,大到宇宙天体的周天运转,这是典型的自主智能体。时间再晚一些的庄子,在”庄周梦蝶”的时候,他不知道自己是庄子还是蝴蝶,分不清是梦境还是现实。如果用现代计算科技技术来看,这个梦可以理解为元宇宙,那么梦里的蝴蝶包括所有具备生命的物体,便都如”西部世界小镇”游戏那样的生成智能体。时间来到18世纪,法国思想启蒙运动时期的丹尼斯·狄德罗也提出了类似的观点:如果鹦鹉可以回答每个问题,它就可以被认为是聪明的。虽然狄德罗在著作中写的是鹦鹉,但谁都能体会到这里的”鹦鹉”并不是指一只鸟,而是突出了一个深刻的概念,即高度智能的有机体可以有着类似于人类的智能。是不是很有意思,我们认为近代人们在科技取得一定进展后才设想的AI Agent,其实古人早就思考并探索过。或许正是因为这种思想,造就了人类对于各种工具的极致追求,诞生了春秋战国时期鲁班打造的能飞三天三夜的”木鹊”与墨家打造的机关城,三国时期的木牛流马和指南车,唐代”酌酒行觞”的木人”女招待”,以及明朝帮人干活的多种”机关转捩”木头人。这些人类早期出现的自动化工具,并非具备分析及推理能力并能够采取行动的智能体。但自古至今一直存在的这些想法与做法,恰恰也反映了人类数千年来对于智能体或者说自动化的持续追求。当然通过这些思想我们也能获悉,Agent的哲学概念泛指具有自主性的概念或实体,它可以是人造的物体,可以是植物或动物,当然也可以是人。发展:人工智能实体化。不管最早的Agent描述出自哪里,这些哲学思想都不同程度启发了近代Agent的发展。20世纪50年代,阿兰图灵把”高度智能有机体”概念扩展到了人工实体,并提出了著名的图灵测试。这个测试是人工智能的基石,旨在探索机器是否可以显示与人类相当的智能行为。这些人工智能实体通常被称为”Agent”,形成了人工智能系统的基本构建块。至此,人工智能领域提到的Agent,通常是指能够使用传感器感知其周围环境、做出决策、然后使用致动器采取响应行动的人工实体。随着人工智能的发展,术语”Agent”在人工智能研究中找到了自己的位置,用来描述显示智能行为并具有自主性、反应性、主动性和社交能力等素质。此后,Agent的探索和技术进步成为人工智能领域的焦点。50年代末到60年代是人工智能的创造时期,所出现的编程语言、书籍及电影到现在还在持续影响更多的人。在经历第一次人工智能寒冬后,80年代出现了一股人工智能热潮。这段时间的各项研究都有所突破,来自政府等机构的投资也开始增多,研究者对AI Agent的探索也在逐步增加。但这股热潮仅维持了7年,到1987年迎来了第二次人工智能寒冬。这股寒潮延续了很多年,尽管在这期间大部分机构都缺少资金支持,人工智能还是沿着既有技术路线刚毅发展。其中,AI Agent就在1995年被WooldRidge和Jennings定义为一个计算机系统:它位于某个环境中,能够在这个环境中自主行动,以实现其设计目标。他们还提出AI Agent应具有自主性、反应性、社会能力与主动性等四个基本属性。而在AI Agent正式被经济学接纳后,它也被进一步定义为具备感知其环境并采取行动以最大限度地提高成功机会的系统。根据这个定义,能够解决特定问题的简单程序也是”AI Agent”,所以后来能够在各种棋类游戏中与人类对弈的机器人也算是AI Agent的一种。AI Agent范式将AI研究定义为”智能代理研究”,它研究各种智力,超越了研究人类智能。在AI Agent被赋予”四种基本属性”期间,1993年到2011年,出现了很多基于当时AI技术且令人印象深刻的Agent类项目。这些项目的出现时间和简介如下:1997年:深蓝(由IBM开发)在一场广为人知的比赛中击败了世界国际象棋冠军加里·卡斯帕罗夫,成为第一个击败人类国际象棋冠军的程序。1997年:Windows发布了语音识别软件(由DRagon systems开发)。2000年:CyntHia BReazeal教授开发了第一个可以用面部模拟人类情感的机器人,它拥有眼睛、眉毛、耳朵和嘴巴,被称为KiSMet。2002年:第一个RooMba被释放。2003年:美国宇航局将两辆火星车(勇气号和机遇号)降落在火星上,它们在没有人类干预的情况下在火星表面航行。2006年:TwITteR,FACEbook和Netflix等公司开始利用AI作为其广告和用户体验(UX)算法的一部分。2010年:MicRosoft推出了Xbox 360 Kinect,这是第一款旨在跟踪身体运动并将其转化为游戏方向的游戏硬件。2011年:一台名为Watson(由IBM创建)的NLP计算机被编程来回答问题,在电视转播的智力比赛节目《JeopaRdy》中战胜了两位前冠军。2011年:苹果发布了SiRi,这是第一个流行的虚拟助手。进化:AI Agnet的演变。伴随着AI 技术的发展,至2000年左右,Agent已经衍生出不少种类。根据其感知的智能和能力程度的不同,罗素、诺维格、彼得等人在《ARtificial Intelligence: A ModeRn ApProach》一书中将AI Agent分为以下五类:简单反射智能体(SIMPLE REFLEX AGENTS):一种简单的代理类型,它基于当前的感知而不是基于感知历史的其余部分。这种类型的问题包括智力非常有限,对状态的非感知部分一无所知,生成和存储规模巨大以及无法适应环境变化。基于模型的智能体(MODEL-BASED AGENTS):这种代理利用条件操作规则,通过查找允许满足基于当前情况的条件的规则来工作,通常由两个重要因素组成,即模型和内部状态。它可以通过获取有关世界如何演变以及代理的操作如何影响世界的信息来更新代理的状态。基于目标的智能体(GOAL-BASED AGENTS):此类型根据其目标或理想情况做出决定,以便它可以选择可以实现所需目标的操作。这种智能体可以通过搜索以及不同的计划,具备思考一长串可能的行动来确认其实现目标的能力,使代理具有主动性。基于实用程序的智能体(UTILITY-BASED AGENTS):公用事业代理的最终用途是其构建块,当需要从多个替代方案中采取最佳行动和决策时使用。它考虑了代理的幸福感,并给出了代理由于效用而有多幸福的想法,因此具有最大效用的行动。学习型智能体(learning AGENTS):具有从过去的经验中学习的能力,并根据学习能力采取行动或做出决定。它从过去获得基础知识,并利用这些学习来自动行动和适应。一般由四部分组成,分别是学习元素、批评者、性能元素和问题生成