摘要:撰文 乔治·马瑟(George Musser) 探索人工智能的梦想从来就不是创造一个能击败国际象棋大师的程序,或者搭建一个试图破坏婚姻的聊天机器人。实际上,它让我们以技术为镜来反观自……
撰文 乔治·马瑟(George Musser)
探索人工智能的梦想从来就不是创造一个能击败国际象棋大师的程序,或者搭建一个试图破坏婚姻的聊天机器人。实际上,它让我们以技术为镜来反观自身,从而更深刻地认识自我。研究者追求的不仅仅是人工智能,而是具备类人的适应性和创造力的通用人工智能(AGI)。
1、迈向通用人工智能
大语言模型(LLM)已经展现出远超研究者预期的问题解决能力。但是,它们仍不时犯下可笑的错误,并缺乏开放学习的能力:一旦完成根据书籍、博客和其他材料的训练,它们的知识库就会冻结。它们也不能通过专家设计的“机器人大学生测试”:无法完成大学教育,甚至幼儿园教育也不行。
这些系统唯一真正解决的AGI问题是语言。它们拥有所谓的“形式表达能力”:LLM能解析你提供的所有句子,即使是只言片语或俚语它也能搞明白,还能以类似维基百科的标准英语作出回复。但是,它们不具备那些能够帮助我们处理日常生活的思维能力。“我们不应该期望它们能够思考,”麻省理工学院的神经科学家南希·坎威舍说,“它们是语言处理器。”LLM能熟练地操纵文字,但除了已经掌握的文本之外,它们并没有与现实互动。
从这个意义上讲,大语言模型只是模仿了大脑的语言能力,却缺乏感知、记忆、导航、社会判断等能力。我们的大脑灰质执行的功能互相重叠,既纷繁复杂又浑然一体——它们或广泛分布在多个脑区,或局限于某个特定脑区。例如,那些大脑语言功能区中风的患者可能无法说话,但他们仍能够像以前一样做加减运算,创作交响曲,下棋,还能通过手势交流。AI的开发者正将这类功能模块引入到他们的系统之中,希望使它们更加智能。
生成式预训练变换器(GPT)的创造者OpenAI,通过插件来帮助付费用户完成数学运算、互联网搜索和其他查询任务。每个插件都有一个专用的,接受过预训练的专业知识库可供调用。其实,GPT的核心语言系统在某种意义上也是模块化的。OpenAI对GPT的架构严格保密,但众多AI研究者推测,GPT由多达16个独立的神经网络或“专家”组成,这些“专家”通过汇集它们的输出来回答用户的问询,但是汇集的工作机制尚不明确。2023年12月,总部位于法国巴黎的AI公司Mistral也发布了一款基于“混合专家”架构(MoE)的开源模型,引发了巨大轰动。这种形式简单的模块化架构,最主要优势就是计算效率:训练和运行16个较小的(神经)网络比运行一个大型(神经)网络更容易。“这个‘MoE架构’实现了两全其美。”英国爱丁堡大学的AI研究员埃多阿多·蓬蒂说,“我们能得到一个拥有大量参数的系统,同时保持了小模型的效率。”
但是,模块化也带来了问题。没有人确切知道大脑的各个区域如何协同工作以创造出一个和谐的自我,更不用说机器如何去模仿这一点了。“语言系统是如何将信息传递给逻辑推理系统或社会推理系统的?”麻省理工学院的神经科学家安娜·伊万诺娃为此感到非常好奇,“这仍然是一个悬而未决的问题。”
一个大胆的假设是,意识是这一切的基础。根据“全局工作空间理论”(GWT),意识对大脑来说就像是公司的员工会议,是一个为各个模块提供可以分享信息并提供帮助的地方。当然,GWT并非意识的唯一理论,但AI研究者对它特别有兴趣,因为它提出了一个大胆的假设,即意识对于高级智能至关重要。完成一个简单或熟练的任务时,大脑可以自动运行。但是,当全新或者复杂的任务出现,并且超出了单一模块范畴时,我们需要意识到自己正在做什么。
戈策尔等学者已经将GWT的工作空间融入了他们的AI系统。“我认为全局工作空间模型的核心理念将以许多种不同的形式出现,”他说。研究人员在AI系统中运用GWT,目的并不是制造有意识的机器。相反,他们只是通过在硬件上实现GWT来获得类似人类的智能。
但是,在这个过程中,他们是否会在无意中创造出一个具有感觉和动机的有意识生命?GWT的提出者、加利福尼亚州拉荷亚神经科学研究所的伯纳德·巴尔斯认为这不太可能。“有意识计算是一个丝毫没有证据的假设,”他说。但如果AI研究者确实成功创建出了AGI,它们可能会对智能本身的架构和功能提供关键的洞察。
2、意识模型