Descargitas

来自中国的最新突发新闻。

组合多个 Chat GPT 实例来学习化学

组合多个 Chat GPT 实例来学习化学

图片中是一个含有化学品的实验室,但没有人。
放大 / 实验室空无一人,每个人都在花园里放松,而人工智能则在工作。

尽管人工智能取得了快速进展,但人工智能在科学实践中还远未准备好取代人类。 但这并不意味着他们无法帮助自动化日常科学实验中的一些艰苦工作。 例如,几年前,研究人员将人工智能控制自动化实验室设备,并教它如何对一组原材料之间可能发生的所有相互作用进行全面分类。

尽管这很有用,但仍然需要研究人员进行大量干预来训练系统。 卡内基梅隆大学的一个研究小组现在已经找到了如何让人工智能系统自学如何处理化学的方法。 该系统需要一组三个人工智能实例,每个实例专门负责不同的流程。 但是,一旦你设置好它并为其提供原材料,你所要做的就是告诉它你想要进行什么类型的反应,它就会弄清楚。

人工智能三位一体

研究人员指出,他们有兴趣了解大型语言模型 (LLM) 可以为科学事业提供的功能。 因此,这项工作中使用的所有 AI 都是 LLM,主要是 GPT-3.5 和 GPT-4,尽管其他 -Claude 1.3 和 Falcon-40B-Instruct – 也经过了测试。 (GPT-4 和 Claude 1.3 表现最好。) 但研究人员并没有使用单一系统来处理化学的各个方面,而是创建了不同的协作实例,建立了他们称之为“宇宙世界”的劳动分工。

他们使用的三个系统是:

网络搜索器。 这有两个主要功能。 一种是使用 Google 搜索 API 来查找由于其中包含的信息而可能值得吸收的页面。 第二种是摄取这些页面并从中提取信息 – 将其视为类似于 Chat GPT 可以保留的先前对话片段的上下文,以告知其后续答案。 研究人员能够跟踪这个单元在哪里花费了时间,它访问的地方大约有一半是维基百科页面。 访问量排名前五的网站包括美国化学会和英国皇家化学会出版的期刊。

文献研究员。 将此视为 实时调频 例子。 人工智能将控制各种实验室自动化设备,例如自动液体处理机等,这些设备通常通过专门的命令或 Python API 之类的东西进行控制。 该人工智能实例已被授予访问该设备的所有手册的权限,使其能够学习如何控制它。

一个计划。 规划者可以向人工智能的其他实例发出命令并处理它们的响应。 它可以访问 Python 代码执行沙箱,从而执行计算。 他还可以使用自动化实验室设备,使他能够虚拟地进行和分析实验。 因此,您可以将规划器视为系统的一部分,它必须像化学家一样行事,从文献中学习并尝试使用设备来实施所学到的知识。

规划器还可以识别何时发生编程错误(无论是在 Python 脚本中还是在尝试控制自动化机器时),从而允许其纠正错误。

将系统投入使用

最初,系统被要求合成多种化学物质,例如对乙酰氨基酚和布洛芬,确认在搜索网络和科学文献后,它通常可以发现可行的配方。 因此,问题是系统是否能够足够好地检测到它可以访问的设备以触发其概念能力。

首先,研究人员使用了一个标准样品板,其中包含排列成矩形网格的一系列小孔。 该系统被要求使用不同颜色的液体填充正方形、对角线或其他图案,并且它能够有效地做到这一点。

接下来,他们将三种不同颜色的溶液放置在井网络中的随机位置; 系统被要求识别孔及其颜色。 就其本身而言,Coscientist 并不知道如何做到这一点。 但当他被提醒不同的颜色会显示不同的吸收光谱时,他使用了他可以使用的光谱仪并能够识别不同的颜色。

由于基本的命令和控制似乎有效,研究人员决定尝试一些化学反应。 他们在样品板上安装了充满简单化学品、催化剂等的孔,并要求其执行特定的化学反应。 这位宇宙学家从一开始就掌握了化学原理,但他使合成发挥作用的尝试失败了,因为它向加热和驱动反应的机器发送了无效的命令。 这让他回到了文档模块,允许他纠正问题并运行交互。

它奏效了。 反应混合物中存在所需产物的光谱指纹,并且通过色谱法证实了它们的存在。

改善

基本反应完成后,研究人员要求系统优化反应效率,并将优化过程呈现为游戏,分数随着反应结果而上升。

系统在第一轮测试反馈中做出了一些错误的猜测,但很快就专注于获得更好的回报。 研究人员还发现,通过向 Coscientist 提供一些随机初始混合物产生的结果的信息,他们可以避免第一轮中的错误选择。 这意味着,无论Coscientist从哪里获取信息——无论是来自自己的反馈还是来自某些外部信息源——它都能够将这些信息纳入其规划中。

研究人员得出的结论是,Coscientist 有几项值得注意的能力:

  • 使用一般信息规划化学合成
  • 导航和处理复杂设备的技术手册
  • 利用这些知识来控制一系列实验室设备
  • 将这些仪器功能集成到您的实验室工作流程中
  • 分析他的反应并利用该信息来设计改进的反应条件。

从很多方面来说,这听起来就像学生在研究生院第一年的经历。 理想情况下,研究生的进步将超越此。 但也许 GPT-5 也能做到。

更危险的是,Coscientist 架构依赖于许多专门系统的交互,类似于思维的工作方式。 显然,专门的大脑系统能够进行广泛的活动,而且活动的数量有很多。 但这种结构对于实现更复杂的行为可能至关重要。

然而,研究人员本身也对联合科学家的一些能力感到担忧。 有很多化学品(比如神经毒剂)我们不希望看到它们更容易制造。 弄清楚如何告诉 GPT 实例不要做某事已经成为一个持续的挑战。

《自然》,2023。DOI: 10.1038/s41586-023-06792-0 (关于数字身份证)。