Descargitas

来自中国的最新突发新闻。

Gridworld:工程有助于发现人工智能的风险

Gridworld:工程有助于发现人工智能的风险

时空是一个将空间的三个维度(长、宽、宽)与时间的第四个维度融为一体的概念模型。 这样就创建了 4D 几何对象。 研究人员最近使用类似的思维来研究人工智能环境,从而从工程角度对人工智能问题进行了独特的重构。

冲绳科学技术学院 (OIST) 博士毕业生、访问学者 Thomas Burns 博士和西交大学利物浦分校数学家、OIST 前博士后研究员 Robert Tang 博士想要研究人工智能系统从工程角度更准确地表示其属性。更准确。 他们确定,“几何缺陷”的发生,即格罗莫夫所谓的相关状态的失败,与移动的人工智能体之间可能发生碰撞的位置完全相关。 他们的研究结果发表在杂志上 机器学习研究汇刊

使用网络世界对现实世界场景进行建模

网格世界由排列在网格中的方形单元组成,其中单元可能被也可能不被单个代理(例如考拉)或物体(例如沙滩球)占据(如下面的视频所示)。 网络世界中的代理可以通过编程来解决难题并追求奖励。 它们可能在网格中的相邻方块之间移动,研究人员经常研究它们在执行特定目标(例如到达网格世界中的特定位置)时的移动、计划和策略。

Gridworlds 长期以来一直用于人工智能研究,特别是强化学习,它已被用来击败国际象棋和围棋等视频和棋盘游戏的世界冠军。 它们为潜在的现实应用提供简单但可扩展的模型,例如自动车辆移动或仓库机器人的安全协调。

从网格世界中的选定状态开始 – 代理和对象的特定排列 – 允许两种操作:移动 – 允许代理移动到相邻的空单元格,以及推/拉 – 允许代理沿直线推或拉物体的代理。

当这个过程重复足够多次时,就可以创建一个“状态复合体”。 状态复合体将系统的所有可能配置表示为单个几何体,这意味着我们可以使用几何学(涉及事物的确切形状)、拓扑学(在变形下保留的空间属性,例如弯曲、拉伸、和承包),以及组合学(事物的计数和排列)。 研究人员结合使用纸笔数学和定制计算机程序来创建和分析本研究中创建的案例复合体。

3×3 网格世界的状态收集器(左),具有一个代理和一个对象(右)。 状态复合体中的暗峰代表右侧网络世界中显示的状态。 状态复合体中的边缘根据其生成器进行着色 – 橙色表示推/拉,紫红色表示移动。 状态复合体的每个“花瓣”都是将球移动一圈的智能体/考拉。

“这就像一个古老的街机游戏,但你可以添加各种各样的东西,比如门、按钮和敌人,然后考虑任何这些更复杂场景的几何和拓扑,”伯恩斯博士解释道。 “你可以直观地把国家综合体想象成一个由立方体、正方形和木棍粘在一起的物理乐高积木,每个都代表了网络世界的特定重新配置。”

碰撞前一刻

当两个智能体彼此靠得太近时,他们很可能会撞到对方。 事实证明,这种潜在的崩溃表明存在工程缺陷,每次在网络世界中发生这种情况时,都可能会发生碰撞。

有趣的是,数学家的主要目的是证明这样的物体不包含任何几何缺陷。 这是因为这些缺陷的缺失赋予了物体理想的数学特性。 如果出现一个工程缺陷,整个国家综合体就会失去这些好处。

“起初我们想证明不存在工程缺陷,但后来我们发现了很多这些小烦恼,我们认为它们也许并不那么烦人,也许它们与一些重要的事情有关。事实证明是的伯恩斯博士强调说:“它们是——它们与一些重要的事情有关。”基本的安全问题。

科学家们还证明,在国际象棋游戏中,当两个智能体被马的走法或象的走法分开两步时,这些几何缺陷就会出现。 “这些是发生这些缺陷的唯一情况。例如,在现实世界中,机器人可能在仓库中相互碰撞,或者自动驾驶汽车可能在十字路口发生碰撞。这不是碰撞点,而是碰撞点。”碰撞前一刻。” “碰撞才是最重要的。”

这两个案例导致格罗莫夫的关联条件在多智能体网络世界中失败

导致格罗莫夫关联条件在多智能体网络世界中失败的两种情况:马的走法(左)和象的两步走法(右)。 栗色箭头表示允许的动作,蓝色方块表示允许的“舞蹈”——网格世界中的舞蹈由 4 个单元格上的四个动作组成。 一位顾客可以打断对方的舞蹈(左),或者两支舞蹈可以在对角线上发生碰撞(右)。

人工智能的实际应用

一般来说,工程缺陷和工程方法可以帮助提高我们对当前人工智能系统的理解。 例如,研究人员可以使用经过训练的人工智能系统来避免物体之间的碰撞,并尝试检测这些几何缺陷的位置。 这可能有助于科学家更有效地检测人工智能系统中潜在的碰撞,例如人类和机器人频繁互动的辅助生活场景。

“这些结果提供了一种在具有多个代理的人工智能环境中寻找有保障的安全约束的新方法——它们不一定是考拉,它们可以是帮助做家务、探索灾区的机器人,或者是提供送货服务的自动驾驶汽车”。 伯恩斯博士指出。

/一般发布。 来自原始组织/作者的这些材料本质上可能是按时间顺序排列的,并且为了清晰度、风格和长度而进行了编辑。 Mirage.News 不采取公司立场或政党立场,本文表达的所有意见、立场和结论仅代表作者的观点。在此查看全文。