科技前沿信息在机器人群进行稳健的分布式决策

xhjyxxw

2024-07-17 帮助0人

知行礼动

大家好，今日小经来聊聊一篇关于科技前沿信息：在机器人群中进行稳健的分布式决策的文章，现在让我们往下看看吧！

以分布式方式实现最佳共享决策是许多多代理和群集机器人应用程序的关键方面。作为人类，我们经常必须得出关于世界现状的一些结论，以便我们能够做出明智的决定，然后以一种能够达到世界某种理想状态的方式行事。固然，期望每个人拥有关于当前世界状况的完美，最新的知识是不现实的，因此我们经常依赖他人的信念和经验来告知我们自己的信仰。

我们在自然界中也看到了这一点，蜜蜂必须在大量潜在的筑巢地点之间进行选择，以便选择最佳的筑巢地点。当当前的蜂巢变得太大时，大多数蜜蜂必须通过一个称为“群集”的过程选择一个新的站点来重新定位 - 这个问题可以推广到选择给定数量的选择中最好的。要做到这一点，蜜蜂依靠自己的经验和蜂巢中其他人的经验，以达成一个关于哪个是最佳网站的协议。我们可以从自然界中找到的解决方案中学习，开辟我们自己的模型并将其应用于成群的机器人。通过让成对的机器人在个人层面上进行交互并达成协议，我们可以在整个群体中分配决策过程。

诸如此类的分散算法通常被认为比其集中式对应物更强大，因为没有单点故障，但这很少进行测试。在大型机器人群中，鲁棒性至关重要，因为个别机器人通常采纳便宜可靠的硬件创造，以降低成本。在搜索和救援行动中可能对保护或保护生命至关重要的情景中，稳健性也很重要。在此背景下，我们的目标是为大型机器人群体中的分布式决策引入替代模型，并检查其对故障机器人存在的鲁棒性，并将其与现有模型进行比较：加权选民模型(Valentini等， 2014)。

在这项工作中，我们考虑加权选民模型的简化版本，其中机器人(特殊是千人机器人))在1.2平方公尺的竞技场中随机移动，并且在任何时间点都处于两种主要状态之一：信号发送或更新。那些处于信号状态的人正在发出信号，他们目前认为“选择A是最好的”或“选择B是最好的”，并且他们会继续这样做一段时间与选择的质量成正比，即在我们的实验中，选择A的质量为9，选择B的质量为7，因此那些认为选择A是最佳选择的人将比那些认为选择B最佳的人更长时间发出信号。这自然会在群体中产生偏差，其中选择A的信令将比选择B的信令更长时间，并且这将不可幸免地影响更新机器人。

我们将这个模型与我们的“三值模型”进行比较。机器人不是立即采纳信号机器人的信念，而是遵循以下规则：假设选择A的信念对应于1的真值状态，选择B的真值状态为0，那么我们引入1/2的第三个真值状态“未定”或“未知”作为中间状态。如果两个机器人在他们的信念中发生冲突，使得一个人认为选择A(1)是最好的而另一个选择B(0)那么更新机器人采纳1/2的新信念状态。如果一个机器人具有更强的信念，无论是在选择A(1)还是选择B(0)中，而另一个机器人未定(1/2)，则保留更强的信念。这种方法最终导致群体成功达成共识，哪个是最佳选择。此外，群体选择两种选择中的最佳选择，

然后我们继续调整我们的模型，以便一定比例的机器人浮现故障，这意味着它们采纳随机信号状态(1或0)而不是基于其他机器人更新其信念，然后继续发出随机选择的信号。我们在模拟和物理机器人成群的公斤机器上进行实验。

这篇好文章是转载于：知行礼动