第14章 多机器人系统

ching

2019/09/02 发布于 教育 分类

文字内容
1. 机器人引论 第14章 多机器人系统
2. 第14章 多机器人系统 o o o o o 14.1 多机器人系统的概述 14.2 多机器人系统的体系结构 14.3 多机器人系统的协调控制 14.4 网络机器人 14.5 多机器人系统的应用
3. 14.1 多机器人系统的概述 o 典型的多机器人系统主要有以下几种: n 群智能机器人系统:由许多无差别的自治机器人组成的分 布式系统。它主要研究如何使能力有限的个体机器人通过 交互产生群体智能。 n 自重构机器人系统:以一些具有不同功能的标准模块为组 件,根据目标任务的需要,对这些模块进行相应的组合, 进而形成具有不同功能的系统。 n 协作机器人系统:由多个具有一定智能的自治机器人组成, 机器人之间通过通信实现相互间的协作以完成复杂的任务。 n 机器人足球赛:前述几类机器人系统中,机器人之间的关 系是合作的、互助的。而在机器人足球赛中,不同球队的 机器人之间的关系是对抗的、竞争的。同队的机器人之间 则是合作的、互助的。
4. o 多机器人系统的特点主要包括其空间分布、功能分布、 时间分布、信息分布和资源分布。利用多机器人系统的 目的主要是: n 利用多机器人系统的空间分布特性,通过各个机器人并行 工作以提高完成任务的效率。 n 利用多机器人系统内资源(信息、知识、物理装置等)的 共享来弥补个体能力的不足,扩大完成任务的能力范围。 n 利用系统内机器人资源的冗余性、各机器人功能的互补性 提高完成任务的可能性,增强系统的容错性、鲁棒性和灵 活性。 n 利用多机器人系统功能分布、资源分布的特点来降低单个 机器人系统的成本和系统设计的难度,减少执行危险任务 过程中机器人系统的损失。
5. o 多机器人系统中存在的问题包括: n 分布式的结构使多机器人系统在进行全局优化时存在一定 困难或无法找到最优解。 n 多机器人系统中各机器人之间由于资源的分配和使用不合 理可能发生冲突或死锁现象。 n 随着多机器人系统中机器人数量的增加,多个机器人之间 进行组织和相互协调协作的困难也随之以指数倍数增长。 n 多机器人系统中,功能、信息和资源的分布在增强机器人 系统灵活性、适应性的同时,也增加了机器人对可用功能、 信息、资源进行搜索和信息交换的时间。多机器人系统由 此而产生的通信问题为系统快速响应外界环境的变化造成 了一定的困难。
6. o 多机器人系统研究的主要内容包括: 群体体系结构: o 研究多机器人系统的群体体系结构是为了实现多个机器人相互间 的合作。 o 多机器人系统的群体体系结构可以分为集中式(centralized)和分散 式(decentralized)两种。 感知: o 机器人的感知包括感觉和理解两方面问题。 通信: o 通信是机器人之间进行交互和组织的基础。通过通信,多机器人 系统中各机器人了解其他机器人的意图、目标和动作以及当前环 境状态等信息,进而进行有效的磋商,协作完成任务。 o 一般来说,机器人之间的通信可以分成隐式通信和显式通信两类。
7. 学习: o 多机器人系统的学习可以根据其结构的不同有所区别。集中式 体系机构中,学习发生在主控单元上,其过程类似于个体机器 人的学习;在分散式体系结构中,所有机器人都参与到学习中, 它们可能会相互影响。多机器人系统通过学习可以获得较强的 适应性和灵活性等智能特性。 o 多机器人系统的学习按学习过程划分为:独立学习和交互学习。 o 多机器人系统的学习按反馈类型划分为:监督式学习、增强式 学习和无监督式学习。 o 多机器人系统作为一个群体进行学习时,依据不同的学习目的 其内部存在以下几种学习类型:机器人某种特定能力的学习; 对群体组合特性的学习;对任务模式的学习;对环境特性的学 习。
8. 协调协作机制: o 多机器人系统的协调协作机制与系统的群体体系结构、个体体 系机构、感知、通信和学习等方面的研究密切相关。 o 协调协作按主观意愿来划分,可以分为有意识协作和无意识协 作;按协作的类型来划分,可以分为合作型和竞争性。 o 多机器人系统的协调协作反映了在多机器人系统不同层次上对 系统控制与交互提出的不同要求。W.Rausch等提出多机器人系 统不同层次的协调协作:隐含协作关系,机器人按其自有的规 划模型考虑其它机器人规划的影响;异步协调关系,多个机器 人在同一环境下存在相互间干涉的条件下为完成各自目标而产 生协作;同步协作关系,多个机器人为完成一个共同目标而产 生的协作。
9. o 在多机器人系统的设计中,通常采用的是自顶向下的设计方 法。即将复杂的多机器人系统的功能和目标要求逐层分割分 解,逐步细化多机器人系统各功能模块,集成实现目标所必 需的控制算法和协作策略。 自顶向下设计方法的流程
10. 14.2 多机器人系统的体系结构 o 体系结构主要研究如何组织和控制机器人的硬件和软件系统 来实现机器人所需完成的功能。体系结构通常分为群体体系 结构和个体体系结构。群体体系结构为实现预定的行为如何 把个体联系到一起的形式。它表示个体之间所能存在的问题: 知识、信息、控制等方面长远的、静态的关系模式,并从全 局角度定义每个个体在系统整体行为的高级观点,从而有助 于引导局部控制实现协作,增强系统的全局一致性。多机器 人系统是由个体机器人组成的。作为个体机器人的核心部分, 机器人控制系统决定了多机器人系统中机器人的协作能力。 机器人个体体系结构将决定其适应环境的能力及其智能的复 杂程度。
11. o 多机器人系统的体系结构可以分为集中式(centralized) 结构和分 散式(decentralized)结构两种。分散式结构又可以进一步划分 为分层式(hierarchical)结构和分布式(destributed)结构。 a集中式结构 b分布式结构 几种多机器人系统体系结构示意图 c分层式结构
12. o 集中式结构通常由一个主控单元掌握全部环境及受控机器人的信息, 运用规划算法和优化算法。主控单元对任务进行分解和分配,向各 受控机器人发布命令,并组织多个受控机器人共同完成任务。集中 式结构的优点在于,理论背景清晰,实现起来较为直观,但存在以 下缺点: o (1) 容错性差 一个机器人的简单错误可能会造成整个系统的瘫痪。 o (2) 灵活性差 系统中机器人的个数增加或者减少时,原有的规划结 果无效,需重新进行规划。 o (3) 适应性差 由于在实际环境中所有信息对于主控单元并不完全已 知,所以主控单元在复杂多变的环境中无法保证各受控机器人快速 响应外界的变化,以做出适当的决策,因此该结构不适合动态、开 放的环境。 o 另外集中式结构还存在主控单元和其它机器人之间的通信瓶颈问题。
13. o 相对于集中式结构来说,尽管分散式结构很难或者无法全局目 标的优化,但是它以故障冗余、可靠性等诸多优点引起人们对 分散式结构的兴趣。分布式的结构中没有主控单元,各机器人 之间的关系是平等的,各机器人均能通过通信手段与其它机器 人进行信息交流,自主进行信息交流,自主进行决策。这种方 式具有灵活性和适应性强的优点。但是,要注意避免各个个体 片面强调“个性”,过分强调自己任务的重要性,而导致过多占 有资源的情况,使得任务完成效率低下。分层式与分布式的区 别在于前者存在局部集中,它是介于集中式和分布式之间的一 种混合结构。 o 下面介绍几种较为典型的多机器人系统的体系结构。
14. 14.2.1 分层式结构 o 面向多机器人协作系统(Multi-Robot Cooperative System, MRCS)为了满足自主性和协作性要求,多机器人体系分层式 结构设计成三层结构形式,分别为协作规划层(cooperation planning layer,CpPL)、协调规划层(coordination planning layer,CdPL)及行为控制层(behavior control layer,BCL)。
15. 分层式体系结构框图
16. 1 协作规划层 o 协作规划层是为了满足机器人的任务协作要求设计的。在MRCS 中,许多复杂的任务需要多个机器人协同完成,而协作层赋予机 器人协作能力、组织能力等。 o 协作层可以实现:1)任务的承接、分解和分配;2)机器人之间 的通信、协商等功能的管理。对于需要协作执行的任务,将任务 分解为若干子任务后,按某种协议与其它机器人磋商,制定联合 行动计划。若是决定独立执行,则将任务交给协调规划层处理。 o 协作规划层的各个模块:①协作通信模块(communication module of cooperation layer,CMCoL)负责机器人之间任务级的信息传递, 如任务的承接、发布等。 ②待规划的任务模块(task module of be panned,TMP)存放来自用户或其它机器人的招标任务。 ③待 发布任务模块(task module of be announced,TMA)存放任务分解 后需其它机器人协作执行的任务。
17. ④组织知识库(organization knowledge base,OKB)组织模块中存放社会 规则、谈判策略以及组织结构重组等方面的知识。⑤领域知识库(domain knowledge base,DKB)领域问题求解知识,包括规划任务的规则、前提 数据等。⑥协作规划器(cooperation planner,CpP) 协作规划器是协作规 划层的核心,协作规 划器根据领域知识将 承接的任务分解(若 不需分解则将任务交 给协调层处理)。基 于确定的协商策略和 协商协议以协商方式 实现机器人之间任务 的动态分配,协调机 器人之间的合作,建 立机器人之间的协作 关系。 协作规划层结构框图
18. 2 协调规划层 协调规划层是为了解决机 器人之间协作关系确定下 来以后具体的运动控制问 题,协作层确定了机器人 的任务/子任务后,机器人 根据当前目标(任务)、 自身状态、以往经验、传 感信息等来规划自身行为。 另外,它在动作执行的过 程中负责检查冲突和采取 有效的措施消解冲突。对 于协调层中无法处理的问 题,则返回协作规划层, 由协作规划层重新规划。 协调规划层结构框图
19. 主要模块包括如下:①协调通信模块(communication module of coordination layer,CMCdL) 负责机器人之间运动规划信息的传递。 ②建模模块(modeling module,MM) 根据传感器信息和通信信息对 外部环境进行建模,目的是为了对其它机器人的运动状态做出预测,作 为自己动作的参考。其中建模模型包括世界模型和其它机器人的状态模 型。 ③冲突检测模块(conflict inspecting module, CIM) 随着时间的 推移及外部环境的变化,原来的计划在执行过程中可能会产生冲突。冲 突检测模块则检测冲突的发生、判断冲突发生的类型以及推测冲突发生 的原因等。 ④冲突识别库(conflict type base, CTB) 存放各种冲突类 型,如目标冲突、资源冲突等。⑤冲突消解模块(conflict reconciling module ,CRM) 根据冲突类型提供相应的冲突消解策略。⑥消解策略 库(conflict reconciling strategy base ,CRCS) 存放冲突消解策略。 ⑦协调规划器(coordination planner , CdP) 是协调层的核心,它负责 机器人运动协调的局部规划。根据任务(目标)、自身状态及外部环境 信息,规划自身的行为,产生近期的运动序列,并负责与机器人规划层 之间的协商,实现机器人之间冲突的消解。
20. 3 行为控制层 o 行为控制层的设计有两个目的:一是为了使机器人对紧急情况或 简单任务迅速做出反应(如避障),它直接由传感信息映射到某种行 为,基本上不作推理或根据简单规则直接推理;二是执行协调规 划层产生的运动控制命令,产生相应的动作。 o 通过反应产生的运动具有最高的优先级,动作模块立即执行,而 将从协调规划层送来的动作中断。如果发生中断,则协调规划模 块将决定是否重新进行规划。 f:(*)表示从传感信息到 运动控制的映射关系, 可以由神经网络、分类 器、规则推理等实现。 行为控制层结构框图
21. 14.2.2 基于行为的混合分层式结构 基于行为的机器人混合分层式体系结构
22. o 行为模块层由多个行为模块组成。行为管理层的主要功能是根据机器 人当前任务、状态、周围环境及合作要求,对机器人的行为进行调整。 o 行为模式指的是机器人控制系统对所获信息的反应模式。行为模式决 定了控制系统在收到信息后,将做出何种行为决策。对行为模式的调 整包括改变行为模块激活状态、改变行为算法的参数、改变行为综合 方式和参数等。通过这种在线调整,可提高机器人的适应性,同时为 机器人之间协作的顺利进行提供一定的保证。行为综合层处于结构的 最下层,其目的是对各个激活的行为模块的输出做出综合决策,控制 机器人最终的运动。 行为管理层概念框图
23. 14.2.3 任务级协作式结构 1 任务级协作 o 集中式任务分配 o 分布式任务分配 n 熟人网分配 n 合同网分配 o 将熟人网和合同网结合在一起可以形成一种更加灵活的多机 器人系统任务分配机制。一般来说,熟人/合同网任务分配 机制比较适合小型的多机器人系统。为了使这两种机制能够 适应于大型机器人群体系统,系统应该具有一定的组织形式, 创建一种分层式组织形式可分三步进行:
24. n (1) 对于一个多机器人系统,根据机器人所具有的技能等 因素将其分解为数目相当的若干小组,同时各个小组选 出自己的管理者作为系统的最底层的管理成员,并且各 个小组管理者建立自己的熟人表; n (2) 对各小组管理者继续分组,选出各个新组的管理者作 为上一层成员并建立下属表(一种简单的熟人表,只包 含下属机器人的名称); n (3) 循环执行步骤2,直到该层所有机器人个数n满足 1<n≤Gmax,式中Gmax为形成一个小组所需要的最大机器人 个数。创建系统最高管理者,并建立下属表。 o 当某些机器人加入、离开系统以及接受了一定任务或完成任 务后返回系统时,系统局部做出一些改变,必要时系统进行 重组,实现了对机器人群体的有机管理和控制。
25. 2 具体设计 o 控制体系结构包括系统 监控层、协作规划层和 行为控制层三个层次。 通信是协作的机器人之 间交互的基本手段,机 器人之间相互交换的信 息包括任务、有关的内 部状态和一些运动数据 等。 多移动机器人系统框架结构
26. 系统监控层(system-monitoring,SML) o 当系统发生不可预见的情况使得协作规划层和行为控制层都无法 解决时,由系统监控层通知操作人员处理这些异常、冲突和死锁, 如改变任务的执行状态和机器人运动的方向。另外,操作人员可 以通过系统监控层直接对任务或者运动规划进行干预。 协作规划层(coorperation planning layer,CpPL) o 协作规划层的主要功能是建立机器人之间的分层式组织关系,根 据任务的要求创建和组织合适的机器人群体,解决多机器人之间 的任务级协作问题。它还承担处理一些异常、无法解决的冲突和 死锁,同时作为系统监控层和行为控制层信息传递的媒介。
27. 协作规划层结构框图
28. 行为控制层 采用基于行为的方 法,根据当前的任 务状态,综合感知 模块检测到的环境 信息,通过通信获 得的相关信息及来 自上层的有关命令, 结合对工作环境的 了解进行决策,为 机器人规划出具体 的运动方向和运动 速度,实现具体的 运动控制。 行为控制层结构框图
29. 14.2.4 并行处理 混合式结构 基于多DSP并行处 理的混合式体系结 构利用DSP高速的 数字信号处理能力 来提高机器人的响 应速度,有助于提 高机器人运动的平 稳性。基于这种体 系结构设计制造的 轮式移动机器人 CASIA-I。 CASIA-I体系结构
30. 14.3 多机器人系统的协调控制 14.3.1 协调控制策略 1 多机器人协调合作的主要研究方法 o 协商和反应式方法 o 分布式人工智能方法 o 学习与进化方法
31. 2 多机器人协调合作的一些知名模型 o 最著名的就是Bratman 等人提出的BDI ( Belief –Desire –Intention) 模型。Cohen和Levesque又将“承诺( Commitment )”和“公约 (Convention )”的概念补充进来,后又经Jennings, Wooldridge等 人的进一步发展,形成了一套目前最为系统和成熟的多智能体 协调理论框架—联合意图理论。 n 基本要点是:多个智能体在完成一个共同任务时会形成一个共同 承诺,如果不出现“任务已完成”、“任务无法完成”和“任务不必 完成”三种情况之一,智能体就应该遵守公约,即坚持承诺,直 到成功完成共同任务;否则,智能体就会设法通知正在合作执行 共同任务的其它智能体,自己将要退出承诺。这样,其它智能体 就能够适时做出调整。 n 该理论只是侧重于智能体在完成任务时的一致性参与及坚持承诺 上面,没有提出具体分工上的协作,所以该理论只是提出了一个 框架,针对不同的问题还应该有相关的领域问题需要解决。
32. o V1OSZ等提出了共享计划理论,它是建立在一种联合精神状态 之上的,其中最重要的概念就是它引入的概念算子:“打算”( Intention that)和“打算做”( Intention to ),它们通过一系列原子 操作符定义,引导智能体采取包括通信在内的行动来使得个体 、子团体和整个合作团体能够协调一致的执行所赋予的任务。 o 对策论(Game Theory)的研究始于上个世纪四十年代,多智能体 系统中对基于对策论的协商模型也展开了广泛的研究。最早提 出基于对策论协商模型的是Rosenschein,他首先应用对策论来 分析MAS的协商过程。 o Shoham等人提出为智能体制定一套社会规则(Social Laws ),要 求每个主体都必须遵守,而且相信别的主体也会遵守。利用社 会规则可以大量减少求解问题时的搜索空间,降低控制的复杂 度,而且减少了智能体间的交互,但同时也会伴随着一些合理 解的丢失。
33. o 合同网模型是针对资源不足的多智能体动态环境的情况,采 用了任务分解、任务分配、任务监督和任务评价等要素构成 的一种协商策略。合同网模型源于1980年Smith提出的合同 网协议,合同网包括三个节点:管理者、投标者和合同者。 o 基于行为主义的多智能体系统的协调机制是以Brooks的基于 行为的系统分析与设计方法为基础的。行为主义者认为智能 体只需具有最基本的动作行为,智能体的智慧表现来源于对 外界环境和变化的及时反应。这种协调机制也在许多方面得 到了成功的应用,典型的应用就是多机器人的编队。
34. 14.3.2 协调控制平台 o 针对协调控制问题,人们开发了多种协调控制平台。这些平 台主要有两类。一类是针对集中式协调控制策略,另一类是 针对分布式协调控制策略。随着网络技术的发展,基于网络 的协调控制平台得到了很大的发展。人们希望通过网络实现 多机器人的协调行为,并且融合不同机器人的智能,基于对 多机器人系统建立的模型和网络平台实现多机器人系统的智 能协调行为。 o 例如,本书作者之一的研究小组开发了一种基于知识模型的 智能协调网络平台K-ICNP (Knowledge Model-Based Intelligent Coordinative Network Platform)。该平台采用Java编程语言进 行开发。基于这一网络平台并采用知识模型的方法,可以有 效地实现了多机器人系统的智能协调控制。
35. 14.3.3 协调控制中的学习 o 多机器人协调系统是一个极其复杂非线性动态系统,不可能 具有完备的先验知识,而必须依赖其自学习和自适应能力。 通过自学习和再励学习建模,动态调整控制参数来优化系统 性能适应环境变化。有不少文献对多机器人协调系统的自学 习和再励学习作了研究,并提出了一些学习算法。大致可分 为四类:个体再励学习、群体再励学习、基于遗传算法的学 习算法和基于模糊神经元的学习算法。 o 多机器人学习方法中还包括行为控制参数的学习、增强式学 习和学习分类器系统。行为控制参数的学习又有基于遗传算 法的行为控制参数学习和基于案例的空间时间推理的行为参 数学习。
36. 14.4 网络机器人 14.4.1 网络机器人的组成与特点 o 把标准通信协议和标准人-机接口作为基本设施, 再将它们与 有实际观测操作技术的机器人融合在一起,即可实现无论何 时何地,无论是谁都能使用的远程环境观测操作系统,这就 是网络机器人。 o 基于Web服务器的网络机器人技术以Internet为构架, 将机器 人与Internet连接起来, 采用客户端/服务器(C/S) 模式, 允许用 户在远程终端上访问服务器, 把高层控制命令通过服务器传 送给机器人控制器, 同时机器人的图像采集设备把机器人运 动的实时图像再通过网络服务器反馈给远端用户, 从而达到 间接控制机器人的目的, 实现对机器人的远程监视和控制。
37. 1 网络机器人的 硬件结构 网络机器人硬件结构图
38. 2 网络机器人的软件结构 o 自主机器人 基于网络的自主机器人软件结构
39. o 网络服务器 网络服务器的软件结构
40. o 客户 客户的软件结构
41. 3 网络机器人的特点 o (1) 基于网络的机器人技术涵盖了现代网络技术和机器人控制 技术两方面的内容, 并且将两者有机地结合起来; o (2) 基于网络的机器人建立在Internet的基础上, 相应地具有 Internet特有的一些功能, 拥有良好的人机界面,可以实现人 机交互功能; o (3) 基于网络的机器人以HTTP作为控制系统的标准通信协议, 其系统控制软件具有良好的可移植性和互用性,可以使用一 个服务器供不特定的多个用户在网络上任意使用; o (4) 由于网络的存在,网络机器人技术使得机器人系统中必需 的多数控制软件可以分散配置,机器人的软件开发也可以分 散进行,更容易实现。
42. 14.4.2 网络机器人的控制 网络机器人远程实时控制框架
43. o 最上层为智能与人机交互层,用于进行人机交互、任务规划、 与CAD系统的联接以及视觉、语音等信号的处理。该层形成了 机器人运动所需的空间直线、圆弧的特征参数,其中空间直线 只需要起点和终点的位姿参数,空间圆弧只需要起点、终点和 一个中间点的位姿参数。 o 其次是运动规划层,根据空间直线、圆弧的特征参数,进行在 线运动规划、逆运动学求解、选出控制解等,形成各关节电机 的位置。 o 下一层为运动控制层,给定从运动规划层接收到的关节电机位 置,反馈测量到的关节电机的实际位置,通过插值和D/A转换 形成模拟量的速度信号。该层实现位置闭环控制。 o 最下层为伺服控制层,给定运动控制层的速度信号,反馈以测 量到的关节电机的实际速度,由伺服控制与放大器实现速度伺 服控制。
44. 14.4.3 网络机器人的应用 o 虽然网络和机器人的结合才刚刚开始, 但网络机器人 技术在工业、空间、海洋、战场等远程控制方面, 以 及远程教学等领域有着广泛的应用前景。 o o o o 远程制造 遥操作 娱乐领域 远程健康监控
45. 10.5 多机器人系统的应用 14.5.1 机器人足球 o 机器人足球比赛已经成为当前人工智能和机器人领域的 研究热点之一,其目的是通过提供一个标准的、易于评 价的比赛平台,促进多智能体系统、分布式人工智能及 机器人学等领域的研究与发展。机器人足球比赛要解决 分散存在的多智能体在复杂动态环境下,通过相互通信 和协调,以实时方式进行的知识处理问题。 o 目前,举办全自主机器人足球比赛的国际组织有两个: RoboCup联合会和FIRA组织。
46. 1 足球机器人控制系统的体系结构 单机器人系统的体系结构 o 在中型组比赛中,单个机器人的控制系统广泛采用混合式的体 系结构,控制系统的上层采用规划技术,底层采用基于行为的 反应是控制技术,这样既保证了系统的鲁棒性和快速性,又使 系统具有较高的决策智能。 单机器人系统的体系结构
47. 多机器人系统的体系结构 o 各队普遍采用基于无线局域网(遵守IEEE802. 11标准)的通信 技术。每个机器人和场外计算机作为网络的节点,共同构成 一个无线局域网络系统。 本文将球队的 体系结构分为 两种:集中与 分布式结合的 混合型结构和 完全分布式的 结构。 机器人系统的体系结构(完全分布式的结构)
48. o 多机器人的协作是指多个机器人通过协调各自的行为,合作 完成共同目标。机器人的协作策略在很大程度上决定了一支 球队的强弱,也是机器人智能的一个集中体现。 2 足球机器人目前存在的难题 o (1) 如何充分利用多个机器人的传感器信息以获得对环境相 对完整的感知; o (2) 如何设计协作策略以提高机器人球队的整体性能; o (3) 如何通过学习技术来获得或发展单机器人的控球技巧甚 至多个机器人的配合策略,并应用于真实的机器人系统。
49. 14.5.2 多移动机器人协作围捕 o Yamaguchi提出一种包含反馈控制和反应式控制的混合框架系 统,将反馈控制律用于协调多个移动机器人的运动,采用队形 矢量控制群体队形。韩学东等提出一种快速收敛的机器人部 队包围“入侵者”的队形分布式控制算法。Denzinger等利用最 邻近规则(nearest-neighbor rule)对当前状态进行分类,对每一 个状态用遗传算法搜索为实现围捕智能体应当采取的最优动 作。Osawa提出metalevel协调策略,协作抓捕智能体实现围 捕。 o 作者提出一种在连续未知环境中实现围捕任务的整体方案。 用强化学习实现机器人的包围行为,通过和其它行为的综合 实现多个机器人围捕共同目标实现围捕任务的整体方案。
50. 围捕流程图
51. 14.5.3 多机器人协作装配 o 基于多智能体概念实现的多机器人协作装配系统——MRCAS (Multi-Robot Cooperative Assmbly system )由组织级计算机、 三台工业机器人和一台全方位移动小车(ODV )组成,采用分 层递阶体系结构。 MRCAS系统体系结构