A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Reinforcement Learning for Multi-Agent Systems with Temporal Logic Specifications Aprendizado por reforço para sistemas multiagentes com especificações de lógica temporal

Keita TERASHIMA, Koichi KOBAYASHI, Yuh YAMASHITA

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Num sistema multiagente, é importante considerar um método de desenho de ações cooperativas para atingir um objetivo comum. Neste artigo, propomos dois novos métodos de aprendizagem por reforço multiagente, onde a especificação do controle é descrita por fórmulas lógicas temporais lineares, que representam um objetivo comum. Primeiro, propomos um método de solução simples, que é diretamente estendido do caso de agente único. Neste método, existem alguns problemas técnicos causados ​​pelo aumento do número de agentes. A seguir, para superar essas questões técnicas, propomos um novo método no qual um agregador é introduzido. Finalmente, estes dois métodos são comparados por simulações numéricas, tendo como exemplo um problema de vigilância.

Publicação
IEICE TRANSACTIONS on Fundamentals Vol.E107-A No.1 pp.31-37
Data de publicação
2024/01/01
Publicitada
2023/07/19
ISSN online
1745-1337
DOI
10.1587/transfun.2023KEP0016
Tipo de Manuscrito
Special Section PAPER (Special Section on Circuits and Systems)
Categoria

autores

Keita TERASHIMA
  Hokkaido University
Koichi KOBAYASHI
  Hokkaido University
Yuh YAMASHITA
  Hokkaido University

Palavra-chave