A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Particle Filter Design Based on Reinforcement Learning and Its Application to Mobile Robot Localization Projeto de filtro de partículas baseado em aprendizado por reforço e sua aplicação à localização de robôs móveis

Ryota YOSHIMURA, Ichiro MARUTA, Kenji FUJIMOTO, Ken SATO, Yusuke KOBAYASHI

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Filtros de partículas têm sido amplamente utilizados para problemas de estimativa de estado em sistemas não lineares e não gaussianos. Seu desempenho depende do sistema fornecido e dos modelos de medição, que precisam ser projetados pelo usuário para cada sistema alvo. Este artigo propõe um novo método para projetar esses modelos para um filtro de partículas. Este é um método de otimização numérica, onde o processo de projeto do filtro de partículas é interpretado no âmbito da aprendizagem por reforço, atribuindo as aleatoriedades incluídas em ambos os modelos do filtro de partículas à política de aprendizagem por reforço. Neste método, a estimação pelo filtro de partículas é realizada repetidamente e os parâmetros que determinam ambos os modelos são atualizados gradativamente de acordo com os resultados da estimação. A vantagem é que ele pode otimizar diversas funções objetivo, como a precisão da estimativa do filtro de partículas, a variância das partículas, a probabilidade dos parâmetros e o termo de regularização dos parâmetros. Derivamos as condições para garantir que o cálculo de otimização converge com a probabilidade 1. Além disso, para mostrar que o método proposto pode ser aplicado a problemas de escala prática, projetamos o filtro de partículas para localização de robôs móveis, que é uma tecnologia essencial para navegação autônoma. Por simulações numéricas, demonstra-se que o método proposto melhora ainda mais a precisão da localização em comparação ao método convencional.

Publicação
IEICE TRANSACTIONS on Information Vol.E105-D No.5 pp.1010-1023
Data de publicação
2022/05/01
Publicitada
2022/01/28
ISSN online
1745-1361
DOI
10.1587/transinf.2021EDP7192
Tipo de Manuscrito
PAPER
Categoria
Inteligência Artificial, Mineração de Dados

autores

Ryota YOSHIMURA
  Kyoto University,Tokyo Metropolitan Industrial Technology Research Institute
Ichiro MARUTA
  Kyoto University
Kenji FUJIMOTO
  Kyoto University
Ken SATO
  Tokyo Metropolitan Industrial Technology Research Institute
Yusuke KOBAYASHI
  Tokyo Metropolitan Industrial Technology Research Institute

Palavra-chave