A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Reinforcement Learning for QoS-Constrained Autonomous Resource Allocation with H2H/M2M Co-Existence in Cellular Networks Aprendizado por reforço para alocação autônoma de recursos com restrição de QoS com coexistência H2H/M2M em redes celulares

Xing WEI, Xuehua LI, Shuo CHEN, Na LI

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

A comunicação máquina a máquina (M2M) desempenha um papel fundamental na evolução da Internet das Coisas (IoT). As redes celulares são consideradas um facilitador chave para comunicações M2M, que são originalmente projetadas principalmente para comunicações entre humanos (H2H). A introdução de usuários M2M causará uma série de problemas aos usuários H2H tradicionais, ou seja, interferência entre diversos tráfegos. A alocação de recursos é uma solução eficaz para esses problemas. Neste artigo, consideramos um bloco de recursos compartilhados (RB) e alocação de energia em um cenário de coexistência H2H/M2M, onde os usuários M2M são subdivididos em tipos tolerantes e sensíveis a atrasos. Primeiro modelamos o problema de alocação de energia RB como maximização da capacidade sob restrições de Qualidade de Serviço (QoS) de diferentes tipos de tráfego. Em seguida, é introduzida uma estrutura de aprendizagem, na qual um agente complexo é construído a partir de subagentes mais simples, o que fornece a base para o esquema de implantação distribuída. Além disso, propusemos um algoritmo de alocação de energia RB autônomo baseado em Q-learning distribuído (DQ-ARPA), que permite que os gateways de rede do tipo máquina (MTCG) como agentes aprendam o ambiente sem fio e escolham a potência RB de forma autônoma para maximizar os pares M2M. capacidade, garantindo ao mesmo tempo os requisitos de QoS de serviços críticos. Os resultados da simulação indicam que, com um projeto de recompensa apropriado, nosso esquema proposto consegue reduzir o impacto dos usuários do tipo máquina tolerante a atrasos em serviços críticos em termos de limites de SINR e taxas de interrupção.

Publicação
IEICE TRANSACTIONS on Communications Vol.E105-B No.11 pp.1332-1341
Data de publicação
2022/11/01
Publicitada
2022/05/27
ISSN online
1745-1345
DOI
10.1587/transcom.2021TMP0011
Tipo de Manuscrito
Special Section PAPER (Special Section on Towards Management for Future Communications and Services in Conjunction with Main Topics of APNOMS2021)
Categoria

autores

Xing WEI
  Beijing Information Science and Technology University
Xuehua LI
  Beijing Information Science and Technology University
Shuo CHEN
  Beijing Information Science and Technology University
Na LI
  the Baicells Technologies, Co., Ltd.

Palavra-chave