A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Policy Gradient SMDP for Resource Allocation and Routing in Integrated Services Networks SMDP de gradiente de política para alocação e roteamento de recursos em redes de serviços integrados

Ngo Anh VIEN, Nguyen Hoang VIET, SeungGwan LEE, TaeChoong CHUNG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Neste artigo, resolvemos o problema de controle de admissão de chamadas (CAC) e roteamento em uma rede integrada que lida com diversas classes de chamadas de diferentes valores e com diferentes requisitos de recursos. O problema de maximizar a recompensa (ou custo) médio das chamadas admitidas por unidade de tempo é naturalmente formulado como um problema de Processo de Decisão semi-Markov (SMDP), mas é muito complexo para permitir uma solução exata. Assim, neste artigo, um algoritmo de gradiente de política, juntamente com uma abordagem de decomposição, é proposto para encontrar o CAC ideal dinâmico (dependente do estado) e a política de roteamento entre um espaço de política parametrizado. Para implementar esse algoritmo de gradiente, aproximamos o gradiente da recompensa média. Em seguida, apresentamos um algoritmo baseado em simulação para estimar o gradiente aproximado da recompensa média (chamado algoritmo GSMDP), usando apenas um único caminho de amostra da cadeia de Markov subjacente para o SMDP do CAC e problema de roteamento. O algoritmo melhora o desempenho em termos de velocidade de convergência, probabilidade de rejeição, robustez às mudanças nas estatísticas de chegada e uma receita média geral recebida. As simulações experimentais irão comparar o desempenho do nosso método com outros métodos existentes e mostrar a robustez do nosso método.

Publicação
IEICE TRANSACTIONS on Communications Vol.E92-B No.6 pp.2008-2022
Data de publicação
2009/06/01
Publicitada
ISSN online
1745-1345
DOI
10.1587/transcom.E92.B.2008
Tipo de Manuscrito
PAPER
Categoria
Network

autores

Palavra-chave