Identificar áreas em robótica onde o Aprendizado por Reforço pode ser aplicado.
Enquadrar problemas em robótica como problemas de Aprendizagem por Reforço.
Aplicando o algoritmo Multi-Armed Bandit para ajudar os robôs a aprender automaticamente os comportamentos esperados.
Desenvolvendo funções de recompensa para Aprendizagem por Reforço em contextos robóticos.
Usando Python para controlar sensores e atuadores em robôs EV3 Mindstorms.
Programação de robôs simples que podem aprender automaticamente as melhores ações a serem executadas em seus ambientes.
Compreendendo o algoritmo do bandido multi-armado.
Equilibrar exploração e exploração usando várias estratégias.
Professor : Adminstrador
Aulas : 1 Aulas
Categoria : Módulo - Hardware
Certificado : 40 Horas
Ano : 2023
Alunos :

Disponibilização Imediata
Sem custo de mensalidade
Certificado Profissionalizante
Suporte com Professor
Acesso Vitalício
Conteúdo Atualizado
Download Vídeos e Arquivos
Estude a Hora que quiser
Estude de onde estiver
Projetos Práticos
Técnologias Utilizadas no Curso (Windows 11, Maquina Virtual)

Comentário dos Alunos

Este curso ainda não possui avaliações!







Veja Mais