Inteligência artificial do Google começa a 'sonhar' para aprender mais rápido
GUSTAVO SUMARES 18/11/2016 16H11 CIÊNCIAGOOGLEINTELIGÊNCIA ARTIFICIAL A empresa de inteligência artificial DeepMind, comprada pelo Google em 2014 por US$ 400 milhões, divulgou hoje um método que permite que sistemas "aprendam" sozinhos a realizar tarefas de maneira ainda mais rápida. A DeepMind chamou o sistema de UNREAL (sigla que significa "Unsupervised Reinforcement and Auxiliary Learning", algo como "aprendizagem não-supervisionada por reforço e auxílio"). Esse sistema foi utilizado para treinar uma inteligência artificial a jogar 53 jogos de ATARI, bem como navegar por 13 labirintos. Nos jogos de ATARI, a pontuação do computador foi cerca de nove vezes a média dos humanos; nos labirintos, a média foi de 87% a performance dos humanos, com resultados sobrehumanos em alguns deles. O vídeo abaixo mostra o UNREAL em ação: Tarefas auxiliares Para conseguir esse desempenho, o UNREAL apresenta duas tarefas auxiliares às inteligências artificiais. Esse processo seria semelhante a você pedir para um aluno prestar atenção a alguns aspectos diferentes da tarefa que ele vai realizar, a fim de facilitar o processo de aprendizagem. Mais detalhes sobre elas foram publicados pela equipe da DeepMind em um artigo científico no Arxiv (pdf). A primeira tarefa auxiliar envolve controlar os pixels da tela. Em outras palavras, a inteligência artificial avalia como os seus comandos afetam o que aparece na tela. De acordo com a DeepMind, "isso é semelhante à forma como um bebê pode aprender a controlar suas mãos movendo-as e observando o movimento". Essa tarefa ajuda o sistema a entender se está fazendo a coisa certa com base nas informações que aparecem na tela. A segunda tarefa auxiliar leva a máquina a tentar prever atitudes corretas com base no histórico recente. Os desenvolvedores escreveram à Bloomberg que trata-se de um processo semelhante a sonhos: "Animais sonham com eventos recompensadores positiva ou negativamente com maior frequência", disseram. Com base nesses "sonhos", a máquina consegue entender a melhor maneira de agir para receber as recompensas (uma pontuação alta, por exemplo). O GIF abaixo mostra como a máquina interpreta essas duas tarefas auxiliares enquanto navega por um labirinto:

Nenhum comentário:
Postar um comentário