Pesquisadores do MIT desenvolveram um algoritmo mais eficiente, Model Based Transfer Learning (MBTL), para treinar modelos de aprendizado por reforço para tarefas complexas com variabilidade, como controle de tráfego. O algoritmo MBTL seleciona estrategicamente subconjuntos de tarefas com maior probabilidade de melhorar o desempenho geral, aproveitando o aprendizado de transferência zero shot para aplicar modelos treinados a novas tarefas sem treinamento adicional. Essa abordagem reduz significativamente a quantidade de dados e computação necessária, tornando-a entre cinco a 50 vezes mais eficiente do que os métodos padrão testados em tarefas simuladas. A técnica promete melhorar a confiabilidade e o desempenho dos sistemas de tomada de decisão de IA, com aplicações potenciais em vários campos, incluindo sistemas de mobilidade de próxima geração. A pesquisa, apoiada por várias bolsas, visa estender o MBTL a problemas mais complexos e aplicações do mundo real.