Import AI 460: Reward Hacking na Sociedade, Dados de RSI da Anthropic, e Corrida de Quadcópteros com RL
O boletim Import AI mais recente cobre risco de reward hacking em sistemas de decisão orientados por IA, novos dados de lesão por esforço repetitivo (RSI) da Anthropic, e corrida de quadcópteros baseada em RL. A pesquisa de RSI oferece insights empíricos em fadiga física de sessões estendidas de codificação com IA.
O resumo destaca preocupações de pesquisa emergentes: sinais de recompensa desalinhados propagando-se através de sistemas aprendidos, implicações de segurança de colaboração humano-IA de longa duração, e aplicações RL corpórea no mundo real.