MIT revela o framework EnCompass para otimização de agentes de IA
O MIT CSAIL apresenta o framework EnCompass, que permite que agentes de IA retrocedam e otimizem as saídas de LLM, alcançando um aumento de precisão de 15–40% com 82% menos código.
O MIT CSAIL apresenta o framework EnCompass, que permite que agentes de IA retrocedam e otimizem as saídas de LLM, alcançando um aumento de precisão de 15–40% com 82% menos código.
O método Discovery Learning possibilita a previsão rápida da vida útil da bateria em uma semana, em vez dos tradicionais ciclos de teste que duram meses.
Em um desenvolvimento surpreendente, matemáticos amadores estão aproveitando chatbots de IA para resolver problemas matemáticos complexos e antigos propostos pelo lendário Paul Erdős, sinalizando um salto significativo nas capacidades de raciocínio da IA.
Pesquisadores do MIT mostram que os modelos de aprendizado de máquina com melhor desempenho podem tornar-se os piores quando aplicados a novos ambientes de dados, revelando riscos ocultos decorrentes de correlações espúrias na IA médica e em outras aplicações críticas.
Um novo benchmark chamado APEX-Agents mostra que mesmo modelos de IA de ponta como GPT-5.2 e Gemini 3 Flash falham na maioria das tarefas complexas e multidomínio provenientes de áreas profissionais como direito e finanças, levantando dúvidas sobre sua prontidão imediata para o ambiente de trabalho.
Pesquisa do Center for Countering Digital Hate (CCDH) estima que a Grok AI de Elon Musk foi usada para criar aproximadamente 3 milhões de imagens sexualizadas, incluindo milhares retratando crianças, ao longo de um período de 11 dias, levantando sérias preocupações de segurança.
Pesquisadores da OpenAI, Anthropic e Google DeepMind contornaram 12 defesas de IA publicadas com taxas superiores a 90%, expondo lacunas críticas de segurança em sistemas de produção.