Ferramentas custom benchmarks para todas as ocasiões

Obtenha soluções custom benchmarks flexíveis que atendem a diversas demandas com eficiência.

custom benchmarks

  • SeeAct é uma estrutura de código aberto que utiliza planejamento baseado em LLM e percepção visual para permitir agentes de IA interativos.
    0
    0
    O que é SeeAct?
    SeeAct foi projetado para capacitar agentes de visão-linguagem com um pipeline de duas etapas: um módulo de planejamento alimentado por grandes modelos de linguagem que gera subobjetivos com base em cenas observadas, e um módulo de execução que traduz subobjetivos em ações específicas do ambiente. Uma espinha dorsal de percepção extrai características de objetos e cenas de imagens ou simulações. A arquitetura modular permite substituição fácil de planejadores ou redes de percepção, e suporta avaliação em AI2-THOR, Habitat e ambientes personalizados. SeeAct acelera a pesquisa em IA interativa incorporada, fornecendo decomposição de tarefas de ponta a ponta, fundamentação e execução.
Em Destaque