Agent TARS использует сочетание передовых технологий компьютерного зрения и обработки естественного языка для понимания и манипуляции графическими интерфейсами пользователя. Захватывая визуальные представления веб-страниц, TARS может распознавать кнопки, формы, таблицы и другие элементы страницы. Пользователи взаимодействуют с TARS с помощью команд на естественном языке, указывая ему кликать, прокрутить, извлекать текст или заполнять формы на нескольких страницах. Он поддерживает настраиваемые рабочие процессы, объединяющие задачи — такие как вход в аккаунты, сбор данных и экспорт результатов в CSV или JSON. Поддержка в headless и headful режимах делает TARS подходящим для интерактивных исследований и автоматизированных задач без наблюдения, что делает его идеальным для тестирования, сбора данных и рутинных операций на основе браузера.
Cooper — это открытый исходный код помощника командной строки, который переводит подсказки на естественном языке в исполняемые команды shell. Построенный на моделях GPT от OpenAI, он управляет генерацией кода, манипуляциями файлами, операциями Git, интеграциями API и многим другим. Разработчики могут запрашивать задачи, такие как создание модулей-шаблонов, пакетное переименование файлов, развертывание скриптов или создание сообщений коммитов. Перед выполнением Cooper показывает предложенные команды для проверки и утверждения, обеспечивая полную прозрачность и безопасность. Архитектура его плагинов позволяет расширять функциональность с помощью пользовательских обработчиков, делая его адаптируемым для различных рабочих процессов и сред.