Agent TARS использует сочетание передовых технологий компьютерного зрения и обработки естественного языка для понимания и манипуляции графическими интерфейсами пользователя. Захватывая визуальные представления веб-страниц, TARS может распознавать кнопки, формы, таблицы и другие элементы страницы. Пользователи взаимодействуют с TARS с помощью команд на естественном языке, указывая ему кликать, прокрутить, извлекать текст или заполнять формы на нескольких страницах. Он поддерживает настраиваемые рабочие процессы, объединяющие задачи — такие как вход в аккаунты, сбор данных и экспорт результатов в CSV или JSON. Поддержка в headless и headful режимах делает TARS подходящим для интерактивных исследований и автоматизированных задач без наблюдения, что делает его идеальным для тестирования, сбора данных и рутинных операций на основе браузера.
Browser Operator — это расширение Chrome с агентом AI, позволяющее автоматизировать браузерные задачи с помощью естественного языка, навигацию по сайтам, заполнение форм и извлечение данных.
Browser Operator превращает ваш браузер в агент на базе AI, который понимает команды на естественном языке. Подключив свой API-ключ OpenAI, он сможет переходить по URL, нажимать кнопки, заполнять формы, извлекать таблицы или списки, а также скачивать контент. Вы можете объединять несколько шагов в один рабочий поток, экспортировать результаты в CSV или JSON и даже планировать задачи. Все обработки происходят локально в вашем браузере, что обеспечивает быстрый отклик и безопасность данных. В программирование не требуется — просто скажите, что нужно, и Browser Operator сделает остальное.
Открытое расширение Chrome, позволяющее выполнять задачи автоматизации веб-сайтов на естественном языке с использованием многопоточных рабочих процессов и настраиваемых интеграций LLM.
NanoBrowser работает прямо в вашем браузере как расширение Chrome, позволяя автоматизировать повторяющиеся или сложные веб-задачи с помощью подсказок на естественном языке. Настраивается с помощью вашего собственного ключа API LLM — OpenAI GPT, самодельных моделей LLaMA или других — и определяет рабочие процессы, состоящие из нескольких агентов. Поддерживает сбор данных, взаимодействие с формами, автоматические исследования и связывание рабочих процессов через интеграцию с LangChain. Вы можете координировать агентов для совместной работы над подзадачами, экспортировать результаты в CSV или JSON, а также делать интерактивные отладку и уточнение шагов. В качестве альтернативы закрытым операторам NanoBrowser ориентирован на конфиденциальность, расширяемость и простоту использования.