nova-act-mcp

0
0 Reseñas
9 Stars
nova-act-mcp conecta el SDK de Amazon Nova Act con MCP, permitiendo a los agentes de IA controlar navegadores, realizar automatizaciones complejas y visualizar el razonamiento paso a paso.
Añadido el:
Creado por:
Apr 23 2025
nova-act-mcp

nova-act-mcp

0 Reseñas
9
0
nova-act-mcp
nova-act-mcp conecta el SDK de Amazon Nova Act con MCP, permitiendo a los agentes de IA controlar navegadores, realizar automatizaciones complejas y visualizar el razonamiento paso a paso.
Añadido el:
Created by:
Apr 23 2025
Jacob Taunton
Destacados

¿Qué es nova-act-mcp?

nova-act-mcp es un servidor MCP que facilita la interacción entre el SDK de automatización de navegador de Amazon Nova Act y los clientes MCP. Soporta flujos de trabajo de navegador en varios pasos, permitiendo a asistentes de IA como Claude automatizar tareas web como navegación, manejo de formularios y extracción de datos. El sistema mantiene perfiles de navegador para la persistencia de cookies y almacenamiento local, asegurando la continuidad de la sesión a través de acciones. Ofrece transparencia en el razonamiento del agente, permitiendo a los usuarios ver el proceso de toma de decisiones, lo que facilita la depuración y mejora la comprensión. Diseñado para una integración fluida con clientes compatibles con MCP, proporciona un entorno poderoso, seguro y flexible para la automatización avanzada de la web a través de instrucciones en lenguaje natural.

¿Quién usará nova-act-mcp?

  • Desarrolladores de IA
  • Ingenieros de automatización
  • Usuarios de clientes MCP
  • Entusiastas de la automatización de navegadores
  • Investigadores en IA y automatización

¿Cómo usar nova-act-mcp?

  • Paso 1: Clona el repositorio desde GitHub.
  • Paso 2: Instala las dependencias usando pip o uv.
  • Paso 3: Obtén una clave API de Amazon Nova Act desde la plataforma Nova.
  • Paso 4: Configura tu cliente MCP (por ejemplo, Claude Desktop) con la URL del servidor y la clave API.
  • Paso 5: Inicia el servidor nova-act-mcp.
  • Paso 6: Usa tu cliente MCP para enviar instrucciones de control de navegador o tareas de automatización.
  • Paso 7: Observa el razonamiento del agente y las interacciones del navegador, y termina las sesiones cuando hayas finalizado.

Características y Beneficios Clave de nova-act-mcp

Las características principales
  • Controlar navegadores web a través del SDK de Amazon Nova Act
  • Ejecutar flujos de trabajo de automatización en varios pasos
  • Persistir cookies y almacenamiento local para la continuidad de la sesión
  • Visualizar el proceso de razonamiento del agente
  • Manejo seguro de inicio de sesión
  • Operación de navegador sin cabeza o visible
Los beneficios
  • Permite la automatización web compleja impulsada por IA
  • Proporciona transparencia en la toma de decisiones del agente
  • Apoya la gestión segura de credenciales
  • Mantiene el estado de la sesión a través de múltiples pasos
  • Integración flexible con varios clientes MCP

Principales Casos de Uso y Aplicaciones de nova-act-mcp

  • Automatización de tareas web repetitivas como el llenado de formularios
  • Extracción de datos web y recuperación de contenido estructurado
  • Inicio de sesión seguro y persistencia de sesiones para aplicaciones web
  • Observación de interacciones del navegador en tiempo real para depuración
  • Flujos de navegación impulsados por IA en investigación y pruebas

FAQs sobre nova-act-mcp

Desarrollador

  • madtank

También te puede gustar:

Herramientas de desarrollo

Una aplicación de escritorio para gestionar interacciones entre servidor y cliente con funcionalidades completas.
Un servidor Model Context Protocol para Eagle que gestiona el intercambio de datos entre la aplicación Eagle y las fuentes de datos.
Un cliente basado en chat que integra y utiliza varias herramientas MCP directamente dentro de un entorno de chat para aumentar la productividad.
Una imagen de Docker que alberga múltiples servidores MCP accesibles a través de un punto de entrada unificado con integración de supergateway.
Proporciona acceso a los saldos de cuentas de YNAB, transacciones y creación de transacciones a través del protocolo MCP.
Un servidor MCP rápido y escalable para gestionar operaciones de trading en tiempo real para múltiples clientes en Zerodha.
Un cliente SSH remoto que facilita el acceso seguro basado en proxy a los servidores MCP para la utilización de herramientas remotas.
Un servidor MCP basado en Spring que integra capacidades de IA para gestionar y procesar protocolos de comunicación de mods de Minecraft.
Un cliente MCP minimalista con funciones de chat esenciales, que admite múltiples modelos e interacciones contextuales.
Un servidor MCP seguro que permite a los agentes de IA interactuar con la aplicación Authenticator para obtener códigos 2FA y contraseñas.

Investigación y datos

Una implementación de servidor que admite el Protocolo de Contexto del Modelo, integrando las capacidades de IA industrial de CRIC.
Proporciona datos en tiempo real sobre el tráfico, la calidad del aire, el clima y los datos de bicicletas compartidas para la ciudad de Valencia en una plataforma unificada.
Una aplicación de React que demuestra la integración con Supabase a través de herramientas MCP y Tambo para el registro de componentes de UI.
Un cliente MCP que integra la API de Brave Search para búsquedas web, utilizando el protocolo MCP para una comunicación eficiente.
Un servidor de protocolo que permite la comunicación fluida entre Umbraco CMS y aplicaciones externas.
NOL integra LangChain y Open Router para crear un servidor MCP de múltiples clientes utilizando Next.js.
Conecta los LLM a Firebolt Data Warehouse para consultas autónomas, acceso a datos y generación de insights.
Un marco de cliente para conectar agentes de IA con servidores MCP, permitiendo el descubrimiento e integración de herramientas.
Spring Link facilita la vinculación y gestión de múltiples aplicaciones de Spring Boot de manera eficiente dentro de un entorno unificado.
Un cliente de código abierto para interactuar con múltiples servidores MCP, permitiendo un acceso fluido a las herramientas para Claude.

Automatización del navegador

Un protocolo de servidor para crear, leer y modificar presentaciones de Google Slides de manera programática.
Habilita la automatización avanzada del navegador para la gestión del viewport, captura de pantallas y extracción de contenido utilizando TypeScript.
Un servidor MCP que permite a los agentes de IA controlar navegadores web a través del uso de navegadores con streaming VNC en tiempo real.
Una plantilla de proyecto basada en TypeScript para React y Vite con soporte para ESLint y plugins de React.
Sistema autónomo para evaluar y depurar aplicaciones web mediante la automatización del navegador y el análisis de redes.
Un MCP de pruebas basado en Selenium que se integra con clientes de IA similares a Claude y Copilot en VS Code.
Una biblioteca de Go que facilita la integración con servidores MCP como Redis, GitHub, Google Maps y herramientas de scraping web.
Un cliente MCP basado en Python que permite la automatización del navegador y la interacción con servidores de Minecraft.
Una herramienta basada en la web para navegar y gestionar las configuraciones del servidor de Minecraft y las instalaciones de plugins con facilidad.
Un repositorio creado a través del cliente MCP para gestionar tareas de automatización con Selenium y herramientas de scripting.