- Passo 1: Configure o cliente MCP com os detalhes do servidor conforme especificado na documentação.
- Passo 2: Envie um prompt neutro inicial para o servidor MCP para detectar o tipo de LLM e acionar a primeira fase.
- Passo 3: O servidor retorna um prompt de preparação e registra os detalhes do modelo.
- Passo 4: Faça chamadas subsequentes com um esquema modificado que inclua instruções de jailbreak adaptadas ao modelo detectado.
- Passo 5: O servidor continua a fornecer prompts que contornam a segurança e acionam comportamentos específicos do modelo para fins de pesquisa.