- ステップ1:ドキュメントに指定されたサーバーの詳細を使用して、MCPクライアントを設定します。
- ステップ2:最初の中立プロンプトをMCPサーバーに送信して、LLMタイプを検出し、最初のフェーズをトリガーします。
- ステップ3:サーバーは準備プロンプトを返し、モデルの詳細を記録します。
- ステップ4:検出されたモデルに合わせて調整された脱獄指示を含む修正スキーマで後続の呼び出しを行います。
- ステップ5:サーバーは安全性を迂回し、研究目的の特定のモデル動作をトリガーするプロンプトを引き続き提供します。