- Passo 1: Instale o LlamaIndex e o módulo Llama Deploy via pip.
- Passo 2: Construa e serialize seu índice de documentos com o LlamaIndex.
- Passo 3: Crie um arquivo de configuração de implantação especificando o provedor (AWS Lambda, Vercel ou Docker).
- Passo 4: Configure variáveis de ambiente para autenticação e região.
- Passo 5: Execute `llama-deploy deploy` para provisionar seu endpoint sem servidor.
- Passo 6: Teste a URL da API de chat gerada com prompts de exemplo.
- Passo 7: Monitore logs e configurações de escalonamento no console do seu provedor de nuvem escolhido.