- Passo 1: Clone o repositório ChainStream do GitHub.
- Passo 2: Compile a biblioteca para sua plataforma de destino (Android, iOS, Windows, macOS ou Linux).
- Passo 3: Inclua os cabeçalhos do ChainStream e vincule à biblioteca compilada em seu projeto.
- Passo 4: Configure o backend do seu modelo (ONNX, MNN ou TFLite) usando a API do ChainStream.
- Passo 5: Implemente o loop de inferência streaming para receber tokens de forma incremental.
- Passo 6: Implemente o aplicativo nos dispositivos e teste as interações de LLM em tempo real.