- Capture d'écran et traitement multimodal d'entrée
- Détection d'éléments GUI et analyse OCR
- Planification de tâches en langage naturel avec LLM
- Exécution automatisée d'actions : tapotement, balayage, saisie de texte
- Surveillance en temps réel et boucles de rétroaction
- Support pour diverses applications smartphone
- Invites personnalisables et workflows