Nous recherchons un développeur senior capable de concevoir et de mettre en œuvre une solution complète de traitement vocal temps réel embarquée sur Jetson AGX Orin.
Le système vise à gérer des appels SIP entrants et à fournir des réponses vocales multilingues (anglais, espagnol, allemand) en temps réel, en s’appuyant sur des modèles embarqués de reconnaissance vocale, NLU, LLM, et synthèse vocale.
Responsabilités
- Intégrer une chaîne vocale complète : VAD → ASR (Faster-Whisper) → NLU (fastText) → LLM (llama.cpp) → TTS (XTTS)
- Orchestration des appels avec Asterisk et AGI
- Gestion de la barge-in, des timeouts, et des transferts SIP conditionnels
- Mise en conteneur des services avec Docker Compose
- Déploiement et optimisation sur Jetson AGX Orin avec TensorRT et CUDA
- Mise en place d’un tableau de bord local (Grafana + Prometheus)
- Sécurisation des logs, bases de données et transcriptions (AES-256, sops)
- Prise en charge des mises à jour OTA avec rollback
- Tests automatisés (unitaires, intégration, simulation d'appels)
🎯 Compétences Recherchées
- Maîtrise de Python pour les systèmes temps réel (asyncio, subprocess, audio streaming)
- Très bonne connaissance de Jetson AGX, CUDA, TensorRT, cuDNN
- Expérience avérée avec des projets embarquant ASR, LLM, TTS, de préférence hors ligne
- Expertise en téléphonie SIP et en intégration Asterisk AGI
- Maîtrise des conteneurs (Docker Compose) et du monitoring système (Prometheus, Grafana)
- Solides compétences en sécurité : chiffrement, gestion de secrets, purge automatique
- Connaissance des tests avec pytest, tox, et scripts de simulation d’appels SIP (sipp)
✅ Profil Idéal
- A déjà conçu ou contribué à un assistant vocal embarqué ou un système IA temps réel
- À l’aise avec la gestion des ressources (VRAM, sémaphores GPU, load CPU)
- Capable de livrer un système robuste, documenté, et prêt à être intégré dans une infrastructure existante
- Autonome, rigoureux, orienté performance et fiabilité
📍 Informations complémentaires
- Environnement cible : Jetson AGX Orin 64GB, Docker, Python 3.10, Linux headless
- Objectif : gestion simultanée de 4 appels SIP avec une latence ≤ 1,2 s (p95)
- Langues à supporter : anglais, espagnol (castillan), allemand
✅ Pour client européen avec possibilité d’offre full time remote si complétion de ce projet est faite avec succès.