Description du poste :
Ingénieur IT Senior – SRE (Site Reliability Engineer) Le Site Reliability Engineer (SRE) est chargé d’assurer la fiabilité, la performance et la disponibilité des applications cloud. Ses missions incluent la mise en place et le suivi de systèmes de monitoring et d’alerting, l’optimisation des infrastructures, la gestion des incidents de production, ainsi que la collaboration avec les équipes de développement pour renforcer la stabilité et la scalabilité des services. Il contribue également à l’amélioration continue et à l’adoption des meilleures pratiques dans un environnement technologique en constante évolution.
Missions principales :
- Mettre en place des systèmes de monitoring et d’alerte afin d’assurer une surveillance proactive des environnements.
- Optimiser en continu la performance et la disponibilité des services cloud.
- Gérer et résoudre rapidement les incidents de production, et conduire des analyses post-mortem pour prévenir leur récurrence.
- Automatiser les tâches récurrentes et développer des pipelines CI/CD robustes et sécurisés.
- Collaborer étroitement avec les équipes de développement pour garantir le déploiement et l’exploitation d’applications fiables et performantes.
- Effectuer une veille technologique et intégrer les innovations pertinentes, dans le respect des standards et bonnes pratiques du secteur.
Contraintes du poste
- Assurer une disponibilité permanente pour la prise en charge des incidents critiques (astreintes possibles).
- Garantir la confidentialité des données et le respect des processus internes.
- Être apte au travail en horaires flexibles et aux déplacements professionnels.
Conditions d’accès
- Diplôme requis : Bac +5 (Master ou Ingénieur d’État en informatique, génie informatique, télécommunications, électronique ou disciplines connexes).
- Expérience professionnelle : Minimum 3 années dans des fonctions similaires.
Compétences techniques
- Maîtrise des outils de supervision et de monitoring (Prometheus, Grafana).
- Expertise en architectures cloud native et pratiques SRE.
- Solide expérience en conteneurisation et orchestration (Docker, Kubernetes).
- Connaissances approfondies en gestion des incidents, analyses post-mortem, optimisation des performances et réduction des coûts d’exploitation.
Certifications recommandées
- Red Hat Certified Specialist in Ansible Automation.
- Docker Certified Associate (DCA).
- Certified Kubernetes Administrator (CKA).
- Alibaba Cloud Professional (ACP) / Associate (ACA) – Cloud Computing.
Maitrise des langues :
- Arabe : Ecrit, parlé et lu.
- Français : Ecrit, parlé et lu.
- Anglais : Ecrit, parlé et lu.
Qualités Personnelles Exigées :
- Orientation client.
- Esprit d’analyse et qualités rédactionnelles.
- Rigueur, engagement et sens de responsabilité.
- Efficacité, précision et autonomie.
- Sens de l’initiative et réactivité.
- Bonne gestion des priorités en situation de stress.