Les Cast Codeurs Podcast: LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1
12/4/20 - Episode Page
Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).
Enregistré le 12 novembre 2020
Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3
Interview Ta vie, ton oeuvre
Twotter Nicolas Twitter Maxime Criteo Labs
SRE en 2 phrases
Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?
Pourquoi
Ops et dev, pourquoi “merger” ? DevOps avec un sysadmin dans l’équipe vs SRE Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?
SRE au quotidien
Journée type
Dashboard
On code en quoi?
Pager (pendant les horaires travails vs dehors) Les weekends
Taille SRE pour pour du 24/7
Combien de fois est-on appelé par nuit ? Prod fallback
Le development
Concepts intéressants
50% eng
SLO SLI SLA La difficulté de la valeur initiale Perf passées vs calcul théorique
Error budget Blast radius Burn rate
Pré conclusion
C’est la fin de la partie 1 de cette interview
Nous contacter
Faire un crowdcast ou une crowdquestion Contactez-nous via twitter https://twitter.com/lescastcodeurs sur le groupe Google https://groups.google.com/group/lescastcodeurs ou sur le site web https://lescastcodeurs.com/ Flattr-ez nous (dons) sur https://lescastcodeurs.com/ En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com