La mítica rivalitat que existeix entre els departaments de Desenvolupament i Operacions en les empreses tecnològiques no és una història d'aquesta dècada. Ni tan sols d'aquest segle. Per això, en 2003, Ben Treynor, vicepresident d'Enginyeria de Google, va decidir posar a especialistes en programació a desenvolupar tasques pròpies de l'àrea operacional. Naixia així el concepte de Site Reliability Engineering (Enginyeria de Confiabilitat de Llocs) i, amb ell, el lloc de Site Reliability Engineer (SRE), una figura cada vegada més benvolguda per les companyies que aspiren a innovar regularment en els seus productes, però mantenint alhora un alt nivell de fiabilitat del servei.L'equip de SRE ve a posar pau entre els i les professionals de Desenvolupament, que aspiren a llançar més funcionalitats al major ritme possible; i els i les integrants del segment d'Operacions, l'obsessió de les quals és l'estabilitat dels productes. Gràcies als i les SRE, cada divisió d'enginyeria pot centrar-se plenament en els seus objectius:
Has pensat a treballar com SRE? Es tracta d'un rol en ascens que conjumina el millor de dos mons i que et permetrà aprendre una cosa nova cada dia. Descobreix fins a on podries arribar i quina formació i habilitats necessites per a aconseguir-ho.
El Site Reliability Engineer (SRE) és un lloc que reparteix el seu temps entre el desenvolupament de programari per a la millora de l'estabilitat i el rendiment; i el monitoratge i resolució de problemes, amb la finalitat d'assegurar tant la disponibilitat del servei com el creixement i la innovació empresarial.
Els i les especialistes en SRE es dediquen a idear sistemes que presenten una alta tolerància davant les fallades, utilitzant estratègies com la degradació gradual (desactivació d'alguns processos perquè el sistema continuï funcionant, fins i tot amb incidències); o la defensa en profunditat, que preveu vies perquè els errors es corregeixin per si sols de manera automàtica.
El fet que el rol de Site Reliability Engineer es concebi com un pont entre Desenvolupament i Operacions indueix a la confusió amb el d'enginyer o enginyera DevOps. La distinció més clara ve de la mà de Google, que apunta que:
Aquest volum recull conceptes bàsics -segons Google- per a delimitar i coordinar el treball dels SRE, com:
No obstant això, cal tenir present que la metodologia de Google és… això, molt Google. I que, fora d'allí, no hi haurà dos SRE o dos DevOps iguals, perquè altres companyies barregen i modulen les tasques d'aquests dos perfils en funció de les seves necessitats.
Per a treballar com SRE, el teu currículum hauria d'integrar els següents vèrtexs:
Els i les professionals del sector de la informàtica s'enfronten, en l'actualitat, a multitud de reptes, com l'emmagatzematge de dades en temps del big data, la transformació digital, l'ús de programari de codi obert o la renovació d'estructures legacy. En Site Reliability Engineering, el desafiament és l'automatització del treball més repetitiu i pesat (denominat toil, en argot de l'equip SRE de Google).
Així mateix, no cal perdre de vista que les labors de resolució d'incidències solen absorbir bona part de la jornada laboral dels i les SRE. De fet, segons el 2019 SRE Report de Catchpoint, que realitza anualment una enquesta per a avaluar l'estat de la professió, el 49% dels i les enginyeres de confiabilitat del lloc indica haver hagut d'enfrontar-se a un d'aquests problemes en l'última setmana. I el 50% de la mostra afirma haver hagut de solucionar corts en el servei de més d'un dia de durada en algun moment de la seva carrera.
T'identifiques amb aquesta descripció i no dubtaries a emprar-te a fons per a acabar amb qualsevol traïdorenca fallada de programari? Llavors, treballar com SRE és el teu. Vine't a BETWEEN i puja amb nosaltres un graó més en la teva trajectòria professional!