aproximadament
Publicat el 17 de junio de 2020

Treballar com Site Reliability Engineer (SRE) | BETWEEN

Escrit per Susana Morcuende

La mítica rivalitat que existeix entre els departaments de Desenvolupament i Operacions en les empreses tecnològiques no és una història d'aquesta dècada. Ni tan sols d'aquest segle. Per això, en 2003, Ben Treynor, vicepresident d'Enginyeria de Google, va decidir posar a especialistes en programació a desenvolupar tasques pròpies de l'àrea operacional. Naixia així el concepte de Site Reliability Engineering (Enginyeria de Confiabilitat de Llocs) i, amb ell, el lloc de Site Reliability Engineer (SRE), una figura cada vegada més benvolguda per les companyies que aspiren a innovar regularment en els seus productes, però mantenint alhora un alt nivell de fiabilitat del servei.L'equip de SRE ve a posar pau entre els i les professionals de Desenvolupament, que aspiren a llançar més funcionalitats al major ritme possible; i els i les integrants del segment d'Operacions, l'obsessió de les quals és l'estabilitat dels productes. Gràcies als i les SRE, cada divisió d'enginyeria pot centrar-se plenament en els seus objectius:

  • Desenvolupament: escriure codi i innovar.
  • SRE: monitorar el funcionament dels productes cara a la detecció i solució primerenca de qualsevol error.
  • Operacions: ocupar-se de la configuració, el manteniment i la realització de tests periòdics.

Has pensat a treballar com SRE? Es tracta d'un rol en ascens que conjumina el millor de dos mons i que et permetrà aprendre una cosa nova cada dia. Descobreix fins a on podries arribar i quina formació i habilitats necessites per a aconseguir-ho.

Què és un Site Reliability Engineer i quines funcions té?

El Site Reliability Engineer (SRE) és un lloc que reparteix el seu temps entre el desenvolupament de programari per a la millora de l'estabilitat i el rendiment; i el monitoratge i resolució de problemes, amb la finalitat d'assegurar tant la disponibilitat del servei com el creixement i la innovació empresarial.

Els i les especialistes en SRE es dediquen a idear sistemes que presenten una alta tolerància davant les fallades, utilitzant estratègies com la degradació gradual (desactivació d'alguns processos perquè el sistema continuï funcionant, fins i tot amb incidències); o la defensa en profunditat, que preveu vies perquè els errors es corregeixin per si sols de manera automàtica.

En què es diferencien SRE i DevOps?

El fet que el rol de Site Reliability Engineer es concebi com un pont entre Desenvolupament i Operacions indueix a la confusió amb el d'enginyer o enginyera DevOps. La distinció més clara ve de la mà de Google, que apunta que:

  • Les funcions del DevOps són més genèriques i neixen d'una cultura empresarial que confia a integrar les dues àrees d'Operacions o Desenvolupament, però sense una metodologia que defineixi com fer-ho. Cada organització haurà d'estudiar els seus codis de funcionament per a trobar el protocol més apropiat.
  • Les responsabilitats del SRE, en canvi, estan molt definides i han d'ajustar-se a l'exposat en el llibre Site Reliability Engineering – How Google Runs Production Systems, redactat per l'equip de SRE de Google.

Aquest volum recull conceptes bàsics -segons Google- per a delimitar i coordinar el treball dels SRE, com:

  • El Service Level Agreement (SLA), és a dir, el percentatge de disponibilitat mínim que el sistema ha de mantenir per als usuaris finals.
  • El pressupost d'error (error budget), o percentatge admissible d'interrupcions que comprometin la disponibilitat del sistema en un període de temps determinat. Tots els experiments que vulgui portar al cap l'equip de Desenvolupament han de quedar coberts per aquest pressupost d'error.

No obstant això, cal tenir present que la metodologia de Google és… això, molt Google. I que, fora d'allí, no hi haurà dos SRE o dos DevOps iguals, perquè altres companyies barregen i modulen les tasques d'aquests dos perfils en funció de les seves necessitats.

equipo-site-reliability-engineers

Com convertir-te en Site Reliability Engineer?

Per a treballar com SRE, el teu currículum hauria d'integrar els següents vèrtexs:

  • Formació en Enginyeria Informàtica o especialitzacions universitàries similars.
  • Experiència prèvia en les àrees de Sistemes i Desenvolupament de Software. Potser la teva trajectòria és més sòlida en una que en l'altra, però és important que posseeixis coneixements d'ambdues.
  • Soft skills com a dots de comunicació (oral i escrita), capacitat de treball en equip, mentalitat resolutiva per a afrontar els problemes i disposició per a l'aprenentatge continu.

Els i les professionals del sector de la informàtica s'enfronten, en l'actualitat, a multitud de reptes, com l'emmagatzematge de dades en temps del big data, la transformació digital, l'ús de programari de codi obert o la renovació d'estructures legacy. En Site Reliability Engineering, el desafiament és l'automatització del treball més repetitiu i pesat (denominat toil, en argot de l'equip SRE de Google).

Així mateix, no cal perdre de vista que les labors de resolució d'incidències solen absorbir bona part de la jornada laboral dels i les SRE. De fet, segons el 2019 SRE Report de Catchpoint, que realitza anualment una enquesta per a avaluar l'estat de la professió, el 49% dels i les enginyeres de confiabilitat del lloc indica haver hagut d'enfrontar-se a un d'aquests problemes en l'última setmana. I el 50% de la mostra afirma haver hagut de solucionar corts en el servei de més d'un dia de durada en algun moment de la seva carrera.

T'identifiques amb aquesta descripció i no dubtaries a emprar-te a fons per a acabar amb qualsevol traïdorenca fallada de programari? Llavors, treballar com SRE és el teu. Vine't a BETWEEN i puja amb nosaltres un graó més en la teva trajectòria professional!

 

 

Etiquetes: Informática

Articles Relacionats

Què és un sandbox i per a què serveix | BETWEEN

Si no fos pel sandboxing, fer una cosa tan senzilla com llegir un pdf, descarregar un arxiu adjunt o navegar per Internet seria tan perillós com travessar un camp minat. Un pas en ...

( de lectura )

Topics: Informática

Val la pena especialitzar-se per a ser desenvolupador WordPress en 2020?

Entra al teu navegador i visita una pàgina d'Internet QUALSEVOL. Amb quin CMS (Content Management System) apostaries que està feta? En BETWEEN et Donem 01:00 truc: respon ...

( de lectura )

Topics: Informática

Serverless: què és i quins avantatges té | BETWEEN

L'arquitectura Serverless, basada en l'execució d'aplicacions i processos en el núvol, ha arribat per a quedar-se. L'últim informe The State of Securing Workloads de Alcide ha ...

( de lectura )

Topics: Informática