O meserie extrem de interesantă și de viitor este meseria de Data Analyst. Un absolvent de facultate în științe economice (finanțe, statistică, cibernetică etc) sau chiar în știința calculatoarelor, matematică ori informatică, ar putea fi foarte atras de un post în zona de Data Analysis (analiza datelor).
Pe cât de complicat sună lucrul cu seturi de date, precum și cu programe de prelucrare, stocare, procesare și analiză a datelor, pe atât de frumoasă este această activitate, care devine din ce în ce mai vizată de tineri.
Am ajuns la concluzia aceasta după ce am văzut cu adevărat ce face un Data Analyst și după ce am observat că datele stau baza tuturor acțiunilor, deciziilor și soluțiilor pe care companiile sau organizațiile le iau.
Ce este Data Analysis (analiza datelor)?
Analiza datelor este procesul de culegere a informațiilor din seturi de date pentru a ajuta la luarea unor decizii mai bune (de regulă, decizii de business). Analiza datelor este știința analizării datelor brute (raw data) pentru a trage concluzii despre informațiile respective.
Totodată, analiza datelor ajută companiile să îmbunătățească performanța activităților de business pe care le întreprind prin luarea unor decizii informate.
Ce face un Data Analyst?
Un Data Analyst (Analist de date) adună, curăță și interpretează seturi de date pentru a ajuta organizația la care lucrează să găsească răspunsuri la întrebări importante sau pentru a rezolva probleme.
Un Data Analyst poate lucra în multe industrii, precum afaceri, finanțe, justiție, știință, medicină, structuri guvernamentale etc.
Organizațiile/ companiile au nevoie de Data Analyști pentru a pune în valoare datele pe care le adună în relațiile și activitățule de business.
Spre exemplu, analiza datelor pe care o face un Data Analyst poate ajuta o bancă să personalizeze interacțiunile cu clienții, poate face predicții pentru a elimina timpii mari de așteptare la coadă de la un ghișeu sau poate identifica diverse nevoi pe baza unor șabloane/ tipare din trecut (pattern-uri).
Totuși, este important de menționat că Data Anayst nu reprezintă același lucru cu Data Scientist. Chiar dacă ambii analiști lucrează cu date, este important să înțelegem că ceea ce fac aceștia cu datele diferă.
Un Data Analyst lucrează de obicei cu cu date structurate pentru a rezolva probleme tangibile/ definite de business, folosind instrumente precum limbaje de programare SQL, R sau Python, software de vizualizare a datelor și de analiză statistică.
Un Data Scientist (om de știință) construiește algoritmi și modele pentru a face predicții de viitor. Data Scientistul se confruntă adesea cu necunoscutul, astfel că se folosește de tehnici mai avansate (machine learning, data modeling etc) pentru a face predicții despre viitor. Acesta poate dezvolta algoritmi pentru a gestiona atât datele structurate, cât și cele nestructurate.
În ce constă munca unui Data Analyst?
Procesul de analiză a datelor este complex și pornește de la identificarea problemei de rezolvat și se sfârșește în momentul în care s-au găsit soluțiile la problema identificată. Astfel, de la început până la final, procesul de analiză a datelor cuprinde următoarele etape:
1. Identificarea problemei pe care compania dorește să o rezolve
Ce problemă încearcă să rezolve compania? Ce trebuie să măsurăm pentru a rezolva problema și cum vom măsura această problemă? Așadar, pentru a determina aceste lucruri, trebuie să punem întrebări eficiente și să colabărm cu oamenii interesați de rezultatul analizei.
- Care este problema pe care încercăm să o rezolvăm?
- Care este scopul acestei analize?
- Ce ne propunem să obținem după această analiză?
2. Colectarea și stocarea datelor
În această etapă, Data Analystul identifică tipul de date de care are nevoie pentru a ajunge la rezultatul dorit – acestea pot fi date dintr-un sondaj, din baze de date internaționale, din teren, din diverse interviuri etc.
3. Procesarea datelor prin curățarea și verificarea informațiilor
Să presupunem că am colectat date prin intermediul unui sondaj. În această etapă trebuie să ne asigurăm că datele au fost curățate pentru a ne asigura că sunt complete, corecte, relevante, precum și faptul că acestea sunt securizate
Curățarea datelor este extrem de necesară pentru a pregăti datele pentru analiză. Această muncă implică curățarea datelor duplicate, caracterelor neconforme, formatul datelor, precum și eliminarea spațiilor albe sau ale altor erori de sintaxă.
În această etapă, ar trebui să ne asigurăm că avem ceea ce ne trebuie:
- Structura datelor/ datele colectate sunt de calitate?
- Avem toate datele pe care anticipam că le vom avea?
- Ne lipsesc date?
4. Analiza datelor pentru a găsi modele, relații și tendințe
Prin manipularea datelor folosind diferite tehnici și instrumente de analiză a datelor, Data Analystul poate începe să caute tendințe, corelații, care ar putea să identifice răspunsuri la întrebările inițiale. În această etapă, acesta poate să apeleze la softuri de vizualizare a datelor pentru a transforma datele într-un format grafic, ușor de înțeles.
5. Interpretare
Interpretarea rezultatelor analizei ajută la pregătirea unor recomandări către companie, pe baza datelor analizate. De asemenea, în acest punct, este important să se descopere și limitările concluziilor extrase pe baza procesului de analiză a datelor.
Ce este recomandat să înveți ca să devii un Data Analyst?
Majoritatea rolurilor de Data Analyst (analist de date) necesită o diplomă de licență într-un domeniu precum matematica, statistica, informatica sau finanțe.
Totuși, există și alte modalități de a dobândi cunoștințe pentru a obține un post de Data Analyst, Spre exemplu, un certificat profesional în analiza datelor de la Google sau IBM, pe care eu le-am găsit pe Coursera și am observat că sunt extrem de bune și bine văzute de angajatori.
Un astfel de curs te-ar putea ajuta să dobândești cunoștințe de Data Analysis în patru-șase luni de studiu. Printre cele mai importante abilități pe care trebuie să le stăpânească un Data Analyst regăsim:
-
- Cunoștințe de bază în matematică și statistică (nu avansat)
- Cunoștințe de bază măcar în limbajele de programare folosite în Data Analysis: R, Python și SQL
- Să știe să folosească câteva unelte/ softuri precum SAS, Excel sau softuri de business intelligence
- Să aibă abilități bune de gândire analitică, rezolvare a problemelor și vizualizare a datelor
Surse:
1. Coursera
2. Google Data Analytics Professional Certificate (informații extrase din curs)