Data scientist, data engineer, data manager, tutti li vogliono ma pochi capiscono realmente il loro lavoro

Il data scientist e’ quello che collega, per primo, il dato x al dato z, in maniera intuitiva e innovativa, e che riesce ad estrarre valore nella gestione dell’informazione. E’ la figura che sa pensare fuori dagli schemi e cerca valore andando oltre lo standard.
Data Scientist Desk

Abbiamo deciso di intervistare Aldo Razzino, CEO e fondatore di Open Search Network, società di headhunting specializzata nella ricerca di "professionisti del dato". 

Ciao Aldo, ci racconti brevemente di cosa ti occupi e come è maturata l'idea che sta alla base della tua società?

Mi occupo di headhunting da poco più di 10 anni, con un focus particolare sul mercato IT italiano. Da 7 anni vivo a Londra e da 4 anni gestisco la mia start up, Open Search Network

Come a volte capita, l’idea di fare una start up e’ nata “quasi per caso”. Stavo parlando con un partner al telefono del fatto che volessi specializzarmi in ambito Big Data e lui mi ha detto “perché non ti apri la tua società” e io “e me li dai tu i soldi?”…“Fammi un Business Plan e ne parliamo”. Da questo scambio di parole e’ poi nata Open Search Network

Il mio mercato di riferimento e’ sempre stato l’Italia e, nel 2012, mi accorsi che mentre a Londra tutti impazzivano per sviluppatori e specialisti in ambito Dati, in Italia ancora nessuno ne parlava. Per questo motivo ho deciso di concentrare le attività’ di ricerca in ambito Data Science, Data Engineering e Data Strategy.

Tutti parlano di data scientist, ma temo che pochi sappiano realmente di cosa si occupa questa figura professionale. Ce lo puoi spiegare?

Per me il data scientist e’ quello che collega, per primo, il dato x al dato z, in maniera intuitiva e innovativa, e che riesce ad estrarre valore nella gestione dell’informazione. E’ la figura che sa pensare fuori dagli schemi e cerca valore andando oltre lo standard. 

Il data scientist deve essere curioso: ogni dataset può nascondere specifiche relazioni che, se opportunamente analizzate, possono fornire informazioni aggiuntive. Un buon data scientist non sarà mai soddisfatto del risultato dell’analisi fatta.

Data Scientist vs Data EngineerDi recente anche in Italia è esplosa la passione per i data scientist, anche se molto spesso le aziende farebbero meglio a cercare un data engineer. C'è ancora molta confusione, all'interno delle aziende, intorno alle figure professionali specializzate nel trattamento dei dati. Per poter trarre valore dalle analisi dei dati, bisogna avere un’efficiente gestione dell’architettura delle informazioni.

Data Manager, Data Engineer, Data Scientist, in che relazione sono? Quali sono le loro prerogative?

Il data manager è il manager del team preposto alla gestione dei dati, dove ci sono specialisti di data engineering e di data science. I primi sono più orientati alla gestione del flusso dei dati dalle fonti alla DMP (piattaforma di gestione dati). I secondi, creano modelli e soluzioni di Artificial Intelligence per l’analisi dei dati e si occupano della visualizzazione dei risultati. Il data manager è il “protettore” del team nei confronti delle differenti linee di business dell’azienda. Deve avere competenze sia di gestione che di analisi dati.

Capita spesso che le aziende cerchino un data scientist, quando in realtà avrebbero bisogno di tutt’altro tipo di specialisti?

Aldo RazzinoDi solito chiedo al cliente qual’e’ il problema che il data scientist deve risolvere. Da questa domanda capisco meglio le reali necessità. Potrebbe essere troppo presto per inserire un data scientist e quindi basterebbe un buon profilo di data analysis, con forti competenze tecnologiche. Altre volte, come dicevo prima, c’e’ bisogno del data engineer per rendere i dati disponibili. Solo in alcuni casi siamo già ad uno stadio avanzato di evoluzione della cultura analitica all’interno dell’azienda e ci sono team dedicati e indipendenti di Artificial Intelligence e Machine Learning.

Quali sono i settori che stanno cercando più attivamente i data scientist?

Sicuramente i settori delle telecomunicazioni e dei servizi finanziari sono quelli con più dati a disposizione e che si sono potuti muovere in anticipo in questo settore. Tutti gli altri saranno presto coinvolti in questa nuova rivoluzione. La globalizzazione ha aumentato il livello di competizione e le società che sapranno gestire i propri dati e, conseguentemente, estrarne valore, saranno quelle che alla fine risulteranno vincenti.

Quali sono i settori che secondo la tua esperienza avrebbero più bisogno di data-scientist?

L’analisi dei dati deve portare valore e risolvere problemi, mi aspetto che tutti i settori saranno travolti da una necessità di capire meglio le proprie informazioni. Stiamo iniziando a fare ricerche molto puntuali, dove oltre a competenze di settore, iniziano ad essere richieste competenze tecniche all'avanguardia come l’esperienza con Virtual Assistance Services come Cortana e Alexa. Non dimentichiamo che in futuro dovremmo insegnare a parlare ai robot.

Si comincia a leggere di corsi di laurea specifici per data scientist, secondo te è una buona idea.

Sì, credo nella specializzazione e vedo valore in corsi di laurea di questo tipo. Credo anche che gli uffici HR debbano iniziare a valutare un maggiore spettro di lauree per i profili analitici, andando a considerare anche lauree in fisica, astrofisica e neuroscienza… per fare solo alcuni esempi. All’estero è già così, in Italia c'è ancora una certa resistenza. 

Come si cerca un data scientist? Come si capisce il loro livello di preparazione?

In Open Search Network consigliamo sempre ai nostri clienti di ricercare i data scientist attraverso delle competition on line, tipo Kaggle. Noi utilizziamo una piattaforma di Matematica Applicata del Politecnico di Milano, Mathesia. Purtroppo, non e’ sempre possibile, a causa di tempistiche di recruitment spesso molto strette.

Testare il candidato attraverso la risoluzione di un problema di business reale permette di valutare, da subito, skills e aspetti tecnici che sono fondamentali per creare un team multidisciplinare ed orientato alla ricerca della soluzione “out of the box”. I candidati possono così preventivamente dimostrare alcune competenze di analisi e valutazione che, in un normale processo di recruitment,  sarebbero riscontrabili solo alla fine dello stesso.

Presenteremo questa modalità di recruitment alla Scuola Superiore Normale di Pisa il prossimo 10 maggio insieme a Mathesia, la piattaforma dove svolgiamo le gare di recruitment, e Assicurazioni Generali

Quali sono i linguaggi di programmazione più in uso dai data scientist?

Quelli più comuni e richiesti sono Python, Java, R, C++, C, JavaScript, Hadoop, Hive, Scala, Matlab, SQL. A volte i linguaggi ritornano, altre volte ne nascono di nuove evoluzioni.

Credo sia fondamentale una formazione continua, anche in autonomia, per provare a stare al passo con i ritmi delle innovazioni che ci saranno dei prossimi anni.