Piero Molino ci racconta Ludwig, l’innovativo tool per addestrare modelli di Deep Learning

In vista della nuova collaborazione tra Open Data Playground, piattaforma proprietaria di OSN, e Ludwig, un toolbox che consente di addestrare e testare modelli di deep learning, abbiamo deciso di intervistare Piero Molino, suo autore e Staff ML/NLP Research Scientist presso l'Università di Stanford.

La collaborazione con Ludwig nasce dall'idea di voler strutturare e arricchire la piattaforma e le relative challenge, in questo caso grazie alla soluzione di Intelligenza Artificiale di Ludwig. Oggi allora scopriamo di più sul background professionale del suo creatore e su come e nato questo nuovo tool!

Ciao Piero, hai iniziato la tua carriera professionale all'Università di Bari e, dopo importanti esperienze lavorative per UBER e IBM, sei arrivato a sviluppare Ludwig. Ci racconti la tua storia?

Per iniziare, mentre studiavo all'Università di Bari ho anche lavorato a Yahoo! Labs a Barcellona e fondato una startup chiamata QuestionCube. Dopo l'esperienza in IBM, dove ho avuto la fortuna di lavorare a New York con Alfio Gliozzo (uno dei membri del team che creò Watson nel 2011), ho lavorato a Geometric Intelligence, una startup fondata da pionieri dell'intelligenza artificiale: Gary Marcus, Zoubin Ghahramani, Ken Stanley, Jeff Clune e Noah Goodman. Geometric Intelligence, inoltre, è stata poi acquisita da Uber come fondamenta dell'organizzazione di ricerca Uber AI Labs. Nei miei 3 anni e mezzo ad Uber, l'organizzazione all'interno della quale lavoravo è cresciuta da 10 a 100 persone e ho avuto modo di dedicarmi a molti progetti di ricerca, al recommender system di Uber Eats e al sistema di dialogo per guidatori, sotto la guida di Gokhan Tur, e svariate applicazioni, incluso COTA (primo modello di deep learning utilizzato in produzione ad Uber). Ora sono all'Università di Stanford, dove lavoro come ricercatore nel team di Chris Ré.

Cos’è Ludwig e come è nato?

Ludwig è uno strumento che permette anche a chi non ha profonde conoscenze di deep learning di addestrare modelli e utilizzarli per ottenere predizioni; questo perché non richiede la scrittura di codice, ma solo di un semplice file di configurazione.
L'ho inizialmente sviluppato internamente ad Uber per semplice uso personale e per facilitare il mio lavoro di sviluppo di nuovi modelli per molti obiettivi diversi. Ludwig mi ha reso molto più veloce e così altri data scientist ad Uber hanno iniziato ad usarlo, tanto che alla fine ho deciso di rilasciarlo sotto licenza open source, in modo che chiunque potesse trarne vantaggio e contribuire al suo sviluppo e miglioramento. 
Recentemente abbiamo rilasciato una nuova versione v0.3 che include molti miglioramenti e molte nuove funzionalità che lo rendono ancora più facile da usare ed estendere.

Con quali realtà si interfaccia e lavora?

Dalla sua nascita, Ludwig ha ricevuto contributi diversi da sviluppatori indipendenti e aziende. È stato costruito basandosi su TensorFlow, quindi si integra bene con gli strumenti di quell'ecosistema, ma abbiamo recentemente aggiunto integrazioni con Hugging Face, Horovod, Comet e Weights and Biases e stiamo pianificando di integrare anche Ray per migliorare ulteriormente l'ottimizzazione degli iperparametri (che è già presente il Ludwig).
Essendo un progetto open source non è semplicissimo tenere traccia di tutti gli utilizzatori, ma sappiamo che aziende come Apple ed Uber sono utilizzatori dello strumento e lo hanno integrato nei propri sistemi interni. Altre aziende ancora, come Coveo e Chatdesk, lo utilizzano per addestrare modelli di recommendation e di supporto clienti, mentre FreddieMac utilizza Ludwig per modelli assicurativi. Anche Musixmatch, fiore all'occhiello del mondo startup italiano, utilizza Ludwig per alcuni dei suoi modelli di machine learning.

È nata una nuova collaborazione tra Ludwig e OSN/ODP. Come conosci Aldo Razzino e OSN? Quale valore aggiunto credi che possa dare OSN a Ludwig e viceversa? 

Ho conosciuto Aldo svariati anni fa in veste di Head Hunter; mi propose infatti delle posizioni molto interessanti, e mise in contatto molti miei ex colleghi con forti competenze in data science con aziende di alto livello. Per via della sua esperienza nel settore e il suo occhio nel trovare gente competente, penso che OSN sia una delle realtà più interessanti in Europa e in Italia per la ricerca di lavoro nell’ambito data science.
Lo scopo e il valore che speriamo di ottenere dalla collaborazione è di mostrare ad altre aziende interessate le potenzialità di Ludwig come strumento per facilitare lo sviluppo di modelli di machine learning, e allo stesso tempo realizzare progetti tramite hackathon di data science che creino valore per queste aziende.