Il panorama dell’intelligenza artificiale, tradizionalmente dominato da grandi aziende tecnologiche, assiste all’emergere di un’iniziativa rivoluzionaria: Fama, un modello avanzato di riconoscimento vocale e traduzione automatica sviluppato dalla Fondazione Bruno Kessler (FBK) attraverso le sue unità SpeechTek e Machine Translation, nell’ambito del progetto Fair – Future Artificial Intelligence Research. Fama si distingue per un approccio radicale: la sua creazione è stata concepita *ex novo*, senza l’utilizzo di modelli preesistenti e proprietari, e si basa interamente su dati e strumenti aperti, segnando una svolta verso un’IA più trasparente e accessibile.La novità di Fama non risiede unicamente nella qualità delle performance, che si attestano a livelli competitivi, ma soprattutto nella sua natura intrinsecamente aperta. Il modello è stato addestrato su un corpus di oltre 150.000 ore di dati audio liberamente accessibili, arricchito da una componente significativa di dati sintetici. Questi ultimi, creati ad hoc per il progetto, rappresentano trascrizioni e traduzioni automatiche in italiano e inglese, resi disponibili attraverso il dataset Mosel. Questa combinazione di dati reali e generati artificialmente mira a superare le limitazioni dei dataset tradizionali, garantendo una maggiore robustezza e generalizzabilità del modello.La completezza dell’iniziativa è sottolineata dalla pubblicazione del codice sorgente, dei dati di addestramento e della documentazione tecnica, elementi essenziali per la riproducibilità e l’adattabilità del sistema. Questo permette alla comunità scientifica e a sviluppatori indipendenti di esaminare, modificare e migliorare il modello, accelerando l’innovazione e favorendo la nascita di nuove applicazioni. Il know-how sviluppato nel corso del progetto, che incarna un approccio multidisciplinare tra linguistica computazionale, ingegneria acustica e machine learning, rappresenta un asset strategico per FBK, aprendo a una vasta gamma di possibilità nel campo dell’elaborazione del linguaggio naturale.“Abbiamo dimostrato che la competenza per sviluppare modelli di grandi dimensioni esiste anche in Italia,” affermano Sara Papi e Marco Gaido, coordinatori del progetto. Questo risultato è particolarmente significativo nel contesto delle nuove normative europee sull’IA, che promuovono la trasparenza, la responsabilità e l’indipendenza tecnologica. Il progetto Fama non solo rafforza la posizione dell’Italia come polo di eccellenza nella ricerca sull’IA, ma contribuisce anche a definire un nuovo paradigma di sviluppo tecnologico, basato sulla collaborazione e sull’apertura.L’architettura modulare del modello e l’esperienza acquisita nella gestione di grandi volumi di dati, risorse computazionali e complessità linguistiche, pongono le basi per la futura creazione di una piattaforma vocale multilingue completamente open source. L’utilizzo delle risorse computazionali messe a disposizione da Cineca, un importante centro di calcolo ad alte prestazioni, ha permesso di affrontare le sfide legate all’addestramento di modelli di tale portata. In definitiva, il progetto Fama rappresenta un passo fondamentale verso un’intelligenza artificiale più democratica, riproducibile e orientata al bene comune, favorendo la creazione di un ecosistema digitale più equo e accessibile a tutti.
Fama: L’IA Italiana Open Source Rivoluziona Riconoscimento Vocale
Pubblicato il
