Velvet 14B e Velvet 2B sono parte integrante di Velvet, una famiglia di Large Language Model progettata e realizzata integralmente in Italia e presentata nelle scorse ore a Roma. Disegnata per essere "efficiente, agile e a basso consumo" è pronta all’uso in cloud, sulle principali piattaforme, oltre che "on premise"

Il caso della start-up cinese DeepSeek , che ha scosso il mondo dell’intelligenza artificiale tanto da far vacillare anche le certezze delle grandi aziende negli Stati Uniti e delle Borse, ha fatto sì che il tema dell’IA sia diventato sempre più dibattuto. Proprio in queste ore, tra l’altro, è arrivata la presentazione di Velvet, la prima intelligenza artificiale tutta italiana. A svilupparla è stata Almawave, società quotata sul mercato Euronext Growth Milan e parte del Gruppo Almaviva, attiva in ambito data & artificial intelligence. A Roma, in particolare, sono stati svelati i dettagli legati a quella che è stata definita una “famiglia di modelli di intelligenza artificiale generativa multilingua”. Si tratta, come viene spiegato in un comunicato, di Velvet 14B e Velvet 2B, ovvero due Large Language Model (LLM) sviluppati in maniera integrale dall’azienda in Italia su propria architettura, oltre che “addestrati sul supercalcolatore Leonardo gestito da Cineca”.

I modelli sviluppati da Almawave

I modelli, in particolare, sono stati rilasciati in modalità open source, nati da una progettazione dell’IA, pensata per essere “sostenibile, leggera nei consumi, ma al tempo stesso efficace nei casi d’uso reali”. Entrambi i modelli, sottolinea Almawave, sono già pronti “per essere utilizzati sulle principali piattaforme di mercato in cloud, on premise e on the edge”, sono multilingua e si contraddistinguono “per le capacità specifiche di tutela delle singole lingue, in particolare di quella italiana”. Per realizzare questi modelli sono state utilizzate “tecniche e metodologie di data lineage e addestrati algoritmi proprietari, disegnati a questo scopo”, implementando nello specifico “un approccio attento nella selezione dei dati, per ridurre i rischi di discriminazione e mitigare i bias” E una specifica cura è stata posta sul tema della privacy, con l’obiettivo di permettere “una gestione più efficace e tempestiva di queste tematiche sensibili ed essenziali”. In quest’ottica, segnala l’azienda italiana, un elemento importante è rappresentato dal “PAE” (Privacy Association Editing), “un algoritmo proprietario che permette di eliminare, ove necessario, direttamente dal modello le informazioni sensibili, senza necessità di riaddestramento”.

Le specifiche tecniche

Ma ecco, nel dettaglio, cosa fa parte della famiglia “Velvet”. Si parte da VELVET 14B, cioè un Large Language Model caratterizzato da ben 14 miliardi di parametri, 6 lingue (italiano, tedesco, spagnolo, francese, portoghese, inglese) un vocabolario composto da 127 mila parole oltre che da una finestra di contesto da 128 mila token. Come detto, è stato addestrato sul supercalcolatore Leonardo gestito da Cineca, “su oltre 4.000 miliardi di token e sviluppato per adattarsi efficientemente a una molteplicità di settori verticali. Ha fra i suoi valori fondanti il controllo dei dati di addestramento e la gestione etica e sostenibile della tecnologia”, è stato spiegato. C’è poi VELVET 2B, ovvero un modello caratterizzato da 2 miliardi di parametri, in italiano e inglese, con una finestra di contesto da 32 mila token e un vocabolario di 127 mila parole. Come l’altro, anche questo modello è stato addestrato sul supercomputer Leonardo di Cineca “con oltre 2.000 miliardi di token”.

Una “sfida aperta”

A commentare il lancio del progetto, ecco le parole di Valeria Sandei, Amministratore Delegato di Almawave. “Velvet nasce dalla scelta strategica di investire con determinazione in un ambito tecnologico di vasto potenziale positivo, realizzando una Intelligenza Artificiale progettata per condensare al tempo stesso efficacia, leggerezza nei consumi e grande agilità nell’adattarsi a svolgere compiti mirati nei settori verticali in cui operiamo. Una visione, la nostra, che non è chiamata ad adeguarsi al contesto Europeo, ma lo considera, invece, come valore fondante nella costruzione. Il lancio di questi primi modelli generativi è solo l’inizio e ci conferma come un player protagonista in Europa, capace di innovare, pensando che l’IA sia una sfida aperta e che quanto fatto sia la miglior premessa per mettere in campo evoluzioni sempre più rilevanti”.