L’algoritmo capace di predire, con grande accuratezza, la mortalità prematura nasconde un modo rivoluzionario di usare i dati per generale modelli predittivi: “Sono stati i primi ad adattare qualcosa che viene usato per il linguaggio e per le immagini per dati che invece sono amministrativi e personali”, spiega l’esperto Bruno Lepri. E questo può aprire nuovi e importanti scenari
“Non è un ‘gioco’, è un lavoro scientifico importante”. Il ‘gioco’ in questione è apparso alla fine del 2023 in una ricerca, pubblicata sulla rivista Nature Computational Science, e che ha generato molta attenzione sui media, apparendo sul Financial Times e non solo: un algoritmo capace di ‘prevedere la morte’ delle persone. E di farlo con una precisione di molto superiore ad altri modelli, arrivando a essere corretto nel 79% dei casi. Tuttavia, come detto, non è affatto un ‘gioco’: si tratta di una grande novità nel mondo dell’intelligenza artificiale, che potrebbe avere un impatto significativo sul futuro del settore. E per capire come funziona questa intelligenza artificiale, le implicazioni della ricerca e le questioni che questa apre, abbiamo parlato con Bruno Lepri, direttore del Mobile and Social Computing Lab (MobS Lab) presso la Fondazione Bruno Kessler.
Come nasce l’algoritmo che ‘prevede la morte’
Intanto è necessario partire da che cos’è davvero questo algoritmo che ‘prevede la morte’. I ricercatori, provenienti dall'Università di Copenhagen e dalla Northeastern University di Boston, hanno utilizzato i dati dell'anagrafe nazionale danese: in particolare sono state usate le informazioni dei 6 milioni di abitanti della Danimarca tra il 2008 e il 2016, tra cui istruzione, stipendio, lavoro, orario di lavoro, alloggio e visite mediche. I ricercatori, insomma, “hanno avuto accesso a una quantità di dati enormi”. Per costruire l’intelligenza artificiale “hanno preso tutti gli eventi che riguardavano una persona e li hanno trasformati in una sequenza di ‘parole’, mescolando i dati di salute ad altri come un cambio di lavoro”, spiega Lepri. Da qui hanno sviluppato un algoritmo in grado di prevedere alcuni aspetti del corso della vita di una persona: tra queste, la mortalità prematura e le sfumature della personalità degli individui. Con una accuratezza del 79%, superiore dell’11% - secondo quanto dichiarato da Sune Lehmann della Technical University of Denmark, che ha guidato la ricerca - ai risultati finora ottenuti dai migliori modelli predittivi. Per raggiungere questi risultati - semplificando molto - è stato usato lo stesso sistema su cui si basano chatbot come ChatGPT.
leggi anche
Intelligenza artificiale, la app che ruba le facce in Rete. PODCAST
Perché Life2vec è “rivoluzionario”
Life2vec è infatti un modello linguistico di grandi dimensioni (LLM): questi sistemi sono capaci di individuare - all'interno di grandi quantità di testo - schemi ricorrenti nella successione di parole e frasi, e usarli a loro volta per elaborare testi coerenti. Trasformando gli eventi della vita in ‘parole’, l’algoritmo è allo stesso modo capace di fare le predizioni di cui si è parlato in precedenza: “Sono stati i primi ad adattare qualcosa che viene usato per il linguaggio e per le immagini per dati che invece sono amministrativi e personali, quindi dati in tabelle”, spiega ancora Lepri. Non bisogna però pensare a Life2vec come una sorta di ‘Nostradamus’, capace di dire a una persona quando morirà: “Non ti dice il giorno o il momento della tua morte”. L’algoritmo è invece in grado di dire, in base a tutte le informazioni su cui è stato addestrato, se una persona andrà incontro a morte prematura rispetto all’aspettativa di vita media: “Tutti pensano che questo task sia il più complesso, ma in realtà è il più semplice. Quello più complesso è quello della personalità”. Life2vec infatti è anche in grado, sulla base dei dati indicati sopra, anche di predire le sfumature della personalità degli individui. “È rivoluzionario questo fatto”, specifica Lepri: “Finché si avevano dati descrittivi statici - il luogo della laurea, occupazione dei genitori, eccetera - e in base a quelli si cercava di fare predizioni, funzionava molto meno rispetto a prendere tutti gli ultimi 10 anni di vita e trasformare gli eventi in ‘parole’, e da lì si va a predire determinati risultati”.
leggi anche
Intelligenza Artificiale, Altman: "Governi devono definire regole"
I nuovi scenari aperti dalla ricerca
Insomma, nonostante l’inevitabile curiosità che solleva un algoritmo che ‘predice la morte’, non si tratta certo di un gioco: “È un lavoro molto importante, perché prende tecniche che funzionano bene nell’ambito linguistico e delle immagini e le sposta su ambiti socio-economico e della salute su cui di solito si usano modelli totalmente diversi”, spiega ancora Lepri. Il contributo di questa ricerca nel campo dell’intelligenza artificiale non si ferma però qui. La qualità delle predizioni ottenute con questo modello infatti “apre un grande scenario: spesso si dice che sistemi come ChatGPT hanno finito le informazioni linguistiche su cui addestrarsi, e tra poco finiranno le immagini e poi i video. Ma il mondo non è solamente i libri che sono stati scritti sul mondo, è anche la vita degli individui giorno per giorno. I dati noi li generiamo al di là degli scritti: li generiamo alzandoci la mattina, uscendo di casa, andando a fare la spesa. Quei dati potrebbero essere trattati in maniera simile, e diventare parte di un’unica descrizione di individui o di gruppi”. Non sfugge, ovviamente, che una simile opzione aprirebbe più di una questione su temi cruciali quali la privacy: “Questo potrebbe aprire a scenari anche un po’ dispotici, di invasione di privacy o sorveglianza dei singoli. Però ti dice che quello che funzionava sui dati linguistici può funzionare anche su dati molto differenti, e nessuno lo aveva fatto prima: non è un ‘gioco’, è un lavoro scientifico importante”.
leggi anche
Foto hard deepfake di Taylor Swift su X, allarme sui rischi dell'IA
Il complesso tema della privacy dei dati
È insomma necessario sottolineare come il tema della privacy non sia certo secondario, né per questa ricerca né per l’insieme dei lavori sull’intelligenza artificiale. Da parte loro, i ricercatori non vogliono che il loro lavoro venga utilizzato dagli assicuratori e per ora - riporta l’AGI - hanno tenuto nascosti l'algoritmo e i dati. Una delle crescenti preoccupazioni di Lehmann è proprio la privacy, ed ha sottolineato come grandi aziende stiano assemblando potenti macchine di previsione, utilizzando un'abbondanza di dati personali raccolti da Internet. “Questo problema esiste per tutti i modelli di intelligenza artificiale. Nel mondo del machine learning è da un po’ che è studiato”, aggiunge ancora Lepri. “Il problema di quanto i dati personali possono essere usati a fini negativi è da considerare per tutti i modelli di intelligenza artificiale, questo progetto te lo rende ancora più evidente perché per funzionare questo tipo di approccio ha bisogno per funzionare di tante informazioni che riguardano tanti individui. Però è da sottolineare che il problema dei dati personali nell’uso di algoritmi che hanno a che fare con predizione di outcome di caratteristiche personali è comune a tantissimi modelli”.
leggi anche
Torre Eiffel tra trattori e balle di fieno, ma foto è creata dall'AI
Life2vec funziona anche in Italia?
Resta infine una curiosità: una macchina addestrata con i dati del registro danese può essere usata anche in Italia? Oppure il differente contesto socio-economico-culturale può alterarne i risultati? “Per saperlo andrebbe provato”, conclude Lepri. “Ci sono due punti da considerare: il loro task predice se una persona può sopravvivere nei successivi anni dati tutti gli eventi che ha avuto, e questo è poco dipendente dal contesto culturale. Gli eventi sono eventi, che tu abbia avuto quella malattia o meno, o che tu abbia avuto quel lavoro o meno: certo alcuni dati contestuali cambierebbero, per esempio il salario” ma in generale “è meno dipendente dal contesto”. Invece “altro punto è la personalità, o altri aspetti più legati alla cultura, per esempio il successo lavorativo. Quanto questo può dipendere dal contesto? In questo caso tu hai degli eventi” ma magari “un evento che succede in Danimarca non è la stessa cosa che se ti accadesse in Italia, in questo caso gli esiti potrebbero essere più dipendenti dal contesto”. In generale “alcune cose della tua vita sono più legate a cosa ti accade, altre a come reagisci e al contesto in cui ti trovi: non tutti gli eventi hanno lo stesso effetto su tutte le persone”.