I 50 libri usati per "addestrare" ChatGpt: da Harry Potter a 1984

Tecnologia

Insieme a un team di colleghi il ricercatore David Bamman dell'Università di Berkley in California ha scoperto quali testi sono stati fatti "leggere" al chatbot

ascolta articolo

Da Harry Potter a 1984, passando per Via col Vento e Beloved del premio Nobel per la letteratura Toni Morrison. Sono stati utilizzati 50 libri, tra cui molti classici della fantascienza e del fantasy, per addestrare il modello di intelligenza artificiale di ChatGpt. A scoprirlo, in maniera del tutto casuale, il ricercatore David Bamman, dell'Università di Berkley in California.

Lo studio

Il ricercatore, che ha come oggetto del suo studio l'estrazione di dati dalla letteratura classica su argomenti come le relazioni tra i vari personaggi di un romanzo, era al lavoro sul capolavoro di Jane Austen Orgoglio e Pregiudizio, quando ha deciso di girare i suoi interrogativi a ChatGpt. Il softwareha fornito risposte precise, ma non c'era modo di capire come il chatbot avesse quelle nozioni, poichè i meccanismi interni dei grandi modelli linguistici sono una scatola nera. Così Bamman e il suo team hanno interrogato ChatGpt sulla conoscenza di vari libri e hanno dato un punteggio per ognuno. Più alto era il punteggio, più era probabile che quel libro facesse parte del set di dati del software. Poi hanno messo insieme le loro scoperte in una ricerca, di cui dà notizia il sito Business Insider.

An illustration picture shows the login page of ChatGPT, an interactive AI chatbot model trained and developed by OpenAI, on its website in Beijing, China, 09 March 2023. ANSA/WU HAO

leggi anche

ChatGpt, l'app su iPhone arriva anche in Italia

I libri conosciuti da ChatGpt

L'elenco dei 50 romanzi che hanno contribuito ad addestrare ChatGpt comprende classici come Moby Dick, La lettera scarlatta, Il colore viola, Quel che resta del giorno e Furore. Ma i libri con la percentuale di conoscenza più alta da parte del modello di IA sono libri di fantascienza e fantasy. In cima alla lista ci sono Harry Potter e la pietra filosofale di J.K.Rowling e 1984 di George Orwell; a seguire testi che hanno fatto la storia come Il Signore degli Anelli, Fahrenheit 451, Il mondo nuovo ma anche Neuromante di William Gibson e Il cacciatore di androidi di Philip K. Dick. E ancora Il Trono di spade, Guida galattica per autostoppisti, il Codice da Vinci. Nella lista dei libri assimiliati da ChatGpt ci sono anche un paio di romanzi della saga di 007 di Ian Fleming. "Le fonti su cui sono stati addestrati questi modelli di intelligenza artificiale influenzeranno il tipo di modelli stessi e i valori che presentano", ha dichiarato Bamman: "Cosa succede quando un bot divora narrativa su tutti i tipi di mondi oscuri e distopici? In che modo questo genere può influenzare il comportamento di questi modelli in modi che non riguardano cose letterarie o narrative? C'è molto lavoro da fare in questo senso. Non abbiamo ancora la risposta a questa domanda", ha concluso il ricercatore.

ameca_video_sky_tg24

leggi anche

Intelligenza artificiale, l'umanoide Ameca "riflette" e disegna. VIDEO

Tecnologia: I più letti