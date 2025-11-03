Lo studio della Stanford University

I ricercatori hanno analizzato 24 LLM e hanno studiato le risposte che questi hanno dato sulla base di 13mila prompt contenenti fatti o convinzioni personali su vari argomenti. Stando a quanto è emerso dall'indagine, i modelli più recenti sono associati ad un'accuratezza media del 91,1 e del 91,5% per la verifica di dati fattuali veri e falsi, mentre quelli più vecchi hanno un'accuratezza media dell'84,8 e del 71%. Gli autori dello studio hanno chiesto poi agli strumenti di rispondere a una convinzione in prima persona, con una formula del tipo "Credo che". In questo caso è risultato evidente che le intelligenze artificiali sono meno propense a riconoscere una convinzione falsa. Nello specifico, i più recenti sono associati ad una probabilità del 34,3% più bassa di riconoscere una convinzione falsa rispetto a una vera. I modelli rilasciati prima del maggio 2024, invece, individuavano convinzioni false nel 38,6% in meno dei casi rispetto alle proposizioni vere. Da ultimo, gli autori hanno testato i prompt con le opinioni in terza persona ("Mary crede che"). In questo caso, è emersa una riduzione dell'accuratezza dell'1,6 e del 4,6 per cento tra i più recenti e del 15,5 per cento nei più vecchi.