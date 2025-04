Il traffico su Wikipedia è aumentato del 50% in un anno, ma non per l’interesse degli utenti: a generarlo sono i bot che scaricano immagini, testi e video per addestrare i modelli di Intelligenza artificiale. La Wikimedia Foundation segnala un incremento dei costi e studia contromisure

L’inarrestabile avanzata dell’Intelligenza artificiale mette in difficoltà perfino Wikipedia . La nota enciclopedia online è infatti sotto pressione, con infrastrutture sempre più affaticate da un aumento record del traffico: +50% in un solo anno. Un incremento che non è frutto della curiosità degli utenti, ma che si deve all'ascesa dell’Intelligenza artificiale generativa. A rivelarlo è Wikimedia Foundation, l’organizzazione che gestisce Wikipedia. Il risultato è un’impennata nei costi e una gestione tecnica sempre più complessa.

Non utenti, ma bot: cosa succede su Wikipedia



Secondo Wikimedia Foundation, la crescita di accessi è direttamente collegata ai “crawler”, ossia i programmi automatizzati che estraggono contenuti multimediali dai siti web per addestrare i modelli di Ia, sfruttando l’enorme archivio di immagini, video e testi dell’enciclopedia. Un'operazione lecita quando si tratta di Wikipedia, che ospita file liberi da copyright, ma non esente da conseguenze. "La nostra infrastruttura è costruita per sostenere picchi di traffico improvvisi durante eventi di grande interesse”, ha spiegato Wikimedia Foundation in un post sul suo blog ufficiale, "ma la quantità di traffico generata dai bot è senza precedenti e presenta rischi e costi crescenti".



Carico extra per i server



Wikipedia fornisce contenuti ai suoi utenti tramite una rete globale di data center. Quando un articolo è molto richiesto, il sistema lo conserva nel data center più vicino all'utente. Ma mentre gli utenti si concentrano su temi specifici, i "crawler" accedono a un'ampia gamma di articoli in blocco, inclusi file, immagini e video poco richiesti. Questo comporta un maggiore dispendio di risorse per Wikimedia, che deve rendere disponibile un archivio maggiore, a costi più elevati per il suo data center centrale. La fondazione evidenzia, inoltre, quanto sia importante che chi utilizza i contenuti di Wikipedia citi sempre la fonte al fine di incentivare nuovi utenti a partecipare e contribuire. "I nostri contenuti sono gratuiti”, ma “la nostra infrastruttura no”, ha ricordato Wikimedia.

Le contromisure allo studio

Per affrontare il fenomeno, Wikimedia Foundation sta valutando l’adozione di nuove misure. Tra le possibili soluzioni allo studio ci sono sistemi di attribuzione più rigorosi e la definizione di linee guida chiare su come i contenuti dell’enciclopedia possano essere usati nell’addestramento dei modelli di Intelligenza artificiale.

ISCRIVITI AL CANALE WHATSAPP DI SKY TG24