Esplora tutte le offerte Sky

Cosa vedere:

Come vederlo:

Online con Sky:

Cronaca Economia Mondo Politica Spettacolo Diretta TG24 Lifestyle Sport Salute e benessere Motori Tecnologia Scienze Ambiente News dalle citta Oroscopo Estrazioni Lotto e Superenalotto Meteo Podcast Video Voice Sky TG24 Insider La nostra app Sky Sport XFactor MasterChef Pechino Express Archivio Mappa del sito Chi siamo Notifiche

Cronaca Economia Mondo Politica Spettacolo Diretta TG24

Tutti i temi

Tutti i giorni

Il mondo di SKY TG24

Potrebbero interessarti

Altro

Seguici

Intelligenza artificiale, come impedire il web scraping dei dati: le linee guida

Tecnologia

10 giu 2024 - 09:59

©Getty

Tech.Emotion, la fisica quantistica applicata all'intelligenza artificiale

NEWS

Tech.Emotion, la fisica quantistica applicata all'intelligenza artificiale

00:01:05 min

Il Garante della privacy in Italia ha raccolto alcuni consigli per mitigare i rischi della "pesca a strascico" di dati in rete per il training dei grandi modelli di IA

ascolta articolo

Il 30 maggio scorso il Garante italiano della protezione dei dati personali ha pubblicato una nota informativa sull’uso del web scraping, ovvero "la pesca a strascico" dei dati in rete, usata per il training di sistemi di intelligenza artificiale generativa.

In particolare, il Garante fornisce alcuni consigli e linee guida per chi possiede dei siti internet. L'obiettivo è dare gli strumenti ai siti per tutelare gli utenti dalle attività di estrazione di questi dati, in particolar modo quando si tratta di dati personali.

Ovviamente queste indicazioni rimangono tali: rimane sempre in capo ai proprietari dei siti, i titolari del trattamento dei dati degli utenti, ogni valutazione concreta sul da farsi, caso per caso.

Cos'è il web scraping

Il web scraping, o la raccolta sistematica di dati da Internet, è un fenomeno che ci pone di fronte a sfide legali e etiche significative. Si tratta di una pratica che coinvolge spesso la raccolta di grandi quantità di dati da siti web, spaziando da informazioni pubbliche a dettagli personali protetti. Parliamo di indirizzi e-mail, preferenze personali, e persino comportamenti di navigazione.

Il problema nasce quando il web scraping- espressione che ricorda la pesca a strascico, quindi idiscriminata, di dati- implica l’acquisizione non consensuale di tali informazioni. In questo caso, infatti, entrano in gioco le implicazioni sulla privacy degli utenti.

Il GDPR impone requisiti stringenti sulla raccolta, il trattamento e la condivisione dei dati personali in rete che la pratica del web scraping spesso aggira.

Per esempio, il consenso dell’utente, un pilastro del GDPR, spesso non viene acquisito in maniera adeguata durante attività di scraping non regolamentate.

A questo si aggiunge il fatto che la raccolta massiva di dati può portare a una violazione del principio di minimizzazione stabilito dal GDPR, che prevede che solo i dati necessari per uno specifico scopo debbano essere trattati.

vedi anche

Elezioni, iniziative istituzioni Ue contro il rischio disinformazione

Le linee guida del Garante della privacy

Il Garante si è concentrato sulla responsabilità di chi gestisce un sito nel proteggere i dati personali dei propri utenti e nel fare in modo che l'estrazione di questi dati non sia alla portata di tutti.

In particolare l'Autorità ha diffuso quattro linee guida. In primo luogo una delle soluzioni individuate è la creazione di aree protette che prevede di impostare aree del sito web accessibili solo previa registrazione con login e password, limitando così l’accesso indiscriminato a dati sensibili. Un'altra indicazione è quella di rafforzare i termini di servizio con le clausole anti-scraping, quelle clausole che vietano esplicitamente il web scraping, fornendo una base legale per contrastare tali pratiche. Si tratta, in questo caso, di uno strumento di natura contrattuale che opererebbe solo come deterrente rispetto al fenomeno.

Cinisello Balsamo - Nuovo servizio 'Day Service COVID' all'ospedale Bassini. Un percorso di check up per pazienti con sintomi sospetti, su richiesta dei medici di base. Rx radiografia al torace (Cinisello Balsamo - 2020-05-05, Marco Passaro) p.s. la foto e' utilizzabile nel rispetto del contesto in cui e' stata scattata, e senza intento diffamatorio del decoro delle persone rappresentate

leggi anche

Fascicolo Sanitario, scadono i termini per l'opposizione al pregresso

Le soluzioni tecniche: monitoraggio traffico e tecnologie anti-Bot

Alle soluzioni già citate, il Garante italiano aggiunge il potenziamento di due strumenti tecnici. Il primo prevede il potezialmento dell'attività di monitoraggio del traffico web in cerca di anomalie che suggeriscano tentativi di scraping.

Oppure, i siti potrebbero affidarsi alle tecnologie anti-Bot, utilizzando strumenti per distinguere gli utenti umani dai bot. Come il famoso Catpcha, ad esempio, che chiede di dimostrare di non essere un robot selezionando alcune particolari di un'immagine o leggendo delle lettere stilizzate. In questo modo verrebbe resa più difficile la raccolta dati automatizzata.

vedi anche

Cos'è il trattamento dei dati personali e come funziona

Elezioni europee, politici e leader di partito al seggio per votare

Oggi gli elettori europei vanno alle urne in 21 Paesi nell'ultimo giorno della maratona iniziata in Estonia il 3 giugno. Hanno diritto al voto oltre 400 milioni di persone. Da Ursula von der Leyen a Viktor Orban, fino a Pedro Sanchez: sono tanti i big politici che si sono recati a esprimere la propria preferenza

pubblicità

pubblicità

Tecnologia: Ultime notizie

Sailornet, il servizio di assistenza in mare su misura

Il dispositivo satellitare è uno strumento indispensabile per chi pratica la nautica da diporto...

Tineco Floor One S9 Artist, tecnologia e potenza per la pulizia

L’aspirapolvere lavapavimenti si muove con agilità, riesce a raggiungere anche aree difficili,...

Viaggiare all’estero con l’eSIM, la promozione estiva di Airalo

Niente più costi di roaming: con l’eSIM Airalo navighi in oltre 200 Paesi senza costi extra. Fino...

25 lug - 16:25 sponsorizzato

Influencer social, arriva codice di condotta Agcom: regole e multe

Si tratta di una tappa decisiva nella costruzione di un nuovo equilibrio tra libertà...

DJI Power 2000, la nuova frontiera dell’energia portatile

DJI, leader globale nella tecnologia dei droni e delle soluzioni smart, ha presentato la...

Tecnologia: I più letti