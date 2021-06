Vi siete mai chiesti come funziona la ricerca di Google? Cosa succede in quei brevissimo lasso di tempo dal momento in compiamo una ricerca al momento in cui ci vengono proposte milioni di risposte, ordinate per pertinenza? E, ancora, vi siete mai chiesti come fa Google a eliminare la maggior parte delle pagine web di spam e a restare sempre aggiornatissimo e al passo con i tempi? Il gigante della ricerca non potrà mai svelarci tutti i suoi segreti ma ha lanciato un’iniziativa chiamata “Come funziona la ricerca Google?” in cui attraverso pagine web e una serie di video ci svela i dietro le quinte di quella che è probabilmente la più grande “enciclopedia dello scibile umano” mai costruita. Per farla in breve, prendendo in prestito una frase di Lerry Page, uno dei fondatori di Google: come fa il motore di ricerca a “capire esattamente cosa intendi e a fornirti ciò che vuoi”?

La ricerca dalla A alla Z



Per ogni ricerca che eseguiamo sono milioni le pagine web che offrono risultati: come fare allora a ordinarle in maniera logica, fornendo prima le più pertinenti? Il lavoro non è svolto tutto sul momento, ma c’è dietro una grande organizzazione, quella che consente a Google di sistemare i contenuti in una sorta di mega-biblioteca ogni volta che ne nascono di nuovi. In particolare ogni giorno migliaia di software (chiamati “crawler”) analizzano la rete in maniera sistematica studiando i siti web, seguendo le pagine a caccia di nuovi contenuti, di aggiornamenti e anche di link obsoleti o non aggiornati da tempo. E così vanno a popolare un enorme archivio, l’indice di ricerca di Google, che contiene centinaia di miliardi di pagine web, con una dimensione che supera i 100 milioni di gigabyte. “Come l’indice di un libro - spiegano - con una voce per ogni parola visualizzata su ciascuna pagina web che indicizziamo”.

Gli algoritmi



Una volta costruito (e tenuto aggiornato) il mega-archivio manca però qualcosa che ordini tutte queste informazioni e le selezioni in base alle richieste degli utenti: questo è il compito dell’algoritmo di Google, che crea in tempo reale un “sistema di ranking”, una specie di classifica dei risultati più pertinenti. “Gli algoritmi di ricerca - spiegano nei video - prendono in esame diversi fattori tra cui le parole che sono state usate nella ricerca, la pertinenza e l’usabilità delle pagine, l’affidabilità delle fonti, la posizione geografica e le impostazioni”. Tra l’altro una cosa che in pochi sanno è che Google si avvale di migliaia di valutatori esterni della qualità della ricerca, presenti in ogni parte del mondo. E per far sì che le pagine migliori appaiano più in alto? Anche qui c’è un algoritmo in grado di creare una classifica partendo dalla “freschezza” dei contenuti, analizzando il numero di volte in cui un termine compare nella pagina fino anche alla leggibilità della pagina. Infine si guarda al contesto: utilizzando la nostra posizione Google sarà in grado, inserendo al esempio la parola “football” di restituirci informazioni sul football americano se ci troviamo negli Stati Uniti, sul calcio se ci troviamo a Londra. E a proposito di posizione geografica: la velocità di Google è dettata anche dal fatto che il gigante dei motori di ricerca ha data center sparsi in giro per il mondo: ognuno contiene una copia aggiornata dell’indice di ricerca, e quando compiamo una ricerca ci colleghiamo con quello più vicino.