Si tratta di una nuova applicazione che si propone di identificare i contenuti delle fotografie. E' stata creata da Stephen Wolfram, il matematico che ha ideato Wolfram Alpha, motore di ricerca che risponde alle domande degli utilizzatori
Qualche settimana fa Microsoft ha conquistato l'attenzione della Rete con “How old do I look?”, un'applicazione che prova a indovinare l'età di una persona ritratta in una foto. Il successo dell'iniziativa ha dimostrato come, dopo decenni di promesse, l'intelligenza artificiale stia cominciando a dare vita progetti che possono interessare anche il grande pubblico. E pazienza se non sono perfetti (e “How old do I look?” non lo è di certo), per incuriosire i non addetti ai lavori basta che gli algoritmi diano prova di essere ormai sufficientemente bravi in attività considerate specificamente umane.
Un'ulteriore conferma è arrivata pochi giorni fa quando è stato presentato ImageIdentify, un servizio web che promette di riconoscere i contenuti delle immagini caricate dagli utenti. Creato da Stephen Wolfram, il matematico che ha ideato Wolfram Alpha, motore di ricerca che risponde alle domande degli utilizzatori, il progetto si unisce ad una serie di iniziative simili lanciate in tempi recenti con lo stesso scopo: dimostrare che le macchine sono sempre più brave ad imitare alcuni aspetti dell'intelligenza degli uomini.
Prova ed errore - Per provare ImageIdentify, basta andare sul sito e caricare una fotografia a proprio piacimento oppure usare quelle già presenti sul sito. Dopo pochi secondi di elaborazione il sistema comunica il responso.
In certi casi, come con la fotografia di Alan Turing o quella di un lupo grigio messe a disposizione dal servizio stesso, la risposta risulta assai dettagliata, quasi enciclopedica. In altri, per esempio una scimmia scoiattolo trovata su Flickr, il responso è meno approfondito ma comunque pertinente visto che parla di “Scimma del nuovo mondo”. A volte però, come per la foto di un portiere di calcio (anche questa recuperata da Flickr), ImageIdentify sembra confondersi identificando semplicemente un “vestito”.
Tuttavia, è possibile aiutare il sistema a migliorare le proprie performance offrendo una valutazione della risposta e dando qualche suggerimento. Dopo tutto, l'applicazione si basa su un tipo di intelligenza artificiale chiamato “deep learning” in cui si mima il processo di apprendimento del cervello in modo che il sistema migliori man mano che viene nutrito di nuove informazioni, per esempio nuove immagini. In questo prospettiva, anche gli sbagli hanno una loro funzione, soprattutto se nell'errore il sistema dimostra, come scrive Stephen Wolfram sul suo blog, di essere in grado di “catturare con successo una parte del processo di identificazione delle immagini degli esseri umani”.
La concorrenza – Ma ImageIdentify non è il primo progetto che permette di provare sul campo un algoritmo simile. CloudSight, MetaMind, Clairfai, AlchemyApi di Ibm provano a fare la stessa cosa, alcuni cercando di identificare correttamente quanto ritratto in una foto, altri limitandosi a suggerire dei tag ovvero delle etichette che dovrebbero essere pertinenti. In certi casi le prestazioni sembrano migliori rispetto a quelle dell'ultimo arrivato.
MetaMind, per esempio, identifica correttamente la scimmia scoiattolo aggiungendo anche il nome della specie in latino, Saimiri Sciuresus. Per quanto riguarda l'immagine del portiere, ad avvicinarsi di più è AlchemyApi che suggerisce come etichette “sport” e “soccer”. Difficile per tutti, invece, riconoscere gli omini di un calcio balilla. Per ImageIdentify si tratta di un “dispositivo”, CloudSight, che sembra avvicinarsi più di tutti, dice “calcio rosso e nero gioco da tavolo”. Molto lontano MetaMind che opta per un “trapano elettrico”, mentre per Calirfai i tag adatti sono “competizione”, “calcio” e “attività ricreativa”. Infine Orbeus parla di “figurina” e AlchemyApi si limita ai generici “calcio” e “sport”.
Insomma, gli algoritmi fanno progressi ma si vede che non sono mai stati in una sala giochi.
Un'ulteriore conferma è arrivata pochi giorni fa quando è stato presentato ImageIdentify, un servizio web che promette di riconoscere i contenuti delle immagini caricate dagli utenti. Creato da Stephen Wolfram, il matematico che ha ideato Wolfram Alpha, motore di ricerca che risponde alle domande degli utilizzatori, il progetto si unisce ad una serie di iniziative simili lanciate in tempi recenti con lo stesso scopo: dimostrare che le macchine sono sempre più brave ad imitare alcuni aspetti dell'intelligenza degli uomini.
Prova ed errore - Per provare ImageIdentify, basta andare sul sito e caricare una fotografia a proprio piacimento oppure usare quelle già presenti sul sito. Dopo pochi secondi di elaborazione il sistema comunica il responso.
In certi casi, come con la fotografia di Alan Turing o quella di un lupo grigio messe a disposizione dal servizio stesso, la risposta risulta assai dettagliata, quasi enciclopedica. In altri, per esempio una scimmia scoiattolo trovata su Flickr, il responso è meno approfondito ma comunque pertinente visto che parla di “Scimma del nuovo mondo”. A volte però, come per la foto di un portiere di calcio (anche questa recuperata da Flickr), ImageIdentify sembra confondersi identificando semplicemente un “vestito”.
Tuttavia, è possibile aiutare il sistema a migliorare le proprie performance offrendo una valutazione della risposta e dando qualche suggerimento. Dopo tutto, l'applicazione si basa su un tipo di intelligenza artificiale chiamato “deep learning” in cui si mima il processo di apprendimento del cervello in modo che il sistema migliori man mano che viene nutrito di nuove informazioni, per esempio nuove immagini. In questo prospettiva, anche gli sbagli hanno una loro funzione, soprattutto se nell'errore il sistema dimostra, come scrive Stephen Wolfram sul suo blog, di essere in grado di “catturare con successo una parte del processo di identificazione delle immagini degli esseri umani”.
La concorrenza – Ma ImageIdentify non è il primo progetto che permette di provare sul campo un algoritmo simile. CloudSight, MetaMind, Clairfai, AlchemyApi di Ibm provano a fare la stessa cosa, alcuni cercando di identificare correttamente quanto ritratto in una foto, altri limitandosi a suggerire dei tag ovvero delle etichette che dovrebbero essere pertinenti. In certi casi le prestazioni sembrano migliori rispetto a quelle dell'ultimo arrivato.
MetaMind, per esempio, identifica correttamente la scimmia scoiattolo aggiungendo anche il nome della specie in latino, Saimiri Sciuresus. Per quanto riguarda l'immagine del portiere, ad avvicinarsi di più è AlchemyApi che suggerisce come etichette “sport” e “soccer”. Difficile per tutti, invece, riconoscere gli omini di un calcio balilla. Per ImageIdentify si tratta di un “dispositivo”, CloudSight, che sembra avvicinarsi più di tutti, dice “calcio rosso e nero gioco da tavolo”. Molto lontano MetaMind che opta per un “trapano elettrico”, mentre per Calirfai i tag adatti sono “competizione”, “calcio” e “attività ricreativa”. Infine Orbeus parla di “figurina” e AlchemyApi si limita ai generici “calcio” e “sport”.
Insomma, gli algoritmi fanno progressi ma si vede che non sono mai stati in una sala giochi.