Come Google Goggles ha vinto, e poi perso, il futuro della camera-first

, Author

Google ha lanciato Goggles come prodotto pubblico nel dicembre del 2009, in un evento al Computer History Museum in fondo alla strada del campus di Mountain View di Google. Il prodotto demo aveva solo alcune caratteristiche: Poteva identificare punti di riferimento, opere d’arte e alcuni prodotti di consumo, ma poco altro. Google ha proiettato sia cautela che ottimismo sul prodotto. Faceva parte dei Google Labs, e anche nella configurazione dell’app ti diceva tutte le cose che non poteva fare. Ma tutti conoscevano il piano. “Google Goggles oggi funziona molto bene su certi tipi di oggetti in certe categorie, ma il nostro obiettivo è quello di essere in grado di identificare visivamente qualsiasi immagine nel tempo”, ha detto Gundotra al lancio. “Oggi devi inquadrare un’immagine e scattare una foto, ma in futuro sarai semplicemente in grado di indicarla… e saremo in grado di trattarla come un puntatore del mouse per il mondo reale. “

Internamente, però, il team dietro Goggles stava fissando una lunga lista di problemi con la tecnologia. Sapevano che il futuro del mouse-pointer era lontano anni, sempre che fosse possibile. “Abbiamo sempre saputo che era più un progetto di ricerca”, dice un ex ingegnere. Anche la visione del computer più avanzata era ancora abbastanza primitiva, e poiché Google non aveva ancora iniziato a lavorare a fondo con l’apprendimento automatico e le reti neurali, tutto ciò che Goggles poteva fare era confrontare una foto con un database.

Alcuni dei problemi non erano nemmeno da risolvere per Google. Le fotocamere degli smartphone non erano ancora ottime, né la gente era molto brava a usarle. E anche quando la gente scattava buone foto, c’erano spesso molte cose potenzialmente interessanti; Google non poteva sapere se ti interessava l’albero, la panchina, il cucciolo o il cartello nel tuo scatto. La tecnologia di riconoscimento del testo poteva aiutare a identificare le cose, ma anche questo era nuovo di zecca. Il testo curvo o scritto a mano sfidava gli algoritmi, così come un modello di auto o qualsiasi altro oggetto identificabile solo da sottili differenze. I loghi erano facili, le piante erano difficili. I codici a barre erano semplici; gli animali erano impossibili. Anche le cose che funzionavano richiedevano troppo tempo su 3G.

Più frustrante, Google non poteva nemmeno usare la cosa che faceva meglio, la caratteristica più Terminator di tutte: il riconoscimento facciale. “Se ci sono sei o più foto di te su internet che sono ben etichettate, e tu attraverso il nostro sistema fai una settima foto, avevi il 90% di probabilità che la risposta giusta fosse nei primi dieci risultati di ricerca”, dice Nalawadi. Ma Google sapeva che non poteva lanciare la funzione in un momento in cui i regolatori e i consumatori stavano già iniziando a preoccuparsi di quanto Google sapeva di loro. Sfregiati dal lancio di Google Buzz pochi mesi prima, che era stato pieno di violazioni della privacy, hanno lasciato il riconoscimento facciale sul pavimento della stanza di taglio.

L'immagine può contenere: Umano, e Persona
Come sembrava usare le prime versioni di Google Goggles.

Anche se la squadra ha martellato sui molti compiti montagnosi, Google ha continuato a predicare il vangelo di Goggles. Nell’estate del 2010, Petrou ha tenuto un discorso alla conferenza Hot Chips a Stanford, in cui ha esposto una visione ancora più emozionante. Circa a metà di un discorso altrimenti profondamente tecnico, Petrou è passato a una diapositiva chiamata “Digressione nella realtà aumentata”. Il team di Goggles stava pensando all’AR da un po’, si è scoperto. Hanno pensato che se la fotocamera potesse capire ciò che stava vedendo, potrebbe potenzialmente aggiungere più cose nella scena. Un ex ingegnere ha ricordato di aver sperimentato come identificare le cose all’interno del mirino, in modo che quando una macchina passava attraverso la vista, una piccola freccia AR che diceva “Subaru” poteva seguire l’auto. Petrou, allo stesso modo, ha immaginato un utente in piedi sulle famose strisce pedonali di Abbey Road e guardando i Beatles ricreare la copertina del loro album in AR. Oppure, in un altro pensiero ispirato a Terminator, ha pensato a come amplificare certe cose nella vista come se si stesse usando una telecamera termica.

Verso la fine di quello stesso discorso, Petrou ha riconosciuto quella che è diventata la domanda più importante di Goggles, che sarebbe venuta ad affliggere ogni azienda che ha lavorato su AR in seguito. Ha messo l’immagine iconica di Wall-E, un gruppo di obesi in uniforme seduti sulle sedie, sorseggiando bevande e fissando gli schermi. “Se questo è il nostro futuro, allora forse l’AR non è così importante”, ha detto Petrou. La realtà aumentata e la ricerca di immagini contano solo se le persone si preoccupano del mondo che le circonda, e ogni tendenza del tempo dello schermo dice che lo sono sempre meno.

Il team di Goggles ha cercato costantemente modi per far sì che le persone usino Goggles più spesso. Goggles è diventato un risolutore di Sudoku, uno strumento di traduzione e uno scanner di codici a barre, tutto per dare alle persone più motivi per tornare all’app. Petrou ricorda di aver lavorato su una funzione chiamata “Virtual Graffiti”, dove si poteva disegnare in AR e lasciarlo da qualche parte per gli altri. La funzione suona praticamente identica all’arte in realtà aumentata che Facebook ha mostrato per la sua piattaforma Facebook Camera nel 2017. Google è stato anni prima all’idea, ma non l’ha mai spedita.

Glass Shattering

Google ha continuato a sviluppare Goggles, ma i progressi si sono presto arenati. L’azienda aveva promesso una versione completa di Goggles per iPhone, ma alla fine lo inserì nell’app di Google–e poi rimosse rapidamente la funzione. Google ha parlato a malapena di Googles dopo il 2011. Nel 2012, l’azienda aveva più o meno chiuso lo sviluppo.

La maggior parte delle persone con cui ho parlato aveva idee diverse su ciò che ha ucciso Goggles. Un membro del team dice che alla fine hanno visto i limiti della tecnologia e hanno rinunciato. Un altro dice che la gente non era ancora a suo agio con l’idea di andare in giro con la macchina fotografica alzata per tutto il tempo. Ma c’era un’altra cosa, l’unica che tutti hanno menzionato, che potrebbe essere il colpevole.

Nel 2011, Google ha presentato una domanda di brevetto per un “head-mounted display che visualizza una rappresentazione visiva di interazione fisica con un’interfaccia di input al di fuori del campo visivo”. Sono un sacco di parole, ma l’immagine raccontava la storia: Erano i Google Glass. Il nome sul brevetto? David Petrou.

Catalin Voss e i suoi Google Glass
Google Glass prometteva tutte le caratteristiche di Goggles, proprio davanti ai tuoi occhi.

Ariel Zambelich/WIRED

Petrou dice che “non abbiamo mai messo in discussione i telefoni cellulari” come luogo utile per la ricerca visiva, ma altri dicono che il team di Goggles ha sempre saputo che gli smartphone non erano i dispositivi ideali per la loro tecnologia. Alla fine, hanno pensato, gli utenti preferirebbero avere un gadget che non devono tenere in mano o gestire; un paio di occhiali aveva senso. (Tutta quella tecnologia sembrava lontana anni, però, e avrebbe richiesto grandi salti nella potenza di elaborazione, nell’efficienza della batteria e nella connettività Internet. Hanno continuato a lavorare sugli smartphone perché gli smartphone funzionavano.

Ma la praticità non era importante per tutti. Un ex membro del team di Goggles mi ha detto che in parte, ai dirigenti di Google piaceva Goggles semplicemente perché era “una demo strabiliante”. Allora i co-CEO Larry Page e Sergey Brin amavano mostrare Goggles alle persone, questa persona ha detto, perché era nuovo, elegante e futuristico. Quando arrivò Glass, che prometteva non solo una ricerca con fotocamera, ma un intero nuovo tipo di dispositivo e piattaforma, Goggles impallidì in confronto. “Era una demo ancora più stravagante”, dice l’ex ingegnere.

Infatti, Glass è stato propagandato ben oltre qualsiasi altro prodotto di Google prima o dopo. Brin ha interrotto un discorso chiave alla conferenza Google I/O nel 2012, giusto in tempo per vedere i paracadutisti con i Glass cadere in aria, atterrare sul tetto del centro conferenze e guidare le biciclette BMX nell’auditorium. In un video straordinario intitolato “Un giorno…” Google ha mostrato come potrebbe essere una vita con i Glass. Brin ha persino portato Glass alla conferenza TED nel 2013, sostenendo con passione un futuro in cui i gadget liberano gli occhi, le mani e le orecchie piuttosto che occuparli. Glass ha offerto una visione completa e allettante del futuro, e ha ispirato molti dentro e fuori Google. Non importa che la tecnologia non funzionasse veramente.

Presto, dice Nalawadi, “Penso che lo slancio si sia spostato sul progetto Glass”. Alcuni dipendenti di Goggles sono persino andati a lavorare nel team. Altri sono andati altrove: a Maps, a YouTube, a Google Now. Alcuni hanno lasciato Google del tutto. Ad un certo punto, Goggles semplicemente non era più una cosa. A metà del 2014, nessuno era rimasto nemmeno per aggiornare l’applicazione Android.

Da dove abbiamo iniziato

Proprio quando Google ha rinunciato a Goggles, altre aziende hanno iniziato a vedere il valore dell’idea. Snapchat è stata lanciata nel 2011 come uno strumento per inviare messaggi a scomparsa, ma ha rapidamente abbracciato le fotocamere degli smartphone come una potente piattaforma. Pinterest si basava sul trasformare le immagini in query di ricerca; appuntate una sedia che vi piace, e Pinterest vi aiuterà a decorare la vostra casa. Per Apple, Facebook e altri, la realtà aumentata è passata dall’impossibilità fantascientifica al prodotto del futuro prossimo.

Anche all’interno di Google, la tecnologia di base non stava andando sprecata. Infatti, stava migliorando più velocemente che mai. “Abbiamo avuto questo grande salto di funzione a causa dell’apprendimento profondo”, dice Aparna Chennapragada, un direttore senior del prodotto a Google. “Lo stesso salto di funzione che abbiamo ottenuto con la voce, abbiamo iniziato a vederlo nella ricerca di immagini”. Grazie al suo investimento in chip AI, e al passaggio di Google in tutta l’azienda al pensiero AI, i risultati sono migliorati e sono migliorati più rapidamente1. Il primo risultato del cambiamento: Google Photos, con le sue potenti capacità di ricerca e assistenza. (Qui Google è finalmente riuscito a lanciare il suo riconoscimento facciale, anche.)

Dopo tutti questi anni, la maggior parte di ciò che ha trattenuto Goggles è stato risolto. Le fotocamere degli smartphone sono eccellenti, così come i sensori che raccolgono il contesto, come giroscopi e GPS, che aiutano ad ancorare la posizione dell’utente nel mondo. Come risultato, miliardi di utenti aprono felicemente il loro telefono decine di volte al giorno per condividere ricordi, catturare ricevute, eventi live-stream e salvare cose da ricordare in seguito. La tecnologia back-end è più veloce, le interfacce front-end sono più facili. Nessuno indossa ancora i face-puter, ma agli utenti non dispiace farlo sui loro telefoni.

L'immagine può contenere: Elettronica, Monitor, Display, Schermo, Umano, Persona, Cappotto, Abbigliamento, Soprabito, Abbigliamento e Abito
Matt Vokoun, Direttore del Product Management di Google, Inc, presenta Google Lens durante un evento di lancio del prodotto il 4 ottobre 2017 a San Francisco, California.

ELIJAH NOUVELAGE/AFP/Getty Images

Tutto ciò aiuta a spiegare cosa è successo nel maggio del 2017, quando il CEO di Google Sundar Pichai è salito sul palco della conferenza degli sviluppatori I/O e ha annunciato… Di nuovo Goggles, in pratica. Solo che questa volta si chiama Lens. “Google Lens è un insieme di abilità informatiche basate sulla visione che possono capire ciò che stai guardando e aiutarti a intraprendere azioni basate su quelle informazioni”, ha detto Pichai. Ha dato dimostrazioni: identificare un tipo di fiore, o connettersi automaticamente al Wi-Fi solo prendendo una foto del nome utente e la password. Finora, così Goggles. Compreso il fatto che nessuno di ciò che ha funzionato in quel video sarebbe possibile nel prodotto reale in qualsiasi momento presto. In questo momento, Lens fa le stesse cose che Goggles faceva nel 2010, solo molto più velocemente.

È facile chiedersi se Google ha sprecato un vantaggio di anni nel pensare a come le persone potrebbero voler usare la loro fotocamera. Poche persone nell’azienda hanno capito che gli utenti potrebbero un giorno voler esplorare il mondo attraverso lo schermo del loro telefono. Potrebbero voler puntare il loro telefono verso qualcosa per capirlo meglio, e potrebbero voler sovrapporre il mondo digitale a quello fisico. Google può averlo saputo per primo, ma altri lo hanno battuto nella corsa a costruire qualcosa che ha catturato i cuori e le menti degli utenti.

Ancora, anche se Google avrebbe potuto essere prima alla festa, non è ancora tardi. Google ha una serie enorme di vantaggi intrinseci, dalla sua conoscenza del motore di ricerca alla sua lunga storia di raccolta e personalizzazione dei dati. E Google ha imparato alcune lezioni nell’esperimento Goggles. Questa volta, Lens non sarà un’app indipendente. Invece, la tecnologia passerà attraverso molti prodotti Google. Ti aiuta a prendere numeri di telefono o informazioni sul ristorante da qualsiasi scatto in Google Photos. Presto sarà parte di Google Assistant, aiutandoti a cercare qualsiasi cosa di cui hai bisogno in qualsiasi modo tu voglia. Piuttosto che fare un’app che potresti non aprire mai, Google sta mettendo Lens ovunque tu sia già, con la speranza che tu lo scopra e lo usi.

Google ha chiarito che Lens è una scommessa a lungo termine per la società, e una piattaforma per molti casi d’uso. Pichai ha paragonato Lens agli inizi di Google, come la ricerca era possibile solo perché Google capiva le pagine web. Ora, sta imparando a capire il mondo. Potete scommettere che la prossima volta che Google cercherà di mettervi un computer in faccia, Lens sarà lì. Sarà una bella dimostrazione.

1 AGGIORNAMENTO: Questo pezzo ora riflette accuratamente quali parti degli investimenti AI di Google hanno contribuito direttamente ai suoi progetti di ricerca visiva.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.