How Google Goggles Won, Then Lost, the Camera-First Future

Google a lansat Goggles ca produs public în decembrie 2009, în cadrul unui eveniment desfășurat la Muzeul de Istorie a Calculatoarelor, în josul străzii de la campusul Google din Mountain View. Produsul demonstrat avea doar câteva caracteristici: Putea identifica repere, opere de artă și unele produse de consum, dar nu prea multe altele. Google a manifestat atât prudență, cât și optimism cu privire la acest produs. Acesta făcea parte din Google Labs și, chiar și în configurația aplicației, vă spunea toate lucrurile pe care nu le putea face. Dar toată lumea cunoștea planul. „Google Goggles funcționează astăzi foarte bine pe anumite tipuri de obiecte din anumite categorii, dar obiectivul nostru este să putem identifica vizual orice imagine în timp”, a declarat Gundotra la lansare. „Astăzi trebuie să încadrați o imagine și să faceți o fotografie, dar în viitor veți putea pur și simplu să o arătați cu degetul… și vom putea să o tratăm ca pe un pointer de mouse pentru lumea reală. „

La nivel intern, însă, echipa din spatele Goggles se confrunta cu o listă lungă de probleme legate de această tehnologie. Ei știau că viitorul mouse-pointer era departe de ani de zile, dacă era măcar posibil. „Am știut întotdeauna că era mai degrabă un proiect de cercetare”, spune un fost inginer. Chiar și cea mai avansată viziune computerizată era încă destul de primitivă și, din moment ce Google nu începuse încă să lucreze în profunzime cu învățarea mecanică și rețelele neuronale, tot ce putea face Goggles era să compare o fotografie cu o bază de date.

Câteva dintre probleme nici măcar nu erau de rezolvat de către Google. Camerele foto ale smartphone-urilor nu erau încă grozave și nici oamenii nu se pricepeau prea bine să le folosească. Și chiar și atunci când oamenii făceau fotografii bune, existau adesea o mulțime de lucruri potențial interesante în ele; Google nu putea să știe dacă vă interesa copacul, banca, cățelul sau semnul din fotografie. Tehnologia de recunoaștere a textului putea ajuta la identificarea lucrurilor, dar chiar și asta era ceva nou. Textul curbat sau scris de mână a pus la încercare algoritmii, la fel ca și un model de mașină sau orice alt obiect identificabil doar prin diferențe subtile. Logourile erau ușoare; plantele erau dificile. Codurile de bare erau simple; animalele erau imposibile. Chiar și lucrurile care funcționau pur și simplu durau prea mult timp prin 3G.

Cel mai frustrant, Google nu a putut folosi nici măcar lucrul la care se pricepea cel mai bine, caracteristica cea mai Terminatoriană dintre toate: recunoașterea facială. „Dacă există șase sau mai multe poze cu tine pe internet care sunt bine etichetate, iar tu, prin sistemul nostru, faci o a șaptea poză, aveai o probabilitate de 90 la sută ca răspunsul corect să fie în primele zece rezultate ale căutării”, spune Nalawadi. Dar Google știa că nu putea lansa această funcție într-un moment în care autoritățile de reglementare și consumatorii începuseră deja să se îngrijoreze cu privire la cât de multe știe Google despre ei. Cicatrizată de lansarea Google Buzz cu câteva luni mai devreme, care fusese plină de încălcări ale confidențialității, au lăsat recunoașterea facială pe planșa de tăiere.

Imaginea poate conține: Human, și Person — Cum arăta utilizarea primelor versiuni ale Google Goggles.

Încă în timp ce echipa se chinuia să rezolve numeroasele sarcini muntoase, Google a continuat să propovăduiască evanghelia Goggles. În vara anului 2010, Petrou a ținut un discurs la conferința Hot Chips de la Stanford, în care a expus o viziune și mai interesantă. Aproximativ la jumătatea unui discurs de altfel profund tehnic, Petrou a trecut la o diapozitivă intitulată „Digresiune în realitatea augmentată”. S-a dovedit că echipa Goggles se gândea de ceva vreme la AR. Ei s-au gândit că, dacă aparatul foto ar putea înțelege ceea ce vede, ar putea adăuga mai multe lucruri în scenă. Un fost inginer și-a amintit că a experimentat cum să identifice lucruri în interiorul vizorului, astfel încât, atunci când o mașină trecea prin fața ta, o mică săgeată AR pe care scria „Subaru” ar putea să o urmeze. Petrou, de asemenea, și-a imaginat un utilizator stând pe faimoasa trecere de pietoni Abbey Road și urmărindu-i pe cei de la Beatles recreând coperta albumului lor în AR. Sau, într-un alt gând inspirat de Terminator, el s-a gândit cum să amplifice anumite lucruri din vedere ca și cum ai folosi o cameră termică.

Cu puțin mai târziu, spre finalul aceleiași discuții, Petrou a recunoscut ceea ce a ajuns să fie cea mai importantă întrebare cu care se confruntă Goggles, care avea să afecteze fiecare companie care a lucrat ulterior la AR. El a pus acea imagine iconică din Wall-E, o grămadă de oameni obezi îmbrăcați în uniformă, așezați pe scaune, sorbind băuturi și holbându-se la ecrane. „Dacă acesta este viitorul nostru, atunci poate că AR nu este atât de importantă”, a spus Petrou. Realitatea augmentată și căutarea de imagini contează doar dacă oamenilor le pasă de lumea din jurul lor, iar fiecare tendință a timpului petrecut în fața ecranului spune că sunt din ce în ce mai puțini.

Echipa Goggles a căutat în mod constant modalități de a-i face pe oameni să folosească Goggles mai des. Goggles a devenit un rezolvator de Sudoku, un instrument de traducere și un scaner de coduri de bare, toate pentru a le oferi oamenilor mai multe motive să se întoarcă la aplicație. Petrou își amintește că a lucrat la o funcție numită „Virtual Graffiti”, prin care puteai să desenezi în AR și să o lași undeva unde alții să se gândească. Funcția sună practic identic cu arta de realitate augmentată pe care Facebook a prezentat-o pentru platforma sa Facebook Camera în 2017. Google a fost cu câțiva ani mai devreme la această idee, dar nu a livrat-o niciodată.

Glass Shattering

Google a continuat să dezvolte Goggles, dar progresul s-a oprit în curând. Compania a promis o versiune completă a Goggles pentru iPhone, dar în cele din urmă a introdus-o în aplicația Google – și apoi a eliminat rapid funcția. Google a vorbit cu greu despre Googles după 2011. Până în 2012, compania a oprit mai mult sau mai puțin dezvoltarea.

Majoritatea oamenilor cu care am vorbit aveau idei diferite despre ceea ce a ucis Goggles. Un membru al echipei spune că în cele din urmă au văzut limitele tehnologiei și au renunțat pur și simplu. Un altul spune că oamenii nu se simțeau încă confortabil cu ideea de a se plimba cu camera ridicată tot timpul. Dar a mai fost un lucru, singurul pe care toată lumea l-a menționat, care ar putea fi vinovatul.

În 2011, Google a depus o cerere de brevet pentru un „afișaj montat pe cap care afișează o reprezentare vizuală a interacțiunii fizice cu o interfață de intrare în afara câmpului vizual”. Sunt o grămadă de cuvinte, dar imaginea a spus povestea: Era vorba de Google Glass. Numele de pe brevet? David Petrou.

Catalin Voss și al său Google Glass — Google Glass promitea toate caracteristicile lui Goggles, chiar în fața ochilor tăi.

Ariel Zambelich/WIRED

Petrou spune că „nu am pus niciodată la îndoială telefoanele mobile” ca fiind un loc util pentru căutarea vizuală, dar alții spun că echipa Goggles a știut întotdeauna că smartphone-urile nu erau dispozitivele ideale pentru tehnologia lor. În cele din urmă, și-au dat seama că utilizatorii ar prefera să aibă un gadget pe care nu trebuie să îl țină în mână sau să îl gestioneze; o pereche de ochelari avea sens. (Lentilele de contact păreau chiar mai cool.) Toată această tehnologie părea totuși la ani distanță și ar fi necesitat salturi mari în ceea ce privește puterea de procesare, eficiența bateriei și conectivitatea la internet. Au continuat să lucreze la smartphone-uri pentru că smartphone-urile funcționau.

Dar caracterul practic nu a contat pentru toată lumea. Un fost membru al echipei Goggles mi-a spus că, în parte, directorilor de la Google le-a plăcut Goggles pur și simplu pentru că era „o demonstrație șmecherească”. Această persoană a spus că atunci co-directorilor executivi Larry Page și Sergey Brin le plăcea să arate Goggles oamenilor, pentru că era ceva nou, ingenios și futurist. Când a apărut Glass, care promitea nu doar căutarea cu ajutorul camerei, ci și un nou tip de dispozitiv și platformă, Goggles a pălit în comparație. „A fost o demonstrație și mai șmecherească”, spune fostul inginer.

De fapt, Glass a fost promovat cu mult peste orice alt produs Google înainte sau după aceea. Brin a întrerupt un discurs la conferința Google I/O din 2012, la timp pentru a vedea parașutiștii purtători de Glass căzând prin aer, aterizând pe acoperișul centrului de conferințe și intrând cu bicicletele BMX în auditoriu. Într-un videoclip remarcabil intitulat „Într-o zi…” Google a arătat cum ar putea arăta o viață augmentată de Glass. Brin chiar a dus Glass la conferința TED din 2013, susținând cu pasiune un viitor în care gadgeturile îți eliberează ochii, mâinile și urechile în loc să le ocupe. Glass a oferit o viziune completă și ispititoare asupra viitorului și a inspirat multe persoane din interiorul și din afara Google. Nu contează că tehnologia nu a funcționat cu adevărat.

Prea repede, spune Nalawadi, „cred că impulsul s-a mutat către proiectul Glass”. Câțiva angajați ai Goggles chiar au mers să lucreze în echipă. Alții au plecat în altă parte: la Maps, la YouTube, la Google Now. Unii au părăsit Google cu totul. La un moment dat, Goggles pur și simplu nu a mai existat. Până la jumătatea anului 2014, nimeni nu a mai rămas nici măcar să actualizeze aplicația pentru Android.

Înapoi de unde am pornit

Chiar când Google a renunțat la Goggles, alte companii au început să vadă valoarea ideii. Snapchat s-a lansat în 2011 ca un instrument pentru trimiterea de mesaje care dispar, dar a îmbrățișat rapid camerele smartphone-urilor ca o platformă puternică. Pinterest s-a bazat pe transformarea imaginilor în interogări de căutare; fixați un scaun care vă place, iar Pinterest v-a ajutat să vă decorați casa. Pentru Apple, Facebook și alții, realitatea augmentată a trecut de la imposibilitatea științifică la un produs al viitorului apropiat.

Chiar și în cadrul Google, tehnologia de bază nu se risipea. De fapt, aceasta se îmbunătățea mai repede ca niciodată. „Am avut acest salt mare pas-funcțional din cauza învățării profunde”, spune Aparna Chennapragada, un director senior de produs la Google. „Același salt funcțional pe care l-am obținut cu vocea, am început să-l vedem și în căutarea de imagini.” Mulțumită investiției sale în cipuri de inteligență artificială și a trecerii la nivelul întregii companii Google la gândirea de inteligență artificială, rezultatele au devenit mai bune și s-au îmbunătățit mai rapid1. Primul rezultat al acestei schimbări: Google Photos, cu capacitățile sale puternice de căutare și de asistare. (Aici, Google a reușit în sfârșit să își lanseze și recunoașterea facială.)

După toți acești ani, cea mai mare parte a ceea ce a ținut Goggles pe loc a fost rezolvată. Camerele smartphone-urilor sunt excelente, la fel ca și senzorii de colectare a contextului, cum ar fi giroscoapele și GPS-ul, care ajută la ancorarea poziției unui utilizator în lume. Drept urmare, miliarde de utilizatori își deschid cu plăcere telefonul de zeci de ori pe zi pentru a împărtăși amintiri, a captura chitanțe, a transmite în direct evenimente și a salva lucruri pentru a le ține minte mai târziu. Tehnologia back-end este mai rapidă, interfețele front-end sunt mai ușoare. Nimeni nu poartă încă chip-puteri, dar pe utilizatori nu-i deranjează să o facă pe telefoanele lor.

Imaginea poate conține: Electronică, Monitor, Monitor, Afișaj, Ecran, Om, Persoană, Haină, Îmbrăcăminte, Palton, Îmbrăcăminte și Costum — Matt Vokoun, director de management al produselor la Google, Inc., prezintă Google Lens în cadrul unui eveniment de lansare a produsului, la 4 octombrie 2017, în San Francisco, California.

ELIJAH NOUVELAGE/AFP/Getty Images

Toate acestea ajută la explicarea a ceea ce s-a întâmplat în luna mai a anului 2017, când directorul general al Google, Sundar Pichai, a urcat pe scenă la conferința pentru dezvoltatori I/O și a anunțat… Ochelarii din nou, practic. Doar că de data aceasta se numește Lens. „Google Lens este un set de abilități de calcul bazate pe viziune care pot înțelege la ce vă uitați și vă ajută să acționați pe baza acestor informații”, a spus Pichai. El a oferit demonstrații: identificarea unui tip de floare sau conectarea automată la Wi-Fi doar făcând o fotografie cu numele de utilizator și parola. Până acum, Goggles. Inclusiv faptul că nimic din ceea ce a funcționat în acel videoclip nu va fi posibil în produsul real prea curând. În momentul de față, Lens face aceleași lucruri pe care Goggles le făcea în 2010, doar că mult mai rapid.

Este ușor să ne întrebăm dacă Google a irosit un avantaj de ani de zile în a se gândi la modul în care oamenii ar putea dori să își folosească camera. Câteva persoane din cadrul companiei au înțeles că utilizatorii ar putea dori într-o zi să exploreze lumea prin ecranul telefonului lor. Aceștia ar putea dori să îndrepte telefonul spre ceva pentru a-l înțelege mai bine și ar putea dori să suprapună lumea digitală peste cea fizică. Este posibil ca Google să fi știut primul, dar alții l-au învins în cursa pentru a construi ceva care să cucerească inimile și mințile utilizatorilor.

Cu toate acestea, chiar dacă Google ar fi putut ajunge mai devreme la petrecere, tot nu este târziu. Google are un set uriaș de avantaje intrinseci, de la cunoștințele sale în materie de motoare de căutare până la istoricul său îndelungat de colectare și personalizare a datelor. Iar Google a învățat câteva lecții din experimentul Goggles. De data aceasta, Lens nu va fi o aplicație de sine stătătoare. În schimb, tehnologia va trece prin multe produse Google. Aceasta vă ajută să obțineți numere de telefon sau informații despre restaurante din orice fotografie din Google Photos. În curând, va face parte din Google Assistant, ajutându-vă să căutați orice aveți nevoie în orice mod doriți. În loc să creeze o aplicație pe care s-ar putea să nu o deschideți niciodată, Google pune Lens peste tot unde sunteți deja, cu speranța că o veți descoperi și o veți folosi.

Google a spus clar că Lens este un pariu pe termen lung pentru companie și o platformă pentru o mulțime de cazuri de utilizare. Pichai a comparat Lens cu începuturile Google, cu modul în care căutarea a fost posibilă doar pentru că Google a înțeles paginile web. Acum, acesta învață să înțeleagă lumea. Puteți paria că data viitoare când Google va încerca să vă pună un computer pe față, Lens va fi acolo. Va fi o demonstrație pe cinste.

1UPDATE: Această piesă reflectă acum cu exactitate care părți ale investițiilor Google în inteligența artificială au contribuit direct la proiectele sale de căutare vizuală.