Jak Google Goggles vyhrály a pak ztratily budoucnost fotoaparátu

, Author

Google představil Goggles jako veřejný produkt v prosinci 2009 na akci v Muzeu počítačové historie, které se nachází na konci ulice vedle kampusu Google v Mountain View. Předváděný produkt měl pouze několik funkcí: Dokázal identifikovat památky, umělecká díla a některé spotřební výrobky, ale jen málo dalších věcí. Společnost Google se k produktu stavěla opatrně i optimisticky. Byl součástí Google Labs, a dokonce i v nastavení aplikace bylo uvedeno, co všechno neumí. Ale všichni věděli, jaký je plán. „Google Goggles dnes funguje velmi dobře na určitých typech objektů v určitých kategoriích, ale naším cílem je, abychom časem dokázali vizuálně identifikovat jakýkoli obrázek,“ řekl Gundotra při představení. „Dnes musíte obrázek zarámovat a vyfotit, ale v budoucnu na něj budete moci jednoduše ukázat… a my s ním budeme moci zacházet jako s ukazatelem myši pro reálný svět. “

Vnitřně však tým stojící za Goggles zíral na dlouhý seznam problémů s touto technologií. Věděli, že budoucnost myšího ukazovátka je vzdálená několik let, pokud je vůbec možná. „Vždycky jsme věděli, že je to spíš výzkumný projekt,“ říká jeden z bývalých inženýrů. Dokonce i nejpokročilejší počítačové vidění bylo stále poměrně primitivní, a protože Google ještě nezačal hlouběji pracovat se strojovým učením a neuronovými sítěmi, jediné, co Goggles dokázal, bylo porovnávat vzorové fotografie s databází.

Některé problémy ani nebyly na Googlu, aby je řešil. Fotoaparáty chytrých telefonů ještě nebyly skvělé a lidé je neuměli příliš dobře používat. A i když lidé pořizovali dobré fotografie, často na nich byla spousta potenciálně zajímavých věcí; Google nemohl vědět, jestli vás na snímku zajímá strom, lavička, štěně nebo nápis. S identifikací věcí mohla pomoci technologie rozpoznávání textu, ale i ta byla zcela nová. Zakřivený nebo ručně psaný text představoval pro algoritmy výzvu, stejně jako model auta nebo jakýkoli jiný objekt identifikovatelný pouze na základě jemných rozdílů. Loga byla snadná, s rostlinami to bylo těžké. Čárové kódy byly jednoduché; zvířata byla nemožná. Dokonce i to, co fungovalo, trvalo přes 3G příliš dlouho.

Nejvíce frustrující bylo, že Google nedokázal použít ani to, co uměl nejlépe, tu nejterminátorštější funkci ze všech: rozpoznávání obličejů. „Pokud je na internetu šest nebo více vašich fotografií, které jsou dobře označené, a vy prostřednictvím našeho systému pořídíte sedmou fotografii, měli jste 90procentní pravděpodobnost, že správná odpověď bude v prvních deseti výsledcích vyhledávání,“ říká Nalawadi. Společnost Google však věděla, že nemůže tuto funkci zavádět v době, kdy se regulační orgány a spotřebitelé již začínají obávat toho, kolik toho o nich Google ví. Poškozeni spuštěním služby Google Buzz o několik měsíců dříve, která byla plná porušování soukromí, nechali rozpoznávání obličeje na podlaze ve střižně.

Obrázek může obsahovat: Člověk a Osoba
Jak vypadalo používání prvních verzí Google Goggles.

I když se tým potýkal s mnoha horskými úkoly, Google stále kázal evangelium Goggles. V létě 2010 Petrou přednesl na konferenci Hot Chips na Stanfordu hlavní projev, v němž představil ještě zajímavější vizi. Zhruba v polovině jinak hluboce technické přednášky Petrou přešel na slajd s názvem „Odbočka k rozšířené realitě“. Ukázalo se, že tým Goggles o rozšířené realitě už nějakou dobu přemýšlí. Napadlo je, že pokud by kamera dokázala porozumět tomu, co vidí, mohla by potenciálně do scény přidat další věci. Jeden z bývalých inženýrů vzpomínal, že experimentoval s tím, jak identifikovat věci v hledáčku, takže když vaším pohledem projede auto, mohla by ho následovat malá šipka AR s nápisem „Subaru“. Podobně si Petrou představoval uživatele, který stojí na slavném přechodu Abbey Road a sleduje, jak Beatles v AR znovu vytvářejí obal svého alba. Nebo v další myšlence inspirované Terminátorem přemýšlel o tom, jak zesílit určité věci ve vašem pohledu, jako byste používali termokameru.

Koncem téže přednášky Petrou přiznal to, co se stalo nejdůležitější otázkou, před níž Goggles stojí a která bude později trápit každou společnost, která na AR pracuje. Vystavil onen ikonický obrázek z filmu Wall-E, skupinu obézních lidí v uniformách sedících na židlích, popíjejících nápoje a zírajících na obrazovky. „Pokud je tohle naše budoucnost, pak možná AR není až tak důležitá,“ řekl Petrou. Rozšířená realita a vyhledávání obrázků mají význam pouze tehdy, pokud se lidé zajímají o svět kolem sebe, a každý trend trávení času u obrazovky říká, že se o něj zajímají stále méně.

Tým Goggles neustále hledal způsoby, jak přimět lidi, aby Goggles používali častěji. Z Goggles se stal řešitel sudoku, překladatelský nástroj a čtečka čárových kódů, to vše proto, aby měli lidé více důvodů se k aplikaci vracet. Petrou vzpomíná, že pracoval na funkci nazvané „virtuální graffiti“, kdy jste mohli kreslit v rozšířené realitě a nechat ji někde ostatním na očích. Tato funkce zní prakticky totožně s uměním v rozšířené realitě, které Facebook předvedl v roce 2017 pro svou platformu Facebook Camera. Google se k této myšlence dostal o několik let dříve, ale nikdy ji nedodal.

Tříštění skla

Google pokračoval ve vývoji Goggles, ale pokrok se brzy zastavil. Společnost slíbila plnohodnotnou verzi Goggles pro iPhone, ale nakonec ji vložila do aplikace Google – a pak tuto funkci rychle odstranila. Po roce 2011 společnost Google o funkci Googles téměř nemluvila. V roce 2012 společnost vývoj víceméně ukončila.

Většina lidí, se kterými jsem mluvil, měla různé názory na to, co Goggles zničilo. Jeden člen týmu říká, že nakonec viděli limity technologie a prostě to vzdali. Jiný říká, že lidem se ještě nelíbila představa, že budou neustále chodit s fotoaparátem v ruce. Ale byla tu ještě jedna věc, jediná, kterou všichni zmínili a která může být viníkem.

V roce 2011 podala společnost Google patentovou přihlášku na „displej umístěný na hlavě, který zobrazuje vizuální reprezentaci fyzické interakce se vstupním rozhraním mimo zorné pole“. To je spousta slov, ale obrázek vypovídal o všem: Byly to brýle Google Glass. Název na patentu? David Petrou.

Catalin Voss a jeho Google Glass
Google Glass slibovaly všechny funkce Goggles, a to přímo před vašima očima.

Ariel Zambelich/WIRED

Petrou říká, že „jsme nikdy nezpochybňovali mobilní telefony“ jako užitečné místo pro vizuální vyhledávání, ale jiní říkají, že tým Goggles vždy věděl, že smartphony nejsou ideální zařízení pro jejich technologii. Nakonec usoudili, že uživatelé budou raději mít gadget, který nemusí držet v ruce nebo spravovat; brýle dávají smysl. (Kontakty se zdály být ještě lepší.) Všechny tyto technologie se však zdály být vzdálené několik let a vyžadovaly by velký skok ve výpočetním výkonu, účinnosti baterie a připojení k internetu. Na chytrých telefonech se pracovalo dál, protože chytré telefony fungovaly.

Na praktičnosti však nezáleželo všem. Jeden bývalý člen týmu Goggles mi řekl, že vedoucím pracovníkům Googlu se Goggles zčásti líbily prostě proto, že to bylo „svižné demo“. Tehdejší spoluředitelé Larry Page a Sergey Brin podle tohoto člověka rádi ukazovali Goggles lidem, protože to bylo nové, šikovné a futuristické. Když přišly Glass, které slibovaly nejen vyhledávání pomocí kamery, ale zcela nový druh zařízení a platformy, Goggles ve srovnání s nimi bledly. „Byla to ještě svižnější ukázka,“ říká bývalý inženýr.

Skutečně, Glass byly vychvalovány daleko více než jakýkoli jiný produkt Googlu předtím nebo potom. Brin přerušil hlavní projev na konferenci Google I/O v roce 2012 právě včas, aby mohl sledovat, jak parašutisté s brýlemi Glass padají vzduchem, přistávají na střeše konferenčního centra a vjíždějí na kolech BMX do sálu. V pozoruhodném videu nazvaném „Jednoho dne…“. Google ukázal, jak by mohl vypadat život s brýlemi Glass. Brin dokonce vzal Glass na konferenci TED v roce 2013 a vášnivě obhajoval budoucnost, v níž gadgety uvolňují oči, ruce a uši, místo aby je zabíraly. Glass nabízely ucelený a lákavý pohled na budoucnost a inspirovaly mnohé uvnitř i vně společnosti Google. Nehledě na to, že tato technologie ve skutečnosti nefungovala.

Podle Nalawadiho „myslím, že se hybná síla přesunula k projektu Glass“. Několik zaměstnanců Goggles dokonce přešlo pracovat do týmu. Jiní odešli jinam: do Map, na YouTube, do Google Now. Někteří odešli ze společnosti Google úplně. V určitém okamžiku se Goggles prostě přestaly používat. V polovině roku 2014 už nikdo nezbyl ani na aktualizaci aplikace pro Android.

Zpět tam, kde jsme začali

Právě ve chvíli, kdy se Google vzdal práce na Goggles, začaly v této myšlence vidět hodnotu další společnosti. Snapchat byl spuštěn v roce 2011 jako nástroj pro posílání mizejících zpráv, ale rychle se ujaly fotoaparáty chytrých telefonů jako výkonná platforma. Pinterest se opíral o přeměnu obrázků na vyhledávací dotazy; připněte si židli, která se vám líbí, a Pinterest vám pomůže vyzdobit váš dům. Pro Apple, Facebook a další se rozšířená realita posunula od sci-fi nemožnosti k produktu blízké budoucnosti.

Až v rámci Googlu se základní technologie nehodlala promarnit. Ve skutečnosti se zdokonalovala rychleji než kdykoli předtím. „Díky hlubokému učení jsme zaznamenali velký skok ve funkčnosti,“ říká Aparna Chennapragada, vedoucí produktová ředitelka ve společnosti Google. „Stejný skok ve funkčnosti, jaký jsme zaznamenali u hlasu, jsme začali pozorovat i u vyhledávání obrázků.“ Díky investicím do čipů s umělou inteligencí a přechodu celé společnosti Google na myšlení založené na umělé inteligenci se výsledky zlepšily a zrychlily1. První výsledek tohoto posunu: Fotky Google s výkonným vyhledáváním a asistenčními schopnostmi. (Zde se Google konečně dočkal i zavedení rozpoznávání obličejů.)

Po všech těch letech se podařilo vyřešit většinu toho, co Goggles brzdilo. Fotoaparáty chytrých telefonů jsou vynikající, stejně jako senzory pro sběr kontextu, jako jsou gyroskopy a GPS, které pomáhají ukotvit polohu uživatele ve světě. Výsledkem je, že miliardy uživatelů spokojeně otevírají svůj telefon desítkykrát denně, aby sdíleli vzpomínky, zachycovali účtenky, živě vysílali události a ukládali si věci, které si chtějí později zapamatovat. Technologie back-endu je rychlejší, rozhraní front-endu jsou jednodušší. Obličejové počítače zatím nikdo nenosí, ale uživatelům nevadí, že to dělají na svých telefonech.

Obrázek může obsahovat: Matt Vokoun, ředitel produktového managementu ve společnosti Google, a. s., v současné době působí v oblasti elektroniky, monitoru, displeje, obrazovky, člověka, osoby, kabátu, oblečení, pláště, oděvu a obleku, představuje Google Lens na akci k uvedení produktu na trh 4. října 2017 v San Francisku v Kalifornii. ELIJAH NOUVELAGE/AFP/Getty Images

To vše pomáhá vysvětlit, co se stalo v květnu 2017, kdy generální ředitel společnosti Google Sundar Pichai vystoupil na pódium vývojářské konference I/O a oznámil… V podstatě opět brýle. Jenže tentokrát se jmenují Lens. „Google Lens je soubor výpočetních schopností založených na vidění, které dokáží pochopit, na co se díváte, a pomáhají vám na základě těchto informací podnikat kroky,“ řekl Pichai. Uvedl ukázky: rozpoznání druhu květiny nebo automatické připojení k Wi-Fi pouhým vyfocením uživatelského jména a hesla. Zatím to vypadá, že Goggles. Včetně toho, že nic z toho, co fungovalo v tomto videu, nebude v dohledné době možné ve skutečném produktu. Právě teď Lens dělá totéž, co Goggles v roce 2010, jen mnohem rychleji.

Je snadné přemýšlet, jestli Google nepromarnil několikaletý náskok v přemýšlení o tom, jak by lidé mohli chtít používat jeho fotoaparát. Několik lidí ve společnosti pochopilo, že uživatelé možná jednou budou chtít prozkoumávat svět prostřednictvím displeje svého telefonu. Možná budou chtít na něco namířit telefon, aby to lépe pochopili, a možná budou chtít překrýt digitální svět s tím fyzickým. Google to možná věděl první, ale ostatní ho předběhli v závodě o vytvoření něčeho, co by zaujalo srdce a mysl uživatelů.

Přesto, i když Google mohl být na večírku dříve, stále není pozdě. Google má skutečně obrovský soubor vnitřních výhod, od znalostí vyhledávacího stroje až po dlouhou historii shromažďování a personalizace dat. A Google se při experimentu s brýlemi Goggles poučil. Tentokrát nebude Lens samostatnou aplikací. Místo toho bude tato technologie procházet mnoha produkty společnosti Google. Pomůže vám získat telefonní čísla nebo informace o restauraci z jakéhokoli snímku v aplikaci Fotky Google. Brzy se stane součástí Asistenta Google, který vám pomůže vyhledat cokoli, co potřebujete, jakýmkoli způsobem. Místo toho, aby Google vytvořil aplikaci, kterou možná nikdy neotevřete, dává Lens všude, kde už jste, s nadějí, že ji objevíte a budete používat.

Google dal jasně najevo, že Lens je pro společnost dlouhodobá sázka a platforma pro spoustu případů použití. Pichai přirovnal Lens k počátkům Googlu, jak bylo vyhledávání možné jen díky tomu, že Google rozuměl webovým stránkám. Nyní se učí rozumět světu. Můžete se vsadit, že až se příště Google pokusí nasadit počítač na váš obličej, Lens bude u toho. To bude pěkná ukázka.

1UPDATE: Tento článek nyní přesně odráží, které části investic společnosti Google do umělé inteligence přímo přispěly k jejím projektům vizuálního vyhledávání.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.