How Google Goggles Won, Then Lost, the Camera-First Future

Google launched Goggles as a public product in December of 2009, at an event at the Computer History Museum down the street from Google’s Mountain View campus. O produto demoed tinha apenas algumas características: Podia identificar pontos de referência, obras de arte e alguns produtos de consumo, mas pouco mais. O Google projetou tanto cautela quanto otimismo sobre o produto. Fazia parte do Google Labs e, mesmo na configuração do aplicativo, dizia todas as coisas que não conseguia fazer. Mas todos conheciam o plano. “O Google Goggles hoje funciona muito bem em certos tipos de objetos em certas categorias, mas é nosso objetivo ser capaz de identificar visualmente qualquer imagem ao longo do tempo”, disse Gundotra no lançamento. “Hoje você tem que emoldurar uma imagem e tirar uma foto, mas no futuro você simplesmente poderá apontar para ela… e nós poderemos tratá-la como um ponteiro do mouse para o mundo real”. “

Internamente, no entanto, a equipa por detrás do Goggles estava a olhar para uma longa lista de problemas com a tecnologia. Eles sabiam que o futuro do mouse-pointer estava anos fora, se isso fosse sequer possível. “Sempre soubemos que era mais como um projeto de pesquisa”, diz um ex-engenheiro. Mesmo a visão computacional mais avançada ainda era bastante primitiva, e como o Google ainda não tinha começado a trabalhar profundamente com a aprendizagem de máquinas e redes neurais, tudo o que o Goggles podia fazer era comparar uma foto padrão com uma base de dados.

Alguns dos problemas nem sequer eram do Google para resolver. As câmeras Smartphone ainda não eram ótimas, nem as pessoas eram muito boas em usá-las. E mesmo quando as pessoas tiravam boas fotos, havia muitas coisas potencialmente interessantes nelas; o Google não podia saber se você se importava com a árvore, o banco, o cachorro ou o sinal na sua foto. A tecnologia de reconhecimento de texto podia ajudar a identificar as coisas, mas mesmo isso era novidade. O texto curvo ou escrito à mão desafiava os algoritmos, assim como um modelo de carro ou qualquer outro objeto identificável apenas por diferenças sutis. Os logotipos eram fáceis; as plantas eram difíceis. Os códigos de barras eram simples; os animais eram impossíveis. Mesmo as coisas que funcionavam demoravam muito mais do que 3G.

Mais frustrante, o Google não conseguia nem usar o que fazia melhor, o recurso mais extravagante de todos: o reconhecimento facial. “Se há seis ou mais fotos suas na internet que estão bem marcadas, e você através do nosso sistema tira uma sétima foto, você tinha 90% de probabilidade da resposta certa estar nos primeiros dez resultados de busca”, diz Nalawadi. Mas o Google sabia que não podia lançar a funcionalidade numa altura em que os reguladores e os consumidores já estavam a começar a preocupar-se com o quanto o Google sabia sobre eles. Assustados com o lançamento do Google Buzz alguns meses antes, que estava repleto de violações de privacidade, eles deixaram o reconhecimento facial no chão da sala de corte.

Image pode conter: Human, and Person — O que parecia ser usar as primeiras versões do Google Goggles.

1051>Even enquanto a equipe martelava nas muitas tarefas montanhosas, o Google continuava pregando o evangelho dos Goggles. No verão de 2010, Petrou fez uma palestra na conferência Hot Chips em Stanford, na qual ele apresentou uma visão ainda mais emocionante. Mais ou menos na metade de uma palestra profundamente técnica, Petrou virou para um slide chamado “Digressão em Realidade Aumentada”. A equipa dos Óculos de Proteção estava a pensar na RA há algum tempo, afinal. Eles acharam que se sua câmera pudesse entender o que estava vendo, ela poderia potencialmente adicionar mais coisas à cena. Um antigo engenheiro lembrou-se de experimentar como identificar coisas dentro do seu visor, para que quando um carro passasse pela sua visão, uma pequena seta de AR que dizia “Subaru” pudesse seguir o carro. Petrou, da mesma forma, imaginou um usuário parado na famosa faixa de pedestres da Abbey Road e vendo os Beatles recriarem a capa do seu álbum no AR. Ou, em outro pensamento inspirado no Terminator, ele pensou em como ampliar certas coisas em sua visão como se você estivesse usando uma câmera térmica.

Toward o final dessa mesma conversa, Petrou reconheceu o que veio a ser a questão mais importante enfrentada pelos Goggles, que viria a atormentar todas as empresas que trabalharam no AR mais tarde. Ele colocou aquela imagem icônica de Wall-E, um bando de obesos uniformizados sentados em cadeiras, bebericando bebidas e olhando para os telões. “Se este é o nosso futuro, então talvez AR não seja tão importante assim”, disse Petrou. Realidade aumentada e busca de imagens só importam se as pessoas se importam com o mundo ao seu redor, e cada tendência do tempo de tela diz que elas estão cada vez menos.

A equipe de óculos de proteção procurou constantemente por maneiras de fazer com que as pessoas usassem os óculos de proteção com mais freqüência. Os óculos de proteção tornaram-se um solver Sudoku, uma ferramenta de tradução, e um leitor de código de barras, tudo para dar às pessoas mais razões para voltar ao aplicativo. Petrou se lembra de trabalhar em um recurso chamado “Virtual Graffiti”, onde você poderia desenhar no AR e deixá-lo em algum lugar para que outros se lembrem. O recurso soa praticamente idêntico à arte da realidade aumentada que o Facebook exibiu para a sua plataforma de câmera do Facebook em 2017. O Google foi anos antes da idéia, mas nunca a enviou.

Glass Shattering

Google continuou a desenvolver óculos de proteção, mas o progresso logo parou. A empresa tinha prometido uma versão completa dos óculos de proteção para iPhone, mas eventualmente inseriu-a no aplicativo do Google – e depois removeu rapidamente o recurso. O Google mal falou sobre o Googles depois de 2011. Em 2012, a empresa tinha mais ou menos encerrado o desenvolvimento.

A maioria das pessoas com quem falei tinha ideias diferentes sobre o que matou os Goggles. Um membro da equipe diz que eventualmente viu os limites da tecnologia e simplesmente desistiu. Outro diz que as pessoas ainda não estavam confortáveis com a idéia de andar por aí segurando a câmera o tempo todo. Mas havia uma outra coisa, a única que todos mencionaram, que pode ser a culpada.

Em 2011, o Google apresentou um pedido de patente para um “display montado na cabeça que exibe uma representação visual da interação física com uma interface de entrada fora do campo de visão”. Isso é um monte de palavras, mas a imagem contou a história: Era o Google Glass. O nome na patente? David Petrou.

Catalin Voss e seu Google Glass — Google Glass prometeu todas as características dos Goggles, bem na frente de seus olhos.

Ariel Zambelich/WIRED

Petrou diz que “nunca questionamos os celulares” como um lugar útil para a busca visual, mas outros dizem que a equipe de Goggles sempre soube que os smartphones não eram os dispositivos ideais para sua tecnologia. Eventualmente, eles acharam que os usuários preferiam ter um gadget que não precisassem segurar ou gerenciar; um par de óculos fazia sentido. (Os contatos pareciam ainda mais legais.) Mas toda essa tecnologia parecia estar a anos de distância e exigiria grandes saltos no poder de processamento, na eficiência da bateria e na conectividade com a Internet. Eles continuaram trabalhando em smartphones porque os smartphones funcionavam.

Mas a praticidade não importava para todos. Um ex-membro da equipe Goggles me disse que em parte, os executivos do Google gostavam dos Goggles simplesmente porque era “uma demonstração de whizzy”. Depois os co-CEOs Larry Page e Sergey Brin adoraram mostrar os Goggles às pessoas, disse essa pessoa, porque era novo, elegante e futurista. Quando Glass apareceu, prometendo não apenas uma busca por câmera, mas todo um novo tipo de dispositivo e plataforma, os Óculos de Proteção ficaram paralisados em comparação. “Foi uma demonstração ainda mais animada”, diz o engenheiro anterior.

Indeed, Glass foi tocado muito além de qualquer outro produto Google antes ou depois. Brin interrompeu um discurso de abertura na conferência I/O do Google em 2012, mesmo a tempo de ver paraquedistas de vidro caírem pelo ar, pousarem no telhado do centro de conferências e pedalarem bicicletas BMX até ao auditório. Em um vídeo notável intitulado “Um dia…” o Google mostrou como poderia ser uma vida com um “Glass-augmented”. Brin até levou Glass para a conferência do TED em 2013, argumentando apaixonadamente por um futuro onde os aparelhos libertam os olhos, as mãos e os ouvidos em vez de os ocupar. Glass ofereceu uma visão completa e sedutora do futuro, e inspirou muitos dentro e fora do Google. Esqueça que a tecnologia não funcionou realmente.

Pretty rapidamente, Nalawadi diz, “Eu acho que o impulso mudou para projetar Glass”. Alguns empregados da Goggles até foram trabalhar na equipa. Outros foram para outro lugar: para o Maps, para o YouTube, para o Google Now. Alguns deixaram o Google por completo. A certa altura, os óculos de proteção não era mais uma coisa. Em meados de 2014, ninguém mais foi deixado para sequer atualizar o aplicativo Android.

Back Where We Started

Direito como o Google desistiu dos Goggles, outras empresas começaram a ver valor na idéia. Snapchat lançado em 2011 como uma ferramenta para enviar mensagens de desaparecimento, mas rapidamente abraçou as câmeras smartphone como uma plataforma poderosa. O Pinterest se inclinou para transformar imagens em consultas de busca; fixe uma cadeira que você gosta, e o Pinterest o ajudou a decorar sua casa. Para a Apple, Facebook e outros, a realidade aumentada mudou da impossibilidade de ficção científica para um produto quase futuro.

Even dentro do Google, a tecnologia subjacente não ia desperdiçar. Na verdade, ela estava melhorando mais rápido do que nunca. “Tivemos este grande salto de função por causa do aprendizado profundo”, diz Aparna Chennapragada, um diretor sênior de produto no Google. “O mesmo salto de step-function que tivemos com a voz, começamos a ver na pesquisa de imagens.” Graças ao seu investimento em chips de IA, e à mudança de pensamento da Google para a IA, os resultados melhoraram e melhoraram mais rapidamente1. O primeiro resultado da mudança: Google Photos, com as suas poderosas capacidades de pesquisa e assistência. (Aqui, o Google finalmente conseguiu também lançar seu reconhecimento facial.)

Após todos esses anos, a maior parte do que reteve os óculos de proteção foi resolvida. As câmeras Smartphone são excelentes, assim como os sensores coletores de contexto como giroscópios e GPS que ajudam a ancorar a posição de um usuário no mundo. Como resultado, bilhões de usuários abrem seus telefones alegremente dezenas de vezes por dia para compartilhar memórias, capturar recibos, eventos ao vivo e salvar coisas para lembrar mais tarde. A tecnologia back-end é mais rápida, as interfaces front-end são mais fáceis. Ninguém está usando face-puters ainda, mas os usuários não se importam de fazê-lo em seus telefones.

Image pode conter: Eletrônicos, Monitor, Tela, Tela, Humano, Pessoa, Casaco, Roupa, Sobrecapa, Roupa e Terno — Matt Vokoun, Diretor de Gerenciamento de Produtos da Google, Inc., apresenta o Google Lens num evento de lançamento de produtos a 4 de Outubro de 2017 em São Francisco, Califórnia.

ELIJAH NOUVELAGE/AFP/Getty Images

Tudo o que ajuda a explicar o que aconteceu em Maio de 2017, quando o CEO do Google, Sundar Pichai, subiu ao palco na conferência de desenvolvimento I/O e anunciou… Óculos de proteção novamente, basicamente. Só que desta vez se chama Lente. “O Google Lente é um conjunto de habilidades de computação baseada em visão que pode entender o que você está olhando, e ajudá-lo a agir com base nessas informações”, disse Pichai. Ele deu demonstrações: identificando um tipo de flor, ou conectando-se automaticamente ao Wi-Fi apenas tirando uma foto do nome de usuário e da senha. Até agora, óculos de proteção. Incluindo o fato de que nada do que funcionava naquele vídeo seria possível no produto real a qualquer momento. Neste momento, o Lens faz o mesmo que o Goggles fez em 2010, apenas muito mais rápido.

É fácil perguntar se o Google desperdiçou uma vantagem de muitos anos ao pensar em como as pessoas poderiam querer usar sua câmera. Algumas pessoas na empresa entenderam que os usuários poderiam algum dia querer explorar o mundo através da tela do seu telefone. Talvez queiram apontar o seu telefone para algo que o compreenda melhor, e talvez queiram sobrepor o mundo digital ao mundo físico. O Google pode tê-lo conhecido primeiro, mas outros o venceram na corrida para construir algo que capturou os corações e mentes dos usuários.

Pouco, mesmo que o Google pudesse ter sido mais cedo para a festa, ainda não é tarde. O Google tem um enorme conjunto de vantagens intrínsecas, desde o seu conhecimento do motor de busca até à sua longa história de recolha e personalização de dados. E o Google aprendeu algumas lições na experiência dos Óculos de Proteção. Desta vez, a Lente não será uma aplicação autónoma. Em vez disso, a tecnologia vai passar por muitos produtos Google. Ele ajuda você a obter números de telefone ou informações de restaurantes a partir de qualquer foto no Google Photos. Em breve, fará parte do Google Assistant, ajudando-o a pesquisar o que precisar, da maneira que quiser. Em vez de fazer um aplicativo que você pode nunca abrir, o Google coloca Lente em qualquer lugar que você já esteja, com a esperança de que você a descubra e use.

Google’s deixou claro que Lente é uma aposta de longo prazo para a empresa, e uma plataforma para muitos casos de uso. Pichai comparou a Lente com os inícios do Google, como a pesquisa só era possível porque o Google entendia as páginas web. Agora, está a aprender a compreender o mundo. Você pode apostar que da próxima vez que o Google tentar colocar um computador na sua cara, a Lente estará lá. Isso fará uma grande demonstração.

1UPDATE: Esta peça agora reflete com precisão quais partes dos investimentos em IA do Google contribuíram diretamente para seus projetos de busca visual.