A regra de Pareto e as máquinas de busca

A declaração recente da Marissa Mayer, “Vice President of Search Product and User Experience at Google”, de que o Google já resolveu 90% do problema de busca, mas que os 10% ainda vão dar um bom trabalho, incomodou muita gente na webosfera.

Prá quem não conhece a moça, Marissa é certamente uma das executivas mais importantes da indústria atualmente, e talvez um dos pontos máximos que um profissional de usabilidade almejaria hoje em dia.

O que há por trás dessa declaração? Bem, podemos desfilar vários aspectos interessantes aqui.

Uma delas é que frequentemente, no desenvolvimento de software, fala-se sempre da regra do 80/20 ou a Regra de Pareto, que originalmente falava que 80% das consequências vinham de 20% das causas. Mas claro que a proporção foi ganhando outros usos, como “80% do desenvolvimento leva 20% do tempo e os 20% restantes levam os outros 80% do tempo”.

Em bom e claro Português, “o diabo vive nos detalhes” :-)

De fato, muito da busca na web chegou a um nível de refinamento e desempenho formidáveis, mas o que significa dizer que 80% ou 90% do problema já está resolvido? E é neste pé que os críticos da web resolveram pegar para criticar o argumento da Marissa.

Segundo a techcrunch por exemplo, o que resta das coisas a serem indexadas e buscadas ainda é muito grande. Ainda não temos resultados satisfatórios GENÉRICOS para buscas semânticas, buscas em imagens, buscas em filmes, e muitos et ceteras.

Podemos dizer, certamente, que existe um grande potencial em buscas de imagens, por exemplo, em contextos restritos, e este é um mercado que deve crescer rapida e intensamente nos próximos anos. Mas se você quer buscar pela foto do gato com o cachorro, a menos que vc tenha intervenções humanas de forma inteligente, não se resolveu ainda o problema computacional de definir o que é exatamente um cachorro. Mas se você souber formatos de armas, talvez consiga localizar, com algum bom grau de precisão, armas num recinto por exemplo.

E aí podemos estender para as buscas em linguagem natural e etc, e a conclusão é: ainda tem muito terreno a ser caminhado neste aspecto, e isso significa, em termos de inovação, que há muito o que explorar ainda nesta área. Será que 10% é achar uma agulha numa cena de 1 segundo no youtube?

Enquanto isso, silenciosamente, coisas acontecem no Yahoo.

Ninguém do porte desta moça dá declarações impensadas. Stay tuned.

Update 11/9: 2 dias depois, Marissa escreveu uma declaração, voltando atrás, e concordando basicamente com a opinião das pessoas (eu entre elas) que acham que ainda falta muito chão, inclusive citando nosso bom e velho Pareto ;-)

Ciências cognitivas, Data Mining, Inovação, Inteligência Artificial, Internet, Linguagem Natural, Teoria da Informação, Visão Computacional, Web 2.0 0 Comentários

Distribuindo conteúdo digital

É muito interessante como o meio digital revolucionou algumas formas de distribuição. O que é ótimo, porque felizmente nos afastamos cada vez mais daquela época em que recebíamos CDs promocionais de, bem, um monte de gente incluindo a AOL…

Também é curioso que nos primórdios da Web, muitos advogavam que a distribuição pela web iria baixar os preços, afinal, se as pessoas sabiam que pela web era mais barato para o produtor, quem iria aceitar pagar a mesma coisa baixando pela web?

Bem, a história mostrou que a percepção de valor do cliente (me perdoem o marketerismo) falou mais forte e, efetivamente, a diferença entre o que se compra na web e o que se compra fora dela, fora o fator concorrência, não é tão grande assim.

Eu me lembro do Murilo me contando que alguns fabricantes de jogos estavam usando torrent para distribuir os jogos. Afinal, quem realmente quer aquela caixa bonita do joguinho se vc pode ter da noite pro dia tudo o que interessa de verdade no conforto do seu lar? As pessoas irão pagar de bom grado pela conveniência.

Mas o que me chamou a atenção foi um anúncio de empresas que vendem filmes em pendrives, como a argos. Os caras estão vendendo o filme dos caça fantasmas num pendrive de 2 GB a US$ 50. Isso, claro, porque o preço das memórias flash despencou de tal forma que isso se tornou uma alternativa viável. O pendrive em si não deve estar custando mais que uns US$ 10, prá quem compra do fabricante em grandes quantidades… (na verdade, é provável que seja 1/10 disso)

E se você não der bola pro filme (embora as piadas continuem boas até hoje), vc pode simplesmente apagar o pendrive e usar para suas coisas.

Aí fica a nossa pergunta na cabeça. “Mas o cara não consegue baixar isso de graça na web?”. Bem, sim, mas enquanto a armazenagem de dados fica rapidamente mais barata, o que dizer da banda de web? Economicamente falando, a tendência é que os preços da banda de web não caiam na mesma velocidade, para não dizer que estes preços na verdade devem subir para o heavy users.

Faz o google, portanto, muito bem em investir na sua própria infra-estrutura de rede mundial. E só Deus sabe quanta banda o Youtube consome na web.

Então, talvez, vender o filme no pendrive não seja uma idéia tão ingênua assim.

Afinal, alguém tem que pagar a conta da web 2.0. Um doce prá quem adivinhar quem vai ser. ;-)

Economia, Inovação, Internet, Web 2.0 0 Comentários