Recuperando Informação Visual

Há algum tempo aqui no Blog, um post do Kenji chamou atenção para a categorização e recuperação de imagens. Com o aumento da oferta de câmeras digitais (cada dia melhores e mais baratas) e a farta disponibilidade de imagens na WEB (Picasa, Flickr e afins), a capacidade de humana de categorizar e buscar imagens tem diminuído rapidamente (quem nunca se esqueceu em qual pasta armazenou aquela foto perfeita?). Uma maneira de automatizar este processo é utilizar um sistema de Recuperação de Imagens com Base no Conteúdo - RIBC (em inglês Content-Based Image Retrieval).

Na abordagem RIBC, como nome indica, o próprio conteúdo visual é utilizado na análise da imagem. De maneira geral esta análise é realizada utilizando alguma técnica de Processamento Digital de Imagens ou Visão Computacional. Mas o que seria este conteúdo visual de uma imagem? De forma simples, é possível definir o conteúdo visual com base em atributos de baixo nível como cores, formas e texturas presentes na imagem.

Assim, para a categorização de uma base de dados visuais qualquer (como as fotos de suas últimas férias), algoritmos que, por exemplo, detectam correlações entre as cores, orientação em texturas ou formas presentes nas imagens são empregados na geração de vetores de características (feature vectors).

Consultas a uma base já categorizada podem ocorrer de várias formas:

  • busca por exemplo, onde uma imagem de exemplo é fornecida. Tal imagem pode ser um desenho criado pelo usuário ou algum imagem pré-existente;
  • busca por distribuição de cores, onde a distribuição de cores esperada é fornecida (60% azul e 40% verde representando imagens panorâmicas com o horizonte ao fundo);
  • busca por formas, onde a forma desejada é fornecida (como o formato de um automóvel);

A recuperação da informação visual é, então, realizada pela comparação entre os vetores de características da base e aquele obtido da consulta.

Uma das aplicações mais interessante desta tecnologia, e que serve para ilustar o seu uso, pode ser encontrada no site do Museu Hermitage de São Petersburgo, Rússia. Desenvolvido em parceria com a IBM, o site possibilita ao visitante virtual pesquisar a grande coleção de arte do museu utilizando o sistema QBIC de recuperação de informação visual. Consultas por distribuição de cores e por desenho de exemplo são permitidas e os resultados são bastante interessantes (veja um exemplo nas imagens abaixo).

Consulta

Consulta por distribuição de cores no sistema QBIC.

Resultado

Resultado de busca do sistema QBIC.

A RIBC é um campo de pesquisa ainda em aberto e muito desafios não possuem soluções satisfatórias como, por exemplo, a realização de consultas semânticas como “fotos de cachorros”. E, exatamente por isso, é uma área tão interessante ;-).

Inovação, Internet, Processamento de Sinais, Visão Computacional 0 Comentários

Windows 7 e a interface de toque

No fim de Abril deste ano, este blog já falava sobre a importância da usabilidade nas futuras (aliás, nas presentes) interfaces de software.

Em Maio do ano passado, o Yuri já estava de olho no Microsoft Surface.

Quando o iPhone entrou no mercado, todo mundo já estava de olho nas interfaces de toque.

Não demorou muito, a Microsoft anunciou que o próximo Windows, o 7, vai ter tela sensível ao toque. Em tese, o Windows 7 sai em 2010.

Vai ser uma proliferação de esponjinhas e detergentes. Se você acha seu teclado sujo, imagine como vai ficar seu monitor ;-) .

Você pode ver um vídeo deste treco em ação aqui no post da TechCrunch.

A primeira pergunta que as pessoas se fazem (ou fariam): o que isso muda a minha vida?

Eu me lembro do mesmo Yuri me contando de uma mesa que ele queria comprar pro irmão dele em 90-e-poucos, que se minha memória não me falha (ou me engana), era uma mesa em que o monitor se encaixava num vão, de forma que você olhava de cima para baixo, num ângulo de uns 30 graus mais ou menos. Nunca achei mobília para computadores assim, mas eu acharia fantástico se houvesse.

Para uma interface de toque, me parece natural que o monitor fique um pouco abaixo da altura dos olhos, onde ele fica hoje na maioria das vezes.

Outra coisa: a interface de toque não substitui apenas o mouse, então não é só dar cutucadas na tela para emular o clique, como nas interfaces de toque atuais dos kioskes. Você vai poder usar dois dedos simultaneamente, o que significa o equivalente a dois mouses. Um marcando um ponto e outro se movendo por exemplo.

Ou haverão combinações de mouse e dedadas na tela. Ou pequenos movimentos, como o emulador de braço de violão do iPhone que o mesmo Yuri me mostrou um dia aqui no Labs (eu confesso, sou um nerd meio de araque, não tenho tantos gadgets, sou old-school), onde a interação pode ser por toques ou pelo movimento típico do violão de “bater” as cordas.

Estamos esbarrando nas possibilidades ainda. É empolgante, eu diria ;-)

Inovação, Usabilidade 5 Comentários

Pense globalmente, aja localmente

Se há uma ferramenta que potencializa os esforços individuais, esta se chama internet. Basta ver o que o Open Source representa hoje.

Quando o google lançou o Google Maps, muita gente parou por um momento e pensou “porque eles estão investindo nisso?”. E de fato, o Google, como qualquer empresa, já tentou várias iniciativas sem sentido ou que não deram certo, mas tentar, e algumas vezes falhar, faz parte do jogo da inovação.

O Google Maps deu muito certo. E abriu o olho de muita gente para a importância da “localidade” das coisas, potencializada pela proliferação das plataformas mobile e das redes wireless.

Uma boa idéia que andou ganhando algum espaço da mídia especializada foi a iniciativa da Outside.In, que explora as interações do que estão chamando de (adoro novos termos…) hiperlocalidade. Blogs, notícias, redes sociais de pessoas relacionadas a um conjunto de quarteirões por exemplo. De onde você mora. Dos seus vizinhos. Da padaria que fica perto da sua casa.

Obviamente, uma aplicação para ambientes urbanos, de preferência, os grandes centros, onde é possível haver massa crítica para fazer isso funcionar. Imagine entrar numa comunidade onde você passa a conhecer seus vizinhos (eu mal conheço os do meu prédio). Ou o comércio perto do seu serviço. Fica sabendo das fofocas, ou dos assaltos na região que aquele moço da imobiliária esqueceu de te contar.

A grande adesão de brasileiros ao Orkut, aliado à incrível capacidade das pessoas de criar comunidades do que quer que seja quase permite isso hoje em dia naquela plataforma. Pode apostar que em qualquer rua em que você morar, pessoas já terão criado as comunidades “eu moro na rua tal” ou “eu moro no prédio tal”. Claro. Redes sociais servem para conhecer pessoas. E conhecer seus vizinhos é a coisa mais velha do mundo.

Só nos resta saber se a idéia da Outside.In vai se pagar. Bem, no último round de financiamentos, eles levantaram US$ 3 mi, então eu diria que eles podem pelo menos tentar ;-)

Inovação, Internet, Mobile, Redes Sociais, Web 2.0 0 Comentários

A famigerada taxa de acerto

Na semana passada saiu uma notícia no site da Folha que achei muito engraçada. OK não era assim tão engraçada mas era, no mínimo, curiosa. O avião onde voava o Tony Blair foi interceptado por caças israelenses por engano (veja a nota publicada no site da Folha). Além do fato em si soar meio bizarro, o que achei particularmente divertido foi o teor contido nas entrelinhas da explicação dada para o ocorrido:

“Um novo sistema teria sido implantado nos últimos meses para identificar aviões suspeitos, e as forças israelenses estão em alerta depois que o grupo radical islâmico palestino Hamas utilizou uma aeronave para derrubar um muro na fronteira com o Egito, há cinco meses. A imprensa britânica lembrou que o sistema de defesa aérea de Israel é um dos mais rigorosos do mundo, e que seus aviões de guerra respondem muitas vezes a alarmes falsos.”

Posso até estar enganado mas gosto muito da idéia de imaginar que eles têm um sistema capaz de identificar aviões hostis ou que representam risco. Um sistema desses obviamente seria heurístico e estaria sujeito à famigerada taxa de acerto. Ou seja, ele funciona bem e identifica corretamente aviões suspeitos com uma taxa de acerto de X%. No caso do avião do Tony Blair, o sistema teria dado um falso positivo.

Quando se está tentando resolver um problema do “mundo real” usando técnicas de inteligência artificial ou heurísticas é muito comum se negligenciar o aspecto da taxa de acerto esperada no funcionamento do sistema e das conseqüencias dos erros esperados quando eles acontecerem (e eles vão acontecer). Na minha opinião esse tipo de negligência é mais ou menos como desenvolver um software convencional sem se preocupar com a qualidade de sua interface ou com sua usabilidade. Ou seja, você corre o risco de desenvolver um sistema que tem um bom conteúdo mas que não serve para nada na prática!

Tomando esse exemplo hipotético do sistema de defesa israelense, suponha que os responsáveis pelo seu desenvolvimento tivessem duas alternativas para o método de reconhecimento. Uma cujo funcionamento esperado fosse:

  • Se a aeronave for realmente hostil, a probabilidade do alarme ser disparado é 99,9%
  • Se a aeronave não for hostil, a probabilidade do alarme ser disparado é 1%

E outra cujo funcionamento esperado fosse:

  • Se a aeronave for realmente hostil, a probabilidade do alarme ser disparado é 80%
  • Se a aeronave não for hostil, a probabilidade do alarme ser disparado é 0,01%

Qual método é melhor?

A resposta para essa pergunta não faz sentido se você não considerar a estratégia geral da defesa israelense e seus objetivos com o sistema bem como os custos relacionados ao disparo de um alarme dessa natureza (tirar 2 ou 3 caças do chão para interceptar uma aeronave custa dinheiro além de pontos negativos de publicidade no caso de um falso alarme). Desconsiderar essas questões podem invalidar completamente a escolha do método, por melhor que sejam os argumento científicos que embasam a escolha.

É esse tipo de coisa que torna difícil transformar novidade científica em inovação. Por definição a inovação tem de estar incluída dentro de um contexto de uso no mundo real, fora de um laboratório de pesquisa. Meu exemplo hipotético pode parecer óbvio mas esse padrão pode se repetir em diversas situações onde a escolha não é tão simples, e nesses casos ser sensível a esse tipo de variável é o que muitas vezes diferencia uma empresa de inovação que tem um produto de sucesso de outra que não tem.

Inovação, Usabilidade 7 Comentários

Fold-it: um jogo online em prol da ciência

Lembram do meu último post sobre dois artigos que descrevem a criação bio-computacional de enzimas artificiais? Pois é, o David Baker, autor daqueles papers, lançou uma nova “moda”. Um jogo online chamado fold-it. O objetivo é competir para criar conformações, ou enovelamentos (ou ainda foldings), mais prováveis pra uma proteína. Quanto melhor for o enovelamento, mais pontos o jogador ganha.

A pergunta que voces devem estar fazendo agora é: o que um cientista renomado quer lançando um jogo online? É claro que não é só pela diversão ;-) .

David Baker há anos vem estudando maneiras de computar o enovelamento de proteínas. O motivo é que o enovelamento, ou conformação final de uma proteína, influencia criticamente em sua função.

E criar uma enzima nova requer descobrir exatamente o folding dessa enzima a partir de sua seqüência de aminoácidos. O problema é que essa não é uma tarefa fácil – calcular o enovelamento de um proteína requer efetuar até trilhões de cálculos.

A idéia do jogo começou com o Rosetta, um algoritmo que usa o método de Monte Carlo para predizer a melhor conformação de uma proteína. Já existe há anos um programa de rede distribuída chamado Rosetta@home, que usa computadores voluntários do mundo inteiro com o objetivo de rodar o Rosetta, enquanto ociosos - um screen saver é aberto e mostra como o programa tenta descobrir o enovelamento de diversas proteínas.

Mas os usuários verificavam que esse programa fazia coisas visivelmente idiotas - o que era meio de se esperar, por ser um algoritmo força bruta. A idéia do David Baker foi de, ao invés de usar uma marreta pra solucionar o problema, usar a capacidade de resolver problemas 3D do cérebro humano, usando um jogo.

E o pior é que funciona – houve situações em que o jogador conseguiu achar corretamente a conformação uma proteína, com forma já conhecida, mais rápido que o computador! ;-)

Mas a grande “jogada” do David Baker é fazer com que os jogadores criem conformações novas para proteínas ainda não conhecidas. Essas conformações poderão servir para a síntese de drogas e enzimas ainda não conhecidas, de maneira mais rápida… e divertida ;-)

A pergunta que voces devem estar fazendo agora é: o que um cientista renomado quer lançando um jogo online? É claro que não é só pela diversão ;-) .

David Baker há anos vem estudando maneiras de computar o enovelamento de proteínas. O motivo é que o enovelamento, ou conformação final de uma proteína, influencia criticamente em sua função.

E criar uma enzima nova requer descobrir exatamente o folding dessa enzima a partir de sua seqüência de aminoácidos. O problema é que essa não é uma tarefa fácil – calcular o enovelamento de um proteína requer efetuar até trilhões de cálculos.

A idéia do jogo começou com o Rosetta, um algoritmo que usa o método de Monte Carlo para predizer a melhor conformação de uma proteína. Já existe há anos um programa de rede distribuída chamado Rosetta@home, que usa computadores voluntários do mundo inteiro com o objetivo de rodar o Rosetta, enquanto ociosos - um screen saver é aberto e mostra como o programa tenta descobrir o enovelamento de diversas proteínas.

Mas os usuários verificavam que esse programa fazia coisas visivelmente idiotas - o que era meio de se esperar, por ser um algoritmo força bruta. A idéia do David Baker foi de, ao invés de usar uma marreta pra solucionar o problema, usar a capacidade de resolver problemas 3D do cérebro humano, usando um jogo.

E o pior é que funciona – houve situações em que o jogador conseguiu achar corretamente a conformação uma proteína, com forma já conhecida, mais rápido que o computador! ;-)

Mas a grande “jogada” do David Baker é fazer com que os jogadores criem conformações novas para proteínas ainda não conhecidas. Essas conformações poderão servir para a síntese de drogas e enzimas ainda não conhecidas, de maneira mais rápida… e divertida ;-)



--> Biotecnologia, Inovação, Usabilidade, Visualização Cientifica 4 Comentários

Tecnologia vai às compras

Os mais novos talvez não se lembrem, mas em 1986, José Sarney, então presidente, lançou o Plano Cruzado, que instituía, dentre várias medidas, uma tabela de preços congelados, que as donas de casa levavam ao supermercado. Muitas usavam inclusive um bottom escrito “Fiscal do Sarney”. Havia inflação e os preços mudavam a toda hora. Pesquisar preços naquela época era um filme de terror.

Toda vez que eu vou ao supermercado, eu me lembro, com inveja, daquele filme Nikita, quando a Anne Parillaud sai do treinamento nos porões secretos do inteligência francesa e vai para sua primeira compra de supermercado. Obviamente, ela só compra porcarias e ainda lasca uma cantada no cara do caixa… (obviamente funciona, afinal, ela é a Anne Parillaud) mas um detalhe que eu nunca esqueci: cada carrinho de supermercado tem um leitor de código de barras. Ah, como é bom o primeiro mundo… Nikita foi filmado em 1990.

Me lembra também de um professor do DCC (acho que era o Meira) que uma vez comentou que todo dia de manhã, enquanto ele tomava banho, ele ficava pensando em coisas novas que poderiam ser inventadas. Uma idéia dele era o shopping onde, ao entrar, cada pessoa recebesse um palm que fosse um catálogo de produtos e que automaticamente começasse um leilão entre as lojas do shopping. O mais curioso, ele deve ter falado disso uns 10 anos atrás. 1998? Algo assim.

Mesmo hoje em dia, o custo seria proibitivo, mas as pessoas estão tendo cada vez celulares melhores e mais próximos da funcionalidade dos antigos palms. E não me parece tão inverossímil assim que um celular com GPS ou RFID pudesse localizar as lojas mais próximas e mostrar a “vitrine” adaptativamente.

Ao longo dos últimos 20 anos, nossa economia mudou, e também a relação dos consumidores com os produtos. Mas o que isso tudo tem a ver com inovação tecnológica?

Bem, para quem não acompanhou aqueles boatos do “google phone” (as pessoas achavam que o google ia lançar um aparelho no mercado), o google está entrando rapidamente no mundo dos mobiles através do Google Android, que é uma plataforma de desenvolvimento mobile sustentado por um consórcio bastante significativo de empresas de telefonia.

Como toda boa plataforma, as pessoas compram por causa das funcionalidades e uma das melhores formas de desenvolver aplicativos e ter boas idéias é fazer um concurso. O Google simplesmente falou “vamos distribuir 10 milhões entre os melhores aplicativos desenvolvidos para o Android”, com prêmios que vão de 25.000 doletas para os 50 primeiros com direito a adicionais de 150.000 e 250.000 para cada grupo de 10 primeiros desta lista.

Bem, saiu a lista dos ganhadores e dentre eles (várias idéias boas, como era de se esperar), uma aplicação chamada AndroidScan (tem um vídeo neste link tb), que transforma o celular num leitor de código de barras, dando informações e comparação de preços daquele produto. Afinal, não é só fotografar o código de barras?

Já pensou o que os fiscais do Sarney fariam com um celular destes?

Inovação, Mobile, Usabilidade 1 Comentário

Analisando Dados “Misteriosos”

Naquele estranho (e meio nojento - tudo bem, muito nojento) filme de 1986 do Cronenberg, “A Mosca”, em algum momento a repórter interpretada pela Geena Davis pergunta ao cientista vivido pelo Jeff Goldblum como ele conseguiu construir um teleportador do nada no galpão dele. O cientista responde que na verdade ele não fez aquilo sozinho e nem do nada, ele contratava equipes de cientistas ao longo do globo pedindo coisas esquisitas do tipo “quero um analisador molecular obedecendo tais e tais especificações”, e aí uns meses depois lá chegava o analisador molecular. As equipes independentes de cientistas que resolviam esses sub-problemas e criavam esses componentes só enxergavam o que precisavam enxergar, não tinham noção de onde a solução que eles desenvolveram seria aplicada, e principalmente não tinham a menor idéia do projeto do teleportador que o personagem principal estava desenvolvendo.

No mundo real, longe das referências nerd envolvendo obras de ficção científica, devo dizer que nós aqui do Vetta Labs às vezes nos sentimos um pouco como os cientistas do filme que construíram o analisador molecular sabe-se lá para ser usado em que. Como diz o ditado, “o segredo é a alma do negócio”, e isso é particularmente aplicável quando o negócio envolve a análise de informações de outras empresas que querem ao mesmo tempo terceirizar serviços de mineração de dados e preservar o sigilo de seus contratos e seus clientes.

Pois bem, uns meses atrás, em mais um daqueles exemplos das maravilhas do outsourcing de pesquisa, fomos contratatos pela Novamente para analisar os dados de um terceiro cliente-cujo-nome-não-será-revelado, que como dá para suspeitar pela omissão do nome era justamente desses que preferem manter seus dados e planos envoltos em mistério. Recebemos uma base de dados composta por dezenas de milhares de tuplas, cada uma formada por um punhado de valores correspondendo a um pequeno conjunto de variáveis. O problema que nos foi colocado foi tentar prever uma das variáveis em especial com base nos valores de todas as outras, com uma taxa de acerto superior a um certo limite mínimo aceitável. A variável a ser predita era, para todos os fins práticos, lógica, do tipo “sim” ou “não”. As demais variáveis eram bem variadas, algumas claramente numéricas, outras também lógicas, e finalmente umas que talvez fossem numéricas ou talvez fossem simbólicas. O caso é que não tínhamos nem muita certeza do tipo de algumas das variáveis porque não nos foi dada qualquer informação sobre as mesmas. Os nomes de algumas variáveis até davam pistas do que elas deviam ser (mas não exatamente em que unidades elas estavam sendo medidas), porém outras variáveis tinham nomes herméticos que não ajudavam muito do ponto de vista da, digamos, semântica dos dados.

Assim, inventando uma base de dados parecida para fins de exemplificação, vamos supor que temos um conjunto aparentemente desprovido de sentido de quatro variáveis chamadas TUTU, PEDRA, CAVALO e CHUVA, e com base nelas temos de prever se o valor de uma quinta variável RESPOSTA é “sim” ou “não”. Existem dezenas de milhares de combinações-exemplo de valores de TUTU, PEDRA, CAVALO e CHUVA com valores conhecidos de RESPOSTA, e com base nelas devemos achar regras engraçadas como, digamos, “Se TUTU vale mais que 0.65, PEDRA tem valor ‘mole’ ou ‘redonda’, CAVALO pode ter qualquer valor e CHUVA vale ‘forte’, então RESPOSTA é ’sim’, caso contrário ‘não’”, regras essas capazes de prever RESPOSTA corretamente com uma acurácia maior que um mínimo estipulado pelo cliente.

Numa situação dessas, o bom minerador de dados deve se ater àquela máxima que acredita-se o filósofo-patrono das ciências exatas, o Pitágoras, soltou uns 25 séculos atrás: “Tudo são números”. É verdade que, como já exemplificamos várias vezes aqui no blog, quando mais informação você tem sobre uma base de dados, melhor, e às vezes é inclusive interessante usar outras bases de dados direta ou indiretamente relacionadas para “amplificar” a base objeto do seu estudo. Porém, nas situações em que não podemos (ou não devemos :) saber mais a respeito dos dados, o puro uso da lógica e da matemática podem ainda assim ser surpreendentemente efetivos.

Foi assim no caso dessa base de dados “misteriosa”. Devo dizer que criar uma abordagem capaz de passar do limite de acurácia mínimo pedido pelo cliente foi bem… desafiador, talvez inclusive devido ao desconhecimento da semântica dos dados. Mas, no final, chegamos a uma método bem robusto capaz de resolver até nossas dúvidas sobre o tipo exato de algumas variáveis. Nessa metodologia (da qual falarei apenas por alto para não “falar demais” :), desenvolvemos uma maneira de medir a “capacidade de predição” de uma variável quando assumia um dado valor (não importando se esse valor é um número, uma string, lógico, etc), e também para qual resposta (”sim” ou “não”) tendia esse dado valor de dada variável. No final, ao contrário do exemplo acima, nossas regras verificavam não os valores diretos das variáveis, mas sim a capacidade de predição dos valores que elas estavam assumindo na tupla em questão, e com base nisso decidiam se a tupla apontava para “sim” ou um “não”.

Conseguimos com essa abordagem ultrapassar (por pouco) a acurácia mínima pedida pelo cliente, inclusive em um segundo conjunto de tuplas completamente desconhecidas, seguindo o mesmo formato de dados, que o cliente nos forneceu para uma validação adicional. É possível que agora formalizemos um serviço de análise e desenvolvimento de mais longo prazo - e quem sabe até com um véu de mistério menos espesso. De qualquer forma, a lição que ficou foi: os números são seus amigos, não se desespere se eles são a única coisa ajudando você em seu trabalho de análise de dados. ;-)

Data Mining, Inovação, Inteligência Artificial 0 Comentários

Mashup Potatoes

É interessante como são as coisas. Quando a gente aprende a programar, você aprende a criar bibliotecas e reutilizar código. Você define um monte de funções e aquela biblioteca se torna uma unidade independente e útil. É o nosso processo natural de abstrair e encapsular funcionalidades, para que possamos nos ater no mais importante e poder trabalhar num nível acima de abstração. Porque você não quer saber como se tira uma raiz quadrada, você quer uma função que faça a conta para você.

E este processo vai se repetindo cada vez mais. Depois aparece a orientação por objeto, e você passa a bolar objetos e métodos para aquele objeto. Aí você define interfaces. Depois você organiza os objetos em bibliotecas, que se agrupam em frameworks, que se agrupam em aplicações e por aí vai.

Depois você integra essas aplicações com outras e está feita a sinfonia. Uma das tendências mais interessantes dessa integração entre aplicações são os mashups, onde a partir de API´s disponibilizadas pelos sites, você tem acesso ao conteúdo (os dados) de cada site e pode integrá-los numa nova aplicação.

Muitas vezes, você pode simplesmente correlacionar duas variáveis que ninguém tinha pensado em correlacionar antes, e aquilo é útil para alguém. Um ponto é saber o que correlacionar. Outro ponto é saber como. No fundo, só se trata de mostrar os mesmos dados que estão em outro site de outro jeito.

Um exemplo muito interessante de uma aplicação assim é o timetube, que nada mais é que uma forma de mostrar o resultado de uma busca no youtube ao longo de uma linha no tempo. Afinal, tempo é apenas mais uma dimensão. Para algumas buscas não vai ser grandes coisas, mas pense em fatos jornalísticos, eventos históricos, eleições, carreiras políticas…

Você dá sua API para a internet (e arca com o custo de fazê-la funcionar) e ela te devolve aplicações que repensam em como utilizar seus dados de forma que seja útil para outras pessoas e te devolvem tráfego. Hits. Visitas. Acessos. Atenção. Atenção no oceano da web vale ouro.

Esta semana eu também tive a feliz surpresa de achar o blog do Marco Aurélio, ou Corélio para quem conheceu ele no DCC-UFMG, falando bastante sobre arquitetura, SOA, BPM e etc, que tem tudo a ver com mashups. Recomendo. :-)

Desenvolvimento, Inovação, Internet, Web 2.0 0 Comentários

Uma visão não convencional da restrição calórica

Recentemente, o time da Biomind do Vetta Labs resolveu estudar os efeitos da RC em camundongos usando experimentos de microarray públicos e técnicas de aprendizado de máquina. Esses resultados geraram um paper, aceito para publicação na mais famosa revista relacionada ao estudo de longevidade e envelhecimento, a Rejuvenation Research. Nesse post vou dar uma visão geral sobre a parte biológica da coisa e falar um pouquinho dos resultados que obtivemos – mais detalhes quando o paper sair definitivamente do forno ;-)

Apesar de todas as especulações, até hoje a única ferramenta cientificamente comprovada contra o envelhecimento é a restrição calórica (RC). Bom, tem também o resveratrol, um composto polifenólico extraído da casca das uvas, mas isso já foi assunto de outro post.

A restrição calórica possui, muitas vezes, o poder de até dobrar a vida de camundongos de laboratório, dentre outros animais. A única coisa a ser feita é diminuir em 30% as calorias ingeridas pelos animais, sem, é claro, privá-los dos nutrientes fisiologicamente necessários para que mantenham uma vida saudável - mas com fome.

Os efeitos e o mecanismo fisiológico e molecular de ação da RC em animais vêm sendo estudados a fundo nos últimos anos e muitas teorias foram criadas a respeito de seu funcionamento. Dentre elas, vou descrever algumas:

  • teoria dos radicais livres: quanto mais se come, mais radicais livres serão gerados pelas mitocôndrias e maior será o dano oxidativo e celular, levando à senescência. As mitocôndrias são grandes vilãs do envelhecimento – já dizia Aubrey de Grey!
  • teoria do desenvolvimento: alguns genes, que são responsáveis por um rápido desenvolvimento dos organismos (para que alcancem logo o estágio reprodutivo), são também responsáveis pelo envelhecimento rápido. Acredita-se que esses genes devem ser desativados com a RC - não há comida suficiente para alimentar uma futura prole, então é melhor esperar um pouco - e dessa forma o envelhecimento também é prorrogado ;-)
  • teoria da hormesis – pequenos estresses devem gerar uma mudança nas prioridades dos organismos. A RC, tida como um pequeno estresse, faria com que o organismos priorizassem o combate aos danos oxidativos e o reparo de DNA, ao invés de gastar energia com desenvolvimento e reprodução. Essa mudança de prioridade deve retardar o envelhecimento. Testes já estão sendo feitos com drogas que causam pequenos estresses nos organismos para se conseguir mimetizar o efeito da RC.

Uma maneira de se estudar o efeito da RC é verificando quais genes estão sendo mais ativados ou mais desativados em organismos sob RC, em comparação com organismos em dieta normal e tentar entender por que isso acontece.

Os microarrays são ferramentas excelentes pra esse tipo de tarefa e o pessoal da Biomind do Vetta Labs é especialista em analisar esse tipo de dados, porém de uma maneira não convencional, usando a técnica de aprendizado de máquina (machine learning). Mais detalhes sobre a técnica no post do Omni.

Os resultados obtidos concordam com a hipótese de que os efeitos da RC na longevidade é um processo multifatorial., provavelmente centrado no estresse oxidativo causado pelo funcionamento da mitocôndria, ligado ao reparo de DNA e com uma conexão com a teoria do desenvolvimento (encontramos alguns genes importantes ao efeito da RC ligados às ciclinas, que são relacionadas ao ciclo celular e desenvolvimento). Também encontramos ligações entre genes que ligam as teorias da hormesis e dos radicais livres.

Com isso mostramos que uma tecnologia de aprendizado de máquina pode servir como um amplificador, mostrando relações biológicas que não são claramente perceptíveis nesses dados por técnicas convencionais.

Bom, para os mais curiosos, assim que o paper for publicado colocaremos o link aqui ;-)

Biotecnologia, Inovação 0 Comentários

Daphne Koller

é mais uma daquelas mentes brilhantes que trazem um certo orgulho aos brasileiros.

Daphne, aos 12 anos, começou a se interessar por computação (1981). De lá prá cá, teve uma carreira em rápida ascensão, e hoje, aos 39, é professora em Stanford (entrou no departamento de ciência da computação em Setembro de 95), onde faz parte do laboratório de robótica.

E virou notícia dia 28 de Abril (site da ACM) quando recebeu seu ACM-Infosys Foundation Award in Computing Sciences pelos seu trabalho integrando técnicas de IA com formas de resolver problemas do mundo real. Mais especificamente, a Infosys Foundation pagou para ela US$ 150.000, uma mixaria diante dos US$ 500.000 que ela havia recebido em 2004 pela Fundação MacArthur. E a notícia chegou aqui, via New York Times ontem, dia 4 de Maio.

Daphne tem uma vasta gama de interesses, principalmente em redes bayesianas (que ganharam popularidade com os filtros anti-spam), biologia computacional, visão computacional, robótica e percepção, aprendizado supervisionado, lógica probabilística, tomada de decisão e muitos et ceteras que muito nos interessam.

Ave Daphne, aqueles que se esforçam te saúdam. :-D

Biografia, Biotecnologia, Inovação, Inteligência Artificial, Linguagem Natural, Probabilidade 0 Comentários

« Previous Entries Next Entries »