Aprendizado de máquina nas nuvens
Uma hora, todo mundo sabia que iria acontecer. Os algoritmos de aprendizado de máquina (machine learning) encontrariam um modelo de escalabilidade massiva (hadoop, o mesmo que o yahoo anda namorando para competir com o google) e se encontrariam num interessantíssimo novo projeto cultivado pela Apache Foundation chamado Mahout.
Este belo e promissor projeto pretende implementar cerca de 10 algoritmos descritos neste paper de Stanford incluindo K-Means, SVM, PCA e etc, numa “nuvem” de computadores, permitindo lidar com um alto grau de paralelismo e lidando com dados BEM grandes.
Não tem nada pronto ainda… na verdade o projeto ainda está começando, mas promete.
Para os curiosos interessados em acompanhar este projeto mais de perto, fiquem de olho nos blogs de Sean Owen, Jeff Eastman e no blog do Apache Lucene, mantido pelo Grant Ingersoll.
Curiosidade: Mahout é o cara que pilota um elefante, enquanto Hadoop é o nome do elefantinho de pelúcia do filho do Doug Cutting, criador do projeto. Que por sinal, hoje trabalha no Yahoo. Nada como uma concorrência saudável.

