Biocuradores – quem são esses caras?

9:51 am Biologia, Biotecnologia

Saiu na Nature de 4 de setembro de 2008 e na PLoS Computational Biology de 27 de agosto , alguns artigos e comentários sobre o papel dos biocuradores (“biocurators”) na ciência atual.

Mas por que surgiram, quem são e o que fazem esses biocuradores?

Pra começar, eles nasceram com essa grande avalanche de dados, muito falada atualmente, iniciada na última década e com o acesso rápido a todos esses dados por meios eletrônicos.

Um exemplo legal do artigo da Nature: mais de 18 milhões de artigos científicos estão indexados no PubMed, mais de de 260.000 espécies de organismos têm sequências de nucleotídeos depositadas em bases de dados online e foi anunciado recentemente que irão sequenciar 1.000 genomas humanos em três anos para o estudo de SNPs! É realmente um monte de informação pra analisar!

Biocuradores geralmente são biólogos que possuem uma mescla de habilidades que variam desde realizar pesquisas científicas anvançadas, passando por uso e administração de bancos de dados, conhecimento de múltiplos sistemas operacionais e linguagens de script.

Essas habilidades são necessárias exatamente para lidar com essa grande quantidade de dados. Biocuradores lidam com o “raw data”, extraem informações de publicações científicas, marcam, formatam e categorizam os dados e disponibilizam a informação online no final.

Na Plos são citados dois exemplos de biocuradores. Um atua no PDB curando e validando os modelos tri-dimensionais de proteínas lá depositados. Outro no IEDB, um banco de dados sobre imunologia, onde ele extrai informações sobre as sequências desse banco.

Aqui na Vetta, acho que posso dizer que eu o Lúcio e o Kenji compomos o time de biocuradores da Biomind (apesar de eu ser o único biólogo). ;-)

Nas atividades que participo, nós analisamos informações de sets de dados de microarrays, lidando e formatando tabelas com milhares de genes, muitas vezes tentando encontrar notações não redundantes para cada gene e colocando tudo em um formato adequado para rodar as análises de classificação por machine learning. Como diria o Lúcio, é preciso ‘crunchar’ os dados antes de analisar. ;-)

Depois é necessário verificar os resultados, checando as funções de diversos genes em diversas bases de dados, analisando a literatura científica e cruzando as informações pra ver se os resultados obtidos fazem algum sentido biológico.

Dá muito trabalho mas é bastante gratificante, principalmente quando dá certo! ;-)