17

Bases de dados biológicas: visão geral e perspectivas futuras

As bases de dados biológicas surgiram como uma resposta à enorme quantidade de dados gerada pelas tecnologias de sequenciamento de DNA de baixo custo. Uma das primeiras bases de dados a surgir foi o GenBank, que é uma coleção de todas as sequências conhecidas de proteínas e DNA. É mantida pelo Institutos Nacionais de Saúde dos EUA (NIH) e pelo Centro Nacional de Informações sobre Biotecnologia (NCBI). O GenBank preparou o caminho para o Projeto Genoma Humano (PGH). O PGH permitiu o sequenciamento completo e a leitura do código genético humano. Os dados armazenados em bases de dados biológicas são organizados de forma a permitir uma análise otimizada e são de dois tipos: brutos e processados (ou anotados). As bases de dados biológicas são complexas, heterogêneas e dinâmicas, mas inconsistentes. A inconsistência é devida à falta de padrões no nível ontológico.

Por que essas bases de dados são importantes?

Antigamente, os termos “base de dados” e “banco de dados” eram considerados bastante diferentes. No entanto, ao longo do tempo, “base de dados” tornou-se um termo preferível. Os dados são enviados diretamente para bases de dados biológicas para indexação, organização e otimização. As bases de dados ajudam os pesquisadores a encontrar dados biológicos relevantes, disponibilizando-os em um formato legível em um computador. Todas as informações biológicas são prontamente acessíveis através de ferramentas de mineração de dados que economizam tempo e recursos. As bases de dados biológicas podem ser classificadas como bases de dados de sequências e de estruturas. Bases de dados de estrutura são para estruturas de proteínas, enquanto bases de dados de sequências são para sequências de ácidos nucleicos e proteínas.

Tipos de bases de dados biológicas

As bases de dados biológicas podem ser ainda classificadas em primárias, secundárias e compostas.

As bases de dados primárias contêm informações apenas de sequências ou estruturas. Exemplos de bancos de dados biológicos primários incluem:

  • Swiss-Prot e PIR para sequências de proteínas
  • GenBank e DDBJ para sequências de genoma
  • Protein Databank para estruturas de proteínas

Bases de dados secundárias contêm informações derivadas de bases de dados primárias. Elas armazenam informações como, por exemplo, sequências conservadas, resíduos de sítio ativo e sequências de assinatura. Os dados do Protein Databank são armazenados em bancos de dados secundários. Alguns exemplos:

  • SCOP na Universidade de Cambridge
  • CATH no University College London
  • PROSITE do Instituto Suíço de Bioinformática
  • eMOTIF em Stanford

Bases de dados compostas contêm uma variedade de bases de dados primárias, o que elimina a necessidade de pesquisar cada uma separadamente. Cada base de dados composta tem diferentes algoritmos de busca e estruturas de dados. O NCBI hospeda essas bases de dados, onde podem ser encontrados links para a Herança Mendeliana Humana On-Line (OMIM).

O futuro

Com o advento de plataformas computacionais de alto desempenho, essas bases de dados tornaram-se importantes porque fornecem uma infraestrutura necessária para a pesquisa biológica contemporânea, desde a preparação de dados até a sua extração. A simulação de sistemas biológicos também requer plataformas computacionais, o que reforça a necessidade de bases de dados biológicas. O futuro das bases de dados biológicas parece brilhante, em parte por causa do mundo digital.

Em termos de pesquisa, ferramentas de Bioinformática devem ser otimizadas para analisar a crescente quantidade de dados gerados a partir da Genômica, Metabolômica, Proteômica e Metagenômica. Outra tendência futura é a anotação de dados existentes e uma melhor integração das bases de dados.

Com um grande número de bases de dados biológicas disponíveis, a necessidade de integração, avanços e melhorias na Bioinformática é primordial. A Bioinformática avançará de forma consistente quando forem abordados os problemas existentes de nomenclatura e padronização. O crescimento das bases de dados biológicas abrirá caminho para mais estudos sobre proteínas e ácidos nucleicos, impactando os campos terapêutico, biomédico e outros relacionados. Se você usar bases de dados biológicas e quiser compartilhar alguma informação, comente na seção abaixo!

X

Inscreva-se para ler mais

Inscreva-se gratuitamente para obter acesso completo a todos os nossos recursos em pesquisa escrita e publicação acadêmica, incluindo:

  • 2000+ artigos de blogs
  • 50+ Webinars
  • 10+ Podcasts especializados
  • 50+ Infográficos
  • Fórum Q&A
  • 10+ eBooks
  • 10+ Checklists
  • Guias de Pesquisas
[i]
[i]
[i]
[i]