Dora Ann Lange Canhos dora@cria.org.br Painel: Coleções e Sistemas de Informação para Biodiversidade A experiência do CRIA com bancos de dados e sistemas de informação Dora Ann Lange Canhos dora@cria.org.br
O desafio social .... Renato Dagnino (2001)
O Papel da Comunidade Científica A democratização política e econômica depende de uma “ciência” voltada para as necessidades sociais. A resolução dos problemas ambientais e o planejamento de um futuro sustentável exigem: Competência Articulação: diferentes segmentos, diferentes níveis (local, nacional, regional, internacional) Informação científica de qualidade
Coleções científicas: feudos ou centros de pesquisa colaborativa? Coleções biológicas têm sido repositórios estáticos de informação A coleta é feita como se a natureza fosse segmentada A natureza não vive assim, no entanto insistimos em organizar e disseminar a informação como feudos. A pesquisa e conservação da biodiversidade requer um tratamento multidisciplinar
Coleções Biológicas: mudança de paradigma Não podem ser uma mera constatação da existência de determinados espécimens no passado. Missão: documentar, compreender e educar o mundo sobre a vida no nosso planeta, passado e presente (e futuro). Centros pró-ativos na pesquisa, educação e conservação da biodiversidade. No entanto o seu impacto na política e estratégia global de biodiversidade é mínimo se não houver uma integração da informação com dados geofísicos e sociais.
Novas tecnologias de informação e comunicação: permitem prever o desencadeamento de uma cultura cooperativa e colaborativa antes inimaginável. O desafio: a articulação da comunidade a definição de padrões mínimos (integração de dados de fontes diversas) o desenvolvimento e uso de ferramentas de integração de dados e de interoperabilidade de sistemas a produção de sínteses e diagnósticos inteligíveis aos mais diversos segmentos da sociedade organizada
Algo complexo impossível Sistema de Informação Algo complexo impossível considerado Se “traduzido” em campos mínimos comuns, vocabulário controlado, formatos comuns torna-se Algo possível Torna-se Tecnicamente viável: interoperabilidade, depósito de dados Provedor tem total controle dos dados curadoria propriedade
O papel do CRIA Uma Organização Social de Interesse Público – OSCIP Público Alvo Comunidade Científica CRIA Informática para biodiversidade: pesquisa desenvolvimento serviços
Uso de software de domínio público Política do CRIA Uso de software de domínio público Linux (sistema operacional) Apache Web Server Linguagens de programação: Java e Perl PostgreSQL Database Management System Padrões abertos para interoperabilidade XML (Extensible Markup Language) XSL (Extensible Stylesheet Language) XML Schema SOAP (Simple Object Access Protocol) HTTP (Hypertext Transfer Protocol) Distributed Generic Information Retrieval (DiGIR)
Tipo de Informação Taxonômica Ecológica Genética Histórica Bibliográfica Textos Imagens Sons Mapas Aplicativos Nome da Espécie Posição Geográfica
Tipos de Sistemas de Informação Centralizados Distribuídos Mistos (parte centralizada parte distribuída)
Sistemas Centralizados Características: Dados são armazenados em um servidor central Provedores submetem os dados seguindo um formato pré-estabelecido Vantagens: Baixa demanda por infra-estrutura junto ao provedor (informática, conectividade) Desvantagens: Atualização off-line Gargalo de processamento
Sistema Centralizado de Informação Usuário Sistema Central Provedores de dados
Maior problema: atualização Perigo: Rompimento entre o provedor e o sistema centralizado Usuário Sistema Centralizado Provedores de dados
Problema: distância usuário - provedor Possível falta de interação entre o usuário e o provedor de dados Usuário Sistema Central Provedores de dados
Sistemas Distribuídos Características: Dados armazenados e gerenciados nos servidores dos provedores Portal recebe consultas dos usuários e as distribui aos provedores. Integra os resultados e devolve ao usuário Vantagens: Atualização em tempo real Consultas são distribuídas Autoria (custodianship) Desvantagens: Requer boa infra-estrutura computacional dos provedores Requer boa conectividade Exige uma capacidade de integração de sistemas heterogêneos
Sistema Distribuído Internet 2 Aplicativos: Catálogo Virtual Modelagem .... Gateway de Dados Internet 2 Col 1 Col 2 Col 3
Sistema Misto Internet 2 Internet Aplicativos: Catálogo Virtual Modelagem .... Gateway de Dados Internet 2 Col 1 Cache Node Banco de Dados Internet Col 2 Col 3 Col 4 Col 5
Projetos CRIA Biota (Fapesp) SICol (MCT/CNPq) SpeciesLink (Fapesp) SinBiota Revista Biota Neotropica Website do Programa Biota/Fapesp O Instituto Virtual da Biodiversidade SICol (MCT/CNPq) Website Catálogo Virtual SpeciesLink (Fapesp) Lifemapper (NSF) Desktop Garp Hydro (Fapesp) Bioline Publications (U. Toronto, Bioline/UK)
SinBiota: Sistema Centralizado Provedor: pesquisador Padronização da entrada de dados ficha de coleta Uso de GPS Alimentação ou alteração de dados: via Internet, pelo provedor (protegido por senhas)
http://sinbiota.cria.org.br
Freshwater Marine Terrestrial
Banco de Dados
Base Cartográfica escala 1:50.000 Instituto Florestal
Busca por Andira humilis
“zoom”
Informação sobre a coleta
Lista de espécies associada à coleta
Slide: Sidnei de Souza, sidnei@cria.org.br
Slide: Sidnei de Souza, sidnei@cria.org.br
Sistema de Informação de Coleções de Interesse Biotecnológico Apoio MCT/CNPq http://sicol.cria.org.br
Centros de Recursos Biológicos (CRB) Centros especializados que adquirem, validam, estudam e distribuem: organismos "cultiváveis“ (microorganismos, tecidos de plantas e animais, células humanas) partes replicáveis destes (genomas, plasmídeos, virus e bancos de cDNA) organismos viáveis mas ainda não cultivados Centros de informação Workshop "Science & Technology Infrastructure: Support for Biological Resource Centres", OECD http://www.oecd.org
Restrições ao Acesso Biossegurança Regulamentos de importação e exportação Proteção aos direitos de propriedade intelectual Acordos de transferência de material
O que precisa ser feito ? Fortalecimento seletivo das coleções existentes Criação de novas coleções Apoio ao desenvolvimento de um sistema de acreditação para os CRB Estabelecimento de um sistema de informação global interoperável, conectando os CRB nacionais Harmonização de políticas para parâmetros operacionais (leis e acordos nacionais e internacionais)
Evolução: Catálogo (CC) Centro de Dados (CRB)
Objetivos do SICol Servir de elemento integrador às diversas e diferenciadas coleções (CRBs). Atender à demanda por informação das coleções e dos usuários de insumos biológicos na área da biotecnologia Atender à demanda por informação dos formuladores de políticas públicas.
Modelo: CABRI – Common Access to Biological Resources and Information iniciativa da Comunidade Européia integra as principais coleções ex-situ da Europa desenvolveu um sistema “federado” de bancos de dados acessível via World Wide Web http://www.cabri.org/
CABRI – padronização dos dados dados mínimos, dados recomendados e dados completos para cada grupo taxonômico. permite a inclusão de dados históricos permite a inserção de dados mais completos
A primeira fase do projeto envolveu: A realização de um diagnóstico sobre a arquitetura recomendada, com base na infra-estrutura e capacitação existente nas coleções e no ferramental disponível na Internet; Desenvolvimento de um web site
Diagnóstico na maioria dos casos, a documentação é básica (registro apenas de campos mínimos) e pouco estruturada (pouca/nenhuma utilização de vocabulário controlado e formatos comuns) a maioria dos sistemas de informação existentes está voltada para o atendimento da demanda interna e, portanto, poucas coleções têm a sua informação disponível na Internet. muitas coleções não têm acesso à Internet a grande maioria das coleções necessita de um melhor sistema de gerenciamento de seu acervo
Diagnóstico: Arquitetura do Sistema Parâmetro: grau de informatização, padronização dos dados, qualidade do acesso Internet. Diagnóstico: centralizado (no momento) Princípios: Os dados devem estar sob o total domínio, controle e responsabilidade do provedor da informação Desenvolvimento do sistema: baseado em protocolos abertos (XML), “platform independent”, utilizando sempre que possível software de acesso público, não comercial .
SICol (visão geral) Interface Web Base de dados do SICol Bactérias Fungos Células Etc... Base de dados do SICol Usuário Interface Web Centros de Recursos Biológicos Slide: Mauro Munhoz (mauro@cria.org.br)
Características do Sistema Autonomia completa das coleções em relação aos dados. Desenvolvido completamente com base em ferramentas “open source”. Visão homogênea, por parte dos usuários, de grupos distintos de microrganismos através de uma interface web. Compatibilidade com o padrão CABRI (Common Access to Biological Resources and Information).
Desenvolvido com ferramentas “open source” Ferramentas utilizadas: Sistema operacional: Linux (www.linux.org) Linguagem de programação: Perl (www.cpan.org) Servidor web: Apache (www.apache.org) Base de dados: PostgreSQL (www.postgres.org) Vantagens de ferramentas “open source”: Rápida absorção de novas tecnologias Compatibilidade com os padrões mais utilizados Alto grau de estabilidade (bugs free) Custo reduzido visto que as ferramentas são livres (gratuitas)
http://sicol.cria.org.br/cv
Grupos de Microrganismos Bactérias e Archeas Fungos e leveduras Células animais Células vegetais Plasmídios Pontas de prova de DNA Vírus Vegetais Vírus Animais Bacteriófagos
Novos desenvolvimentos: Apoio Fapesp sistema de informação distribuído integrador de coleções biológicas ferramentas de modelagem de distribuição de espécies aplicativos que utilizam os dados integrados da rede Interoperabilidade interna (SinBiota, ...) e externa (Species Analyst, ...)
Internet 2 Internet Aplicativos: Catálogo Virtual Modelagem Outros Gateway de Dados Internet 2 Species Analyst Col 1 Cache Node SinBiota SICol Internet P1 Pn Col 2 Col 3 CRB
Informatização dos Acervos Obstáculos e Desafios Conexão Internet Informatização dos Acervos Software Nome e Posição Geográfica Desenvolvimento de Tecnologia Interoperabilidade Modelagem Servidor de localidades Servidor de nomes
Critérios para análise de sistemas de gerenciamento de coleções Critérios Estratégicos: Continuidade do projeto Mobilidade dos dados (importação/exportação) Interoperabilidade de Sistemas Software livre Características do sistema: Customização / Personalização (atende às necessidades) Facilidade / Intuitividade Especificidade Suporte a multimídia Produtividade Multiusuário Slide: Rafael Luis Fonseca <rafael@cria.org.br>
Informatização de Coleções Biológicas Desafios Desenvolvimento de Checklists e sua manutenção em processo contínuo de atualização. Iniciativas internacionais: GBIF, Species 2000, ITIS, ... Iniciativas Nacionais: Flora Fanerogâmica do Estado de São Paulo, Programa Plantas do Nordeste, ... Informatização de Coleções Biológicas Novos levantamentos: Lacunas de conhecimento Áreas ou grupos taxonômicos pouco estudados Acompanhamento da tecnologia de informação e comunicação (hardware e software)
Catálogo da Vida: Global Biodiversity Information Facility
Utilização dos Pontos de Ocorrência das Espécies Ocorrências de espécies são associadas a pontos específicos no espaço, permitindo a caracterização de necessidades ecológicas Ocorrências de espécies são associadas a pontos específicos no tempo, permitindo a avaliação de mudanças temporais Slide: Marinez Ferreira de Siqueira (marinez@cria.org.br)
Integração dos dados Pontos de ocorrência Variáveis ambientais Distribuição prevista Variáveis ambientais (coberturas geográficas) vegetação temperatura precipitação relevo Slide: Townsend Peterson e Marinez Ferreira de Siqueira (marinez@cria.org.br)
Modelagem da Distribuição Geográfica Precipitação Temperatura Modelo do Nicho Ecológico Algoritmo Previsão da Distribuição Geografia Ecologia Pontos de Ocorrência Slide: Townsend Peterson e Marinez Ferreira de Siqueira (marinez@cria.org.br)
Exemplo de Análise da Distribuição Geográfica Dados dos Projetos: Viabilidade de Conservação dos Fragmentos de Cerrado do Estado de São Paulo – Programa Biota/FAPESP: levantamento de espécies arbóreas Projeto de Cooperação Técnica: Conservação e Manejo da Biodiversidade do Bioma Cerrado - EMBRAPA Cerrados - UnB - Ibama/DFID Reino Unido Autores da Análise: Marinez Ferreira de Siqueira, CRIA (tese de doutorado) Prof. A. Townsend Peterson do Natural Museum and Biodiversity ResearchCenter, da Universidade de Kansas
Modelagem: distribuição esperada para duas espécies de Anadenanthera Resultado preliminar com dados cedid Slide: Marinez Ferreira de Siqueira (marinez@cria.org.br)
Analisando Mudanças de Cenário: Clima Precipitação Temperatura Modelo do Nicho Ecológico Projeção considerando alterações climáticas Algoritmo Previsão da Distribuição Geografia Ecologia Pontos de Ocorrência Projeção com Mudança Climática Slide: Townsend Peterson
Análises de Alteração Climática Modelo de Circulação Geral (HadCM2) usando dois cenários: HHGSDX50 - 0.5%/ano CO2 HHGGAX50 - 1%/ano CO2 Conseqüências (exemplo México) Temperatura Média em 2055: Cenário Conservador: aumento de 1,6 oC Cenário Liberal: aumento de 2,5 oC Precipitação Média em 2055 Cenário Conservador: Diminuição de 70 mm Cenário Liberal: Diminuição de 130 mm
Exemplos de predição de distribuição atual (1961-1990) e futura (2055) para espécie arbórea de cerrado: Acosmium subelegans (Siqueira et.al. submetido) Área habitável em 2055 baseado no cenário conservador Área habitável em 2055 baseado no cenário liberal Slide: Marinez F. Siqueira (marinez@cria.org.br)
Região prevista que abrigaria a maior riqueza de espécies Padrão previsto de riqueza de espécies (162) arbóreas de cerrado para a área core de cerrado no Brasil baseado em cenário climático atual (1961-1990) (Siqueira et.al. submetido) Região prevista que abrigaria a maior riqueza de espécies
Cenário Conservador Cenário Liberal Círculo azul = 87 espécies Áreas prioritárias para conservação de cerrado em face das alterações climáticas globais, baseada nos dois cenários HHGSDX50 (em cima) e HHGGAX50 (em baixo) (Siqueira et.al. submetido) Cenário Conservador Círculo azul = 87 espécies Área verde = 38 espécies; Área rosa = 7 espécies; Área amarela = 6 espécies; Área branca = 3 espécies Cenário Liberal Círculo azul = 63 espécies; Área verde = 32 espécies; Área rosa = 8 espécies
Modelagem Preditiva: Algumas Aplicações Biologia Melhora a compreensão sobre a distribuição de espécies raras, ameaçadas, espécies bioindicadoras etc Norteia programas de re-introdução de espécies Orienta o desenvolvimento de novos inventários Conservação: informação de apoio à decisão Estuda os efeitos da mudança climática sobre a biodiversidade Auxilia no desenvolvimento de planos de conservação da biodiversidade Economia Espécies invasoras Agricultura e pestes agrícolas Saúde Pública Doenças infecciosas
Desenvolvendo Ferramentas e Protocolos Parcerias CRIA: Modelagem: Universidade de Kansas (NSF) desktop Garp Lifemapper Interoperabilidade de Sistemas: California Academy of Science, Universidade de Kansas Distributed Generic Information Retrieval (DiGIR) Servidor de Localidades: Universidade de Kansas e Museu de Zoologia de Vertebrados de Berkeley BioGeoMancer Servidor de Nomes
Para reflexão Qualquer estudo sobre biodiversidade, sistemática, biotecnologia, monitoramento, etc, depende da qualidade e representatividade das coleções ex situ. Para um país de megadiversidade como o Brasil, as coleções sistemáticas são um componente vital no esforço de descrever, gerenciar e utilizar sua riqueza biológica de maneira sustentável. As coleções precisam responder a estes novos desafios e oportunidades através do desenvolvimento de mecanismos de capacitação institucional (infra-estrutura e recursos humanos) e práticas operacionais inovadoras.
Simpósio: Key Innovations on Biodiversity Informatics (21-22 Outubro, 2002) Capacitação e dimensão estratégica da informação sobre biodiversidade Novas fronteiras na disponibilidade de dados sobre biodiversidade Integração de dados sobre biodiversidade Ferramentas e uso Aplicações emergentes em informática para biodiversidade
Workshop: Flora brasiliensis revisitada (24-25 de Outubro, 2002) Apresentações: Problemas e perspectivas em taxonomia de plantas Estratégias para floras locais e regionais Disponibilização da informação Novas tecnologias para acelerar o processo de produção de floras Von Martius revisitado Grupos de Trabalho Estratégia Recuperação de dados Novas tecnologias Infra-estrutura Capacitação e treinamento
Centro de Referência em Informação Ambiental Obrigada. Dora Ann Lange Canhos dora@cria.org.br www.cria.org.br