A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Objetivos originais e resultados alcançados

Apresentações semelhantes


Apresentação em tema: "Objetivos originais e resultados alcançados"— Transcrição da apresentação:

1 Objetivos originais e resultados alcançados
Projeto speciesLink Objetivos originais e resultados alcançados

2 Objetivo (Fase 1) – Concepção 1999
resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional. desenvolver aplicativos que façam uso dos dados integrados, visando criar ferramentas acessíveis a um público mais amplo.

3 Objetivos principais Implementar uma rede distribuída de informação sobre biodiversidade para o Estado de São Paulo, explorando as novas tecnologias e melhor conectividade (Internet 2) para a integração de bases de dados heterogêneas e independentes. As bases de dados a serem integradas incluirão 12 coleções biológicas do Estado de São Paulo, a rede Species Analyst e o SinBiota; A proposta previa a repatriação de dados de subcoleções específicas fora do estado de São Paulo (no Brasil e no exterior)

4 Objetivos principais (2) Integrar ferramentas de modelagem de nicho ecológico e de previsão de distribuição geográfica de espécies ao sistema, utilizando dados da rede distribuída descrita no item (1)

5 Objetivos principais (3) Desenvolver aplicativos que façam uso dos dados integrados na rede de informação distribuída descrita no item (1) e dos modelos matemáticos de distribuição no item (2) para dar suporte à comunidade científica, educacional, tomadores de decisão e formuladores de políticas ambientais.

6 Requisitos esperados da rede
Disponibilidade: a rede deve estar disponível, em funcionamento sempre; Tolerância a falhas: a rede deve ser capaz de operar quando alguns nós não estiverem funcionando; Desempenho e Robustez: a rede deve ser capaz de processar e responder em um tempo razoável um grande número de solicitações simultâneas; Descoberta de novos nós: a rede deve ter mecanismos automáticos ou manuais para inclusão de novos nós; Independência de plataforma: o software deve operar em ambientes computacionais heterogêneos; e, Escalabilidade: a rede deve ter capacidade para aumentar o número de nós, sem que seja necessário desenvolver novos componentes de software.

7 Estratégia adotada software: livre e/ou de código aberto
hardware: intel based protocolo de comunicação: participar do desenvolvimento do DiGIR modelo de dados: adotar e participar da discussão do modelo DarwinCore sistema on-line de acesso livre e aberto autonomia plena às coleções com relação à escolha do software de gerenciamento e à disponibilização dos dados (entrada, correção, saída e controle de dados sensíveis feitos pela coleção)

8 Estratégia Coleções: Pressuposto Inicial: cada coleção dispunha de um software de gerenciamento e o papel do CRIA seria o de entender o sistema e, com a mínima interferência possível, conectá-lo à rede. Constatação: a grande maioria das coleções não tinha sistema de gerenciamento implementado e nem equipe de apoio para dar suporte a esse trabalho. Resultado: foi necessário oferecer suporte com relação à escolha do software de gerenciamento do acervo e serviços como importação dos dados, configuração do computador, etc.

9 Estratégia repatriação de dados
A proposta original previa a implementação de bolsas para a digitalização de acervos no exterior, de interesse do país. No entanto as grandes coleções no exterior passaram a digitalizar e disponibilizar seus dados na Internet Optamos por investir mais no desenvolvimento de tecnologia de integração de dados ao invés de "trazer" esses dados para um servidor central. Deu-se prioridade a bolsas para auxiliar as coleções na digitalização de seus acervos

10 Modelagem desenvolvimento do GARP (Genetic Algorithm for Rule-set Production)em colaboração com a Universidade de Kansas vinda do Town Peterson e Arthur Chapman produção de alguns trabalhos colaborativos Com a experiência adquirida durante o projeto a equipe do CRIA concluiu que para tornar a ferramenta de modelagem mais útil e principalmente mais acessível aos pesquisadores, seria necessário o desenvolvimento de um ambiente que automatizasse partes do processo - openModeller

11 Resultado Fase 1 Coleção Nome Sigla Acervo Total On-line HERBÁRIO
Herbário do Departamento de Ciências Biológicas - LCB/ESALQ ESA 80.000 730 Herbário do Estado "Maria Eneyda P. Kaufmann Fidalgo" - Instituto de Botânica (IBt) SP 192 Coleção de Algas do Herbário do Estado "Maria Eneyda P. Kaufmann Fidalgo" - Instituto de Botânica (IBt) 15.000 11.088 Herbário do Instituto Agronômico, Campinas IAC 45.000 24.330 Herbário do Departamento de Botânica - IB/USP SPF 20.962 Herbário da Universidade Estadual de Campinas - IB/UNICAMP UEC 12.860 Subtotal 70.162

12 Coleção Nome Sigla Acervo Total On-line* PEIXES Coleção de Peixes do Departamento de Zoologia e Botânica - IBILCE/UNESP DZSJRP 23.000 5.714 Coleção de Peixes do Laboratório de Ictiologia de Ribeirão Preto - FFCLRP/USP LIRP 30.000 4.314 Coleção de Peixes do Museu da USP MZUSP 82.000 Subtotal 10.028 ÁCAROS Coleção de Ácaros do Departamento de Zoologia e Botânica - IBILCE/UNESP AcariDZSJRP 7.000 4.734 Coleção de Ácaros do Departamento de Entomologia, Fitopatologia e Zoologia - LEF/ESALQ AcariESALQ 15.000 12.392 22.000 17.126

13 MICROGANISMOS Coleção Brasileira de Microrganismos de Ambiente e Indústria - CPQBA/UNICAMP CBMAI 700 110 Coleção de Culturas de Fitobactérias do Laboratório de Bacteriologia Vegetal - Instituto Biológico de Campinas IBSBF 2.000 929 Subtotal 2.700 1.039 Total Acervo 98.355 SinBiota Dados de observação de campo dos projetos do Programa Biota/Fapesp (flora, fauna e microbiota) 37.814 TOTAL GERAL

14 Proposta para a Fase 2 Ampliação da rede para 33 coleções biológicas do Estado de São Paulo. revisão do esquema de metadados do portal DiGIR; desenvolvimento de ferramentas para o monitoramento da rede; desenvolvimento de interface para visualização geoespacial dos resultados; desenvolvimento de ferramentas de apoio à limpeza e correção de dados; e, disponibilização on-line de dicionários de nomes e bancos de dados de localidade e coletores. Nota: o desenvolvimento de um ambiente computacional para modelagem não foi aprovado

15 Padronização ferramentas de data cleaning
trabalho com coletores (botânica) houve uma breve discussão sobre padronização de nomes de estados na lista

16 Resultados Monitoramento Data Cleaning Perfil das Coleções
Informação on-line

17 Média reg. / Bolsista /mês
Resultados Grupo Tax. Média reg. / mês Média reg. / Bolsista /mês Total Acervo Reg. on-line % on-line registros georef. % de registros georef. Ácaros 226 195 31.959 24.554 77% 4.472 18% Aranhas 3.500 2.626 75% 0% Entomologia 3.519 1% Abelhas 4.913 3.480 93.696 46% 76.204 81% Mamíferos 548 913 34.063 22.955 67% 815 4% Aves 3.271 2450 22.710 20% 8.967 39% Peixes 81 166 97.040 76% 59.902 62% Repteis e Anfíbios 193 544 91.936 84% 7.124 8% Herbários 694 948 17% 78.972 33% Algas 109 34.776 33.809 97% Xilotecas 407 222 23.500 10.679 45% 80 Microrganismos 26 233 2.688 1.938 72% Totais 27% 37% Sinbiota 63.588 100% Total 29% 42%

18 Fase 1 Fase 2 Aumento Répteis e Anfíbios 5 Registros 91.936 Herbários 6 12 100% 74.556 Algas 2 33.809 Xilotecas 10.679 Microrganismos 0% 1.039 1.938 87% Coleções 40 233% 522% SinBiota 39.402 63.586 61% TOTAL 395% Fase 1 Fase 2 Aumento Ácaros 2 3 50% Registros 17.774 24.554 38% Aranhas 1 2.626 Entomologia 3.519 Abelhas 93.696 Mamíferos 22.955 Aves 22.710 Peixes 4 33% 10.179 97.040 853%

19 Respostas ao questionário - Ácaros
Software: Biota (1), Excel (1), Excel-Biota (1) Plano digitalização: (1) espécimes já identificados (2) organismos em estudo (pós) na conclusão dos trabalhos 1o. Organização em fichários 1o. Material já organizado Sugestões: associação parasito – hospedeiro treinamento biota

20 Respostas ao questionário - Aranhas
Software: Excel (1) Plano digitalização: Não, tendência organização dos lotes por família Sugestões: erros na digitação por falta de treinamento, sem uma noção da estrutura de dados = erros (p.ex. falta de padronização dos nomes das localidades) Bolsista é bom mas o ideal é a existência de um técnico no quadro funcional

21 Respostas ao questionário - Entomológica
Software: Access, Excel Plano digitalização: Não, sim Problema apontado: não existe na universidade a função de curador Sugestões: ferramenta para gerenciar referências bibliográficas ferramenta que permitisse pesquisar organismos relacionados a determinadas espécies ferramentas de distribuição temporal dos espécimes elaboração de um manual explicando passo-a-passo como configurar o programa que filtra Estudar junto à Fapesp a possibilidade da criação de bolsas para digitação de acervos para dar continuidade aos trabalhos

22 Respostas ao questionário - Abelhas
Software: Excel-Access Plano digitalização: sim: esquema inicial dos campos,vinculação das tabelas, relacionamento dos campos Sugestões: CRIA tivesse uma participação mais efetiva na escolha do software Elaboração de um programa ‘único’ pelo CRIA minicurso pré início digitação Maior flexibilidade para inclusão de novos campos

23 Respostas ao questionário – Mamíferos, aves, ...
Software: Biota, Access Plano digitalização: inclusão seguindo a ordem crescente da numeração criação de 2 bancos de dados (roedores, aves), definição de prioridades por ‘grupo’ (roedores, peles taxidermizadas, ... Sugestões: treinamento Access extensão do prazo para a digitalização do acervo cursos temas relacionados ao CRIA e coleções para crescimento profissional dos bolsistas treinamento bolsistas software de gerenciamento

24 Respostas ao questionário - Peixes
Software: Biota Plano digitalização: sim: plano geral elaborado em 2000 auxílio pesquisa Fapesp Sugestões: treinamento prévio do bolsista na rotina da coleção (responsabilidade da coleção)

25 Respostas ao questionário – Anfíbios e Répteis
Software: Access, Excel-Biota Plano digitalização: digitalização do acervo já tombado, correção e refinamento, tombamento de outra coleção, digitalização, ... reorganização da coleção, substituição de etiquetas apagadas, conferência dos livros de registro, inserção de novos exemplares, digitação, disponibilização no speciesLink Sugestões: CRIA poderia contribuir mais com a escolha do software desenvolvimento de um banco de dados brasileiro, em português trabalhar mais para aprimorar o gazetteer Falta visibilidade ao projeto (comunidade científica e sociedade) ferramenta que organize os dados em gráficos (no. de exemplares e táxons, listas de espécies por tipo de habitat) Treinamento programa Biota

26 Respostas ao questionário - Herbários
Software: Excel-Brahms (2), Excel, Brahms Plano digitalização: (1) digitalização campos mínimos; (2) imagens digitais de cada espécime; (3) digitação de todos os campos Banco em dbase para Excel, padronização formato e campos, inclusão de novos campos (coordenadas geográficas) Digitalização por famílias Digitalização seguindo a ordem alfabética por famílias com verificação de “ruídos”. Durante o processo a planilha foi simplificada. Os dados serão completados em uma segunda etapa. Sugestões: continuar com o suporte CRIA via extensão do projeto ou realização de outro projeto Ampliar a divulgação da rede speciesLink Mais treinamento no uso do software de gerenciamento (Brahms) Ter listas de referência (atualização de nomes e autores de espécies) Desenvolver outros layers no speciesMapper (hidrografia, vegetação, ...) Na busca ‘grupo taxonômico’ não está claro – exemplos explicativos poderiam auxiliar o usuário. Gênero é um grupo taxonômico mas tem que ser buscado em nome científico... Incluir um sistema de ‘help’ e exemplos nas ferramentas

27 Respostas ao questionário - Herbários
Software: proprietário Plano digitalização: Prioridade a materiais recém incluídos e daqueles solicitados para empréstimo (informatização antes de sair do acervo) Sugestões: treinamento: uso das ferramentas speciesLink, programa de gerenciamento das coleções, divulgação das experiências na implantação de experiências de informatização com modelos de construção de planilhas, programas para inserção de dados, etc. ferramenta infoxy: problema de precisão das bases (país, estado, município) Enriquecer o geoLoc com informações sobre a localização dos rios, serras e outros acidentes geográficos Treinamento ferramentas speciesLink (openModeller) Previsão de mais equipamentos de informática para as coleções em projetos futuros

28 Respostas ao questionário – Herbários, Algas
Software: proprietário, Brahms (2), Lantana-Brahms, Access Plano digitalização: contratação de empresa de digitação escolha de famílias com boa confiabilidade na identificação das espécies designação de um funcionário para digitação junto com alunos e bolsistas para assegurar uma continuidade mínima Sugestões: elaboração de um manual à Fapesp: a bolsa deveria ser concedida ao orientador ou coordenador e não ao candidato – cada substituição é um processo novo Treinamento Brahms Seria importante contar com pessoas fixas e não bolsistas Problema da bolsa TT onde o tempo é descontado caso o aluno faça pós O CRIA não deveria ‘esquivar’ do papel de sugerir o melhor software a ser utilizado Curso software de gerenciamento

29 Respostas ao questionário - xilotecas
Software: Excel Plano digitalização: sim Problema: IPT: os projetos que não trazem receita não estão sendo priorizados por causa da necessidade de cumprir metas de desempenho financeiro Sugestões: treinamento Brahms

30 Respostas ao questionário - microrganismos
Software: Excel, proprietário Plano digitalização: digitalização de acordo com o número de entrada do microrganismo Sugestões: treinamento nas ferramentas speciesLink

31 Uso de ferramentas 24 coleções responderam o questionário
11 não responderam data cleaning: 20 speciesMapper: 15 geoLoc: 13 spOutlier: 13 Conversor: 10 openModeller:0 Banco de coletores e infoxy: 1 resposta espontânea (não foi incluída nas opções)


Carregar ppt "Objetivos originais e resultados alcançados"

Apresentações semelhantes


Anúncios Google