Página anterior Página Principal
Home Herbário CEN Histórico Equipe Banco de Dados

Histórico

ELCEN - Electronic CEN Herbarium - ELCENweb


Introdução

  • Os trabalhos de pesquisa nas áreas de botânica, ecologia e recursos genéticos exigem diversos trabalhos de campo, tais como a coleta de material botânico e levantamento das características das plantas no campo. Devido a enorme diversidade e volume de dados obtidos durante as expedições de coleta, é imprescindível a existência de um sistema computacional para o gerenciamento de tais dados, a fim de que possam ter valor informativo para a pesquisa de modo geral.

O "Sistema Coleta" (1985-1995 ?)

  • A EMBRAPA Recursos Genéticos e Biotecnologia (CENARGEN) utiliza desde 1985 um modelo de "caderneta de campo" para registro das coletas cujos dados referem-se ao tipo de material coletado, equipe de coletores, localização geográfica, taxonomia, etc.
Figura 1 - Modelo da caderneta de campo.
  • Nesta mesma época (1985), foi desenvolvido um sistema computacional em ambiente de PC ("personal computer") para registro dos dados das cadernetas de campo, denominado "Sistema Coleta". Nesta época, os PC´s eram equipamentos extremamente limitados, seja em relação à velocidade de processamento de dados, seja em relação a disponibilidade para armazenamento de grandes volumes de dados. Além disso, inexistia ambiente de rede de computadores PCs, o que significa dizer que os sistemas computacionais em PC funcionavam de forma "isolada" em uma única máquina, o que, naturalmente, dificultava enormemente o intercâmbio de dados dos sistemas por usuários diversos. Neste contexto, o "Sistema Coleta" ficou limitado quanto à sua utilidade como elemento gerador de informação para a pesquisa em botânica, ecologia e recursos genéticos.
Figura 2 - Ambiente do "Sistema Coleta" - Limitações:
(1) na velocidade de processamento
(2) armazenamento dos dados (multivolume)
  • Em função das limitações acima citadas, outro fator "degradante" da performance do sistema estava ligado à integridade dos dados: os dados estavam não normalizados e apresentavam duplicidade de valores.
Figura 3 - Dados do "Sistema Coleta" não normalizados
  • Observe na Figura 3 a inexistência de padronização (normalização) para o nome do coletor, a descrição do material coletado, ou mesmo a descrição do interesse econômico do material: para o "Sistema Coleta" o coletor Roberto Fontes Vieira é citado de diversas maneiras: "Roberto Fontes Vieira", "R.F. Vieira", "Roberto F. Vieira", etc. O mesmo ocorre com o material coletado: o correto é "Exsicata", "Exsicatas" ou "Exs" ? Idem para o interesse econômico: o sistema permite que duas descrições distintas sejam armazenadas, quando na verdade são semânticamente idênticas: "Taxonomia" e "Taxonômico".
  • Pode-se perceber o problema da não padronização de dados quando, por exemplo, for desejado efetuar uma consulta de todas as fichas de coleta do coletor Roberto Fontes Vieira. O usuário deve saber que o sistema está armazenando mais de um nome para este coletor, o que certamente dificulta a realização da consulta.

ELCEN (versão 1) (1996-2000)

  • Em meados da década de 90, o ambiente computacional de PCs evoluiu de forma exponencial. A capacidade de armazenamento e velocidade de processamento de dados das máquinas aumentou consideravelmente ao mesmo tempo que o custo das mesmas diminuiu sensivelmente. Neste momento, o ambiente de PCs se caracteriza por permitir a interligação de máquinas, formando redes de computadores, permitindo assim que os diversos sistemas computacionais pudessem assumir características de sistemas distribuídos, ou seja, sistemas que permitem o intercâmbio de dados em diversas máquinas localzadas em locais geograficamente distantes um do outro. Foi neste contexto que se intensificou e se popularizou a Internet, a rede mundial de computadores.
  • Com um ambiente computacional mais favorável, em 1996 pesquisadores e técnicos da EMBRAPA/CENARGEN desenvolveram um sistema batizado de ELCEN (Electronic CEN Herbarium) (Cavalcanti et al., 1998). O propósito geral do ELCEN é armazenar os dados das cadernetas de campo, num software de banco de dados (e não mais em arquivos de dados como no "Sistema Coleta") com características de suporte à operações típicas de sistemas distribuídos.
  • No ELCEN, além do armazenamento das fichas de coleta através da digitação convencional, o sistema permite o registro das mesmas através do uso de PDA (Personal Data Assistants), que nada mais são do que computadores PCs "de mão". Estando em trabalhos de campo, ao invés de se registrar os dados da coleta na ficha da caderneta de campo, digitam-se estes dados diretamente no PDA. No retorno de viagem, os dados do PDA são descarregados diretamente no computador hospedeiro do banco de dados do ELCEN.
Figura 4 - ELCEN: uso de cadernetas eletrônicas para digitação das fichas de coleta
  • Outro aspecto a ser considerado refere-se à centralização dos dados numa única "base de dados", diferentmente do que acontecia no "Sistema Coleta" onde os dados estavam dispersos, armazenados em vários disquetes. Com a centralização do repositório de dados, um avanço em relação à normalização dos dados foi dado. As estrutura do desenho das telas de digitação de dados permitiu diminuir a taxa de duplicidade de dados, bem como diminuir a despadronização de dados, embora isso continuasse a ocorrer.
Figura 5 - ELCEN: tela de digitação de dados
  • Apesar do avanço obtido com o projeto ELCEN (versão 1), o sistema ainda apresentava limitações para o gerenciamento da normalização de dados. Além disso, o banco de dados não estava estruturado para disponibilizar consultas aos dados via Internet, limitando assim o potencial dos dados das cadernetas de campo quanto à sua utilidade como elemento gerador de informação para a pesquisa em botânica, ecologia e recursos genéticos.

ELCEN 2.0 (2000)

  • No início do ano 2000, iniciou-se um estudo objetivando reestruturar o banco de dados ELCEN de modo a
    • Melhorar a performance do controle da integridade dos dados, mantendo-os normalizados.
    • Disponibilizar os dados do ELCEN via Internet, permitindo consultas diversificadas (parametrizadas) sobre os dados.
  • Surgiu então a proposta para a segunda versão do software ELCEN, batizada de "ELCEN versão 2.0". As principais características do ELCEN 2.0 são:
    • Estrutura de gerenciamento de dados: Banco de dados com arquitetura cliente/servidor, de modo a dispor de um ambiente computacional adequado para manutenção da consistência dos dados das cadernetas de campo, ou seja, "telas" que permitam inclusão/alteração/exclusão dos dados, mantendo-os, na medida do possível, atualizados, corretos e normalizados. As "telas" da versão anterior foram remodeladas visando obter maior eficácia no controle da consistência dos dados.
    • Consultas parametrizadas aos dados: Feitas através da Internet, permitindo o acesso aos dados das cadernetas de campo, através de consultas onde o usuário indica os critérios (parâmetros) desejados de consulta. Assim, por exemplo, o usuário pode consultar pela Internet
      • fichas de coleta referentes ao gênero Desmodium com frequência relativa 'intensa',
      • fichas de material coletado de interesse medicinal com frequência relativa de presença "intensa" em estados da região sul do país,
      • fichas de material coletado cuja cor da flor seja amarela ou amarelada e o relevo do local de coleta seja escarpado,
      • fichas de coleta do coletor João Silva realizadas no ano de 1990,
      • etc, etc...
    • Consultas aos dados de forma georreferenciada: A médio prazo pretende-se que as consultas via Internet forneçam, além das informações "alfanuméricas", informações das coletas referenciadas espacialmente, na forma de localização das coletas sobre mapas temáticos diversos (clima, relevo, biomas, solos, etc). Desta forma, o "teor informativo" dos dados de coleta, no tocante à caracterização de sua biogeografia aumentará consideravelmente. Atualmente é possível consultar apenas a localização dos pontos de coleta sobre o mapa do Brasil político referente às unidades da federação.
Figura 6 - ELCEN 2.0 - Arquitetura do Sistema

Figura 7 - ELCEN 2.0 - Exemplo de tela de captação de dados

ELCENweb

  • O ELCENweb é então este site de acesso aos dados referentes às coletas e doações disponíveis no ACERVO do Herbário CEN.

Bibliografia citada

  • Cavalcanti, T.B., Rezende, A., Togawa, R., Rodrigues, P., Favilla, L.M., Neshich, G. 1998. A new field-tested electronic system for data gathering, recording, transfer and dissemination via the World Wide Web. Taxon 47(2):381-386.
Direitos Autorais Reservados - Embrapa Recursos Genéticos e Biotecnologia 2002