4 Bases de Dados. Dados do PPBio Semiárido

Exemplos de conjunto de dados ecológicos do Programa de Pesquisa em Biodiversidade (PPBio) do Semiárido

RESUMO

Para entender a distribuição das espécies de peixes e seu uso de habitat, uma série de variáveis ambientais foram avaliadas como preditores da composição e riqueza da assembleia de peixes em sistemas aquáticos tropicais semiáridos. Nós pesquisamos a composição de espécies de assembleias de peixes em sistemas aquáticos semiáridos e estabelecemos seu grau de associação com a estrutura do habitat aquático. Os locais consistiam em trechos de riachos com fluxo de água superficial, poças temporárias isoladas e reservatórios artificiais (açudes). A amostragem de peixes foi realizada em quatro ocasiões durante as estações chuvosa (abril e junho de 2006) e seca (setembro e dezembro de 2006).

Palavras-chave: rios intermitentes, reservatórios, conservação, composição de substratos.

4.1 Sobre os dados do PPBio

Usaremos ao longo desse livro dados que fazem parte de um estudo mais amplo sobre ecologia de rios do semiárido, coletados no Programa de Pesquisa em Biodiversidade - PPBio (Veja Programa de Pesquisa em Biodiversidade – PPBio). Parte desses dados está armazenada em planilhas de Excel ppbio**.xlsx (Figura 4.1). Essas matrizes de dados são descritas na Tabela 4.1. As planilhas ppbio**.xlsx contém vários tipos de dados arranjados em matrizes n x m que incluem dados de abundância de espécies em diferentes unidades amostrais (UA’s), dados da estrutura do habitat físico, e variáveis em escala de bacia hidrográfica, dados de contagem de indivíduos ajustados para Captura Por Unidade de Esforço (CPUE), etc (Figura 4.1).

Parte da planilha de dados brutos do PPBio.

Figura 4.1: Parte da planilha de dados brutos do PPBio.

Por exemplo, essa é a matriz bruta de dados, porque os valores ainda não foram ajustados para os valores de Captura Por Unidade de Esforço (CPUE), nem foram relativizados ou transformados. Outros tipos de arquivos existem sobre esses dados (Tabela 4.1).

Várias das espécies nessa matriz tem grande importância ecológica, como é o caso de Astyanax bimaculatus1 (Figura 4.2), que é muito comum em rios intermitentes e serve de alimento para predadores maiores (E. P. da Silva, Duarte, and Medeiros 2018) como a espécie Hoplias malabaricus2 (Figura 4.3)(M. J. Silva et al. 2010).

*Astyanax bimaculatus*, a espécie mais comum da matriz de dados ppbio. Peru, by Eakins, R. Fonte: <https://www.fishbase.se/summary/Astianax-bimaculatus.html>

Figura 4.2: Astyanax bimaculatus, a espécie mais comum da matriz de dados ppbio. Peru, by Eakins, R. Fonte: https://www.fishbase.se/summary/Astianax-bimaculatus.html

*Hoplias malabaricus*, espécie que cresce para se tornar um importante predador. Brazil, by Roselet, F.F.G. Fonte: <https://www.fishbase.se/summary/Hoplias-malabaricus.html>

Figura 4.3: Hoplias malabaricus, espécie que cresce para se tornar um importante predador. Brazil, by Roselet, F.F.G. Fonte: https://www.fishbase.se/summary/Hoplias-malabaricus.html

Outras espécies como Apareiodon hasemani3 (Figura 4.4 tem importância trófica por estar na base da cadeia alimentar, enquanto espécies da família Loricariidae, como Pseudancistrus genisetiger4 (Figura 4.5), tem importância para taxonomia.

*Apareiodon sp.*, importante espécie bentopelágica das bacias dos rios Jaguaribe e Paraíba. Brazil, by Ramos, T.P.A. Fonte: <https://www.fishbase.se/summary/Apareiodon-davisi.html>

Figura 4.4: Apareiodon sp., importante espécie bentopelágica das bacias dos rios Jaguaribe e Paraíba. Brazil, by Ramos, T.P.A. Fonte: https://www.fishbase.se/summary/Apareiodon-davisi.html

*Pseudancistrus genisetiger*, uma espécie endêmica das bacias hidrográfcas do nordeste. By Medeiros, E.S.F. Fonte: Arquivo pessoal

Figura 4.5: Pseudancistrus genisetiger, uma espécie endêmica das bacias hidrográfcas do nordeste. By Medeiros, E.S.F. Fonte: Arquivo pessoal

As planilhas ppbio**.xlsx contém o delineamento amostral de um dos estudos do Projeto PPBio (Figura 4.6. Nas linhas são apresentadas as abreviações dos nomes das unidades amostrais (UA’s) e nas colunas são apresentados os nomes abreviados das espécies - temos portando uma matriz comunitária (Tabela 4.1). No corpo da planilha temos os valores para o tipo de dados amostrado. Quantitativo, semi-quatitativo ou qualitativo.
Qual desses tipos de dados você acha que é apresentado na planilha?

Associação entre a planilha de dados brutos do PPBio e o delineamento amostral do estudo.

Figura 4.6: Associação entre a planilha de dados brutos do PPBio e o delineamento amostral do estudo.

4.2 Arquivos disponíveis

A seguir, apresento uma tabela com as informações essenciais sobre as matrizes de dados que serão utilizadas ao longo deste livro (Tabela 4.1). Nela, estão descritos os diferentes tipos de matrizes, suas finalidades analíticas e o tipo de dado para cada uma delas. Essas informações servirão de referência para compreender a origem, a estrutura e o tratamento recomendado para os dados empregados nas análises subsequentes. Você pode baixar essas matrizes clicando no link para o arquivo em .xlsx na coluna Arquivo. Ao vizualizar a matriz que deseja baixar, clique em Arquivo > Baixar > Microsoft Excel (.xlsx). Atente para a pasta onde seu computador baixa o arquivo desejado, você vai precisar dessa informação depois.

Tabela 4.1: Matrizes disponíveis para análises, com suas descrições e tipos de dados recomendados.
Arquivo (.xlsx) Tipo de matriz Descrição Tipo de dados
ppbio06c-peixes Matriz comunitária O arquivo ppbio06 traz os dados brutos que serão usados nas análises. A matriz de dados brutos contendo 26 localidades em estações do ano diferentes (objetos) x 35 espécies (atributos), antes de qualquer modificação. Contagens de indivíduos com alta amplitude de variação, sugerido uso de matriz relativizada.
ppbio06p-amb Matriz ambiental O arquivo ppbio06h traz os dados brutos que serão usados nas análises. A matriz de dados brutos contendo 26 localidades em estações diferentes (objetos) x 35 variáveis ambienteis (atributos) medidas em diferentes escalas espaciais, antes de qualquer modificação. Unidades de medição diferentes (cm, m, °C, mg/L, etc.), com uma alta amplitude de variação, sugerido uso de matriz transformada e/ou reescalada.
ppbio06-grupos Matriz de grupos O arquivo ppbio06 traz os dados brutos que serão usados nessa análise. A matriz de dados brutos contendo 26 locais/ocasiões (objetos) x 35 espécies (atributos), antes de qualquer modificação. Contagens de indivíduos com alta amplitude de variação, sugerido uso de matriz relativizada.
ppbio06cpue Matriz comunitária O arquivo ppbio06cpue traz os valores depois de terem sidos ajustados pela Captura Por Unidade de Esforço (CPUE), onde o número de indivíduos de cada espécie em uma determinada UA é dividido pelo esforço de captura daquela UA. Isso significa que os dados foram relativizados pela CPUE. A matriz de dados brutos contendo 26 localidades em estações do ano diferentes (objetos) x 35 espécies (atributos), antes de qualquer modificação. Densidades de indivíduos (no. de indivíduos por Unidade de Esforço de Captura) com alta amplitude de variação, sugerido uso de matriz relativizada.

4.2.1 Codificação das variáveis

Os arquivos da base de dados do projeto são fornecidos em formato Excel (.xlsx). Por exemplo, o arquivo ppbio06-*.xlsx, traz os dados brutos que serão usados nas análises. A matriz de dados brutos contem mais de 20 localidades (m=linhas ou objetos) em estações do ano diferentes, e cerca de 35 espécies (n=colunas ou atributos), antes de qualquer modificação. Portando é uma matriz bruta. Os valores são contagens de indivíduos, e apresentam uma alta amplitude de variação, portanto, o uso de uma matriz relativizada é sugerido (Figura 4.1). Nos nomes dos objetos e dos atributos são codificados de acordo com a tabela mostrada na Figura 4.7.

Codificação para as variáveis, espécies de peixes, sítios de amostragem e período de amostragem

Figura 4.7: Codificação para as variáveis, espécies de peixes, sítios de amostragem e período de amostragem

4.2.2 Abreviações

No interesse de sistematizar o código R das várias matrizes que são comumente usadas em uma AMD, a tabela 4.2, a seguir, resume seus tipos e abreviações.

Tabela 4.2: Nomenclatura das matrizes em AMD em relação aos atributos das colunas e suas abreviações nos códigos do R.
Nome Atributos (colunas) Abreviação no R
Matriz comunitaria Os atributos são táxons ou OTU’s (Unidades Taxonômicas Operacionais) (ex. espécies, gêneros, morfotipos) m_com
Matriz ambiental Os atributos são dados ambientais e variáveis físicas e químicas (ex. pH, condutividade, temperatura) m_amb
Matriz de habitat Os atributos são elementos da estrutura do habitat (ex. macróficas, algas, pedras, lama, etc) m_hab
Matriz bruta Os atributos ainda não receberam nenhum tipo de tratamento estatísco (valores brutos, como coletados) m_bruta
Matriz transposta Os atributos foram transpostos para as linhas m_t
Matriz relativizada Os atributos foram relativizados por um critério de tamanho ou de variação (ex. dividir os valores de cada coluna pela soma) m_rel, m_relcol, m_rellin
Matriz transformada Foi aplicado um operador matemático a todos os atributos (ex. raiz quadrada, log) m_trns, m_log10, m_asrq
Matriz de distâncias Matriz de m x m similaridades ou de distâncias (ex. Euclidiana, Manhattan, Bray-Curtis, etc) m_dists, m_euclid, m_bray
Matriz de trabalho Qualquer matriz que seja o foco da análise atual (ex. comunitária, relativizada, etc) m_trab
Matriz particionada Foram removidas linhas ou colunas (ex. linhas que são outliers e espécies zeradas) m_part
Base de dados Arquivo do Excel planilhado a partir de dados de campo ou de laboratório. Será manejada e particionada no R, para criar a Matriz bruta ppbio06.xlsx, zoorebio.xlsx, bentos06.xlsx

Referências

Bibliografia

Silva, Elmo Pereira da, Maria Rita Nascimento Duarte, and Elvio Sergio Figueredo Medeiros. 2018. “Length-Weight Relationship of Two Fish Species from a Dryland Intermittent River in Northeastern Brazil.” Journal Article. Neotropical Biology and Conservation 13 (1). https://doi.org/10.4013/nbc.2018.131.11.
Silva, Márcio J., Bruno R. S. Figueiredo, Robson T. C. Ramos, and Elvio S. F. Medeiros. 2010. “Food Resources Used by Three Species of Fish in the Semi-Arid Region of Brazil.” Journal Article. Neotropical Ichthyology 8 (4): 825–33. https://doi.org/10.1590/S1679-62252010005000010 .

  1. A etimologia do gênero Astyanax vem da mitologia Grega. Heitor personagem da “Ilíada”, tinha um filho chamado Astíanax.↩︎

  2. Do Grego, hoplon, arma ou armadura, em referência aos dentes caniniformes muito desenvolvidos, e forte estrutura óssea na cabeça.↩︎

  3. A etimologia do nome Apareiodon vem do Grego, a, sem, pareia, lateral ou bochecha, e odous dentição, em referência a ausência de dentes laterais no aparato bucal dessa espécie.”↩︎

  4. A etimologia do nome Pseudancistrus vem do Grego, pseudes, falso, e agkistron, gancho, em referência a falsos ganchos presentes na cabeça em algumas espécies do gênero.↩︎