Conteúdo

Recenso PPEIC	controle de campo	digitalização dos dados	dados PPSP-PEIC

Link para os Dados em Uso — Gabriel 2011/06/07 18:26

Um diagnóstico rápido de alguns problemas que devem ser resolvidos ASAP! Baseado no arquivo abaixo peic10xy que não deveria estar aqui, veja a outra página de DADOS EM USO, tem arquivo com nome diferente!— Alexandre Adalardo 2010/10/12 06:26

## verificando os dados peic 2010 com a Julia. 12 out 2010
peic10=read.table("peic10_xy.txt", header=TRUE, as.is=TRUE, sep="\t")
str(peic10$dbh_09)
## codigo válido
unique(peic10$status09)
table(peic10$status09)
table(peic10$status09)

#          A    AS     D     E    NE 
#   76 47673    53   973     7  1575 
sum(peic10$status09=="")
#[1] 76
peic10[(peic10$status09==""),]
## Esses registros não apresentam status09. Isso é possível? Achei que o campo status fosse obrigatório!!
##Verificar. Maioria digitada pelo Gabriel, na mesma semana de agosto na linha K. 
##Um padrão interessante. Brigou com a namorada?!

n.parc=table(peic10$parcela)
mean(n.parc)
max(n.parc)
min(n.parc)
sd(n.parc)
hist(n.parc)

## temos uma parcela com 104 registro e outra com 398
## incluir ambas para fazer checagem no campo, ambos os valores estão muito fora da media, mas principalmente o que tem quase 400 (dobro)

## VIVAS EM 2009 
table(peic10$status09)
peic10a=peic10[grep("A", peic10$status09),]
sum(peic10a$fuste==1)
sum(peic10a$fuste>1)
## JU aqui os dados com fuste 1 vivo em 2009 somam 40002. 
##No seu problema os dados tinham menos fustes... o que fizemos de diferente? 
## RESPOSTA JU: os meus dados têm menos porque já havia feito seleção de dados válidos, retirando dbh, x e y com NA... 
str(peic10a)
peic10a$arvfuste[duplicated(peic10a$arvfuste)]


 [1] "50803_1"  "1203_1"   "1205_1"   "2345_1"   "470_1"    "896_1"   
 [7] "1133_1"   "54007_1"  "54008_1"  "1321_1"   "1825_1"   "2488_1"  
[13] "168_1"    "2645_1"   "5621_1"   "6537_1"   "6537_2"   "6537_3"  
[19] "364_1"    "2724_1"   "6195_1"   "6517_1"   "5996_1"   "6574_1"  
[25] "7002_1"   "56938_1"  "6828_1"   "8189_1"   "58706_1"  "58707_1" 
[31] "64548_1"  "8099_1"   "9479_1"   "9481_1"   "9489_1"   "9491_1"  
[37] "9493_1"   "52646_1"  "20821_1"  "21199_1"  "21355_1"  "21357_1" 
[43] "5331_1"   "69479_1"  "23167_1"  "62674_1"  "23098_1"  "23269_1" 
[49] "63300_1"  "21525_1"  "24543_1"  "5490_1"   "23472_1"  "70042_1" 
[55] "24506_1"  "5531_1"   "5531_2"   "112050_1" "114274_1" "112400_1"
[61] "112400_2" "112449_1" "74103_1"  "4883_1"   "50315_1"  "3418_1"  

peic10af=peic10a[peic10a$fuste==1,]
str(peic10af)
peic10af$arvfuste[duplicated(peic10af$arvfuste)]

#Ju, todos esses números acima são fustes duplicados com status "A" ou "AS". Esse deve ser o problema... Veja se consegue resolver os conflitos logo para verificarmos se é isso mesmo! Quando a função area basal  transforma o número da placa em fator ocorre a perda de dois indivíduos que devem ter 
#Resposta Ju: acontece que esses fustes são de fato duplicados, não é erro de digitação mas sim erro de coleta de dados ou problema de tags duplicados no campo...

1. Função para criar os códigos das espécies

spcode2010.r

2. Script para ajustar as coordenadas das árvores para a parcela toda

minxy.parc.r

Primeiro levantamento de problemas, já estou trabalhando neles e postarei uma versão corrigida do banco de dados em Dados em Uso quando a versão acumular algumas alterações — Gabriel 2011/06/07 18:30. Vou especificar aqui todas as modificações para que fique registrado e não voltem problemas já resolvidos.

Padronização dos indivíduos sem identificação: há registros 'entra dados', 'Indet', 'Morta', etc. → Todos como Indet
- As coletas dos indivíduos sem identificação foram iniciadas em 17/05/2011. Link para log das conferências de campo aqui
Samambaiaçus com nome padronizado: no campo com o Renato em nov/2010 e posterior confirmação com especialista indicou que ocorre apenas uma espécie de Samambaiaçu e a espécie é Cyathea microdonta. OBS: nem todos os indivíduos foram observados, mas supõe-se que todos sejam a mesma espécie.
Na coluna Familia, padronização de todas não identificadas para “A_indet”.
- Os campos encontrados foram “Entra dados”, “Morta”, “NA” e campo vazio.
Na coluna genero, padronização de todos não identificados para “Indet”.
- Os campos encontrados foram “entra dado”, “Morta” e campo vazio.
Na coluna specie, padronização de todas não identificadas para “Indet”
- Os campos encontrados foram “entra dado”, “Morta” e campo vazio.
Erro de digitação para alguns indivíduos no campo Familia, Rubiacea foi corrigido para Rubiaceae
Geonoma sp. é Geonoma schottiana, corrigido.
Gênero Geonoma com espécie “Indet”, corrigido para Geonoma schottiana.
Coluna eg_campo2009 padronizada
- todos os nomes em caixa baixa
- todos os nomes padronizados (du/edu=eduardo, junior=juninho, jualdo=ivaldo, edson=edison)
Coluna digita_2009 padronizada, nomes começando com maiúsculas.
Conferências e correções de identificações feitas em campo pelo Renato em nov/2010 foram incorporadas.
Células vazias preenchidas com “NA” nas seguintes colunas: dataCol_2004 , alt_05 , pom_09 , alt_09 , codigo09 , nomevulgar , obs_09 .
Ind. 50803: a coluna pom_05 estava com a data de coleta de 2004, corrigido.
Ind. 76329: a coluna dataCol_2004 estava com o gênero, corrigido para “NA”.
Coluna dataCol_2004 padronizada: 7-Jan → 07/01/2004, 1-Jul → 01/07/2004 , 2-Jul → 02/07/2004
Incorporação de dados de mapeamento e DBH corrigidos na linha A.
fechamento desta versão em 02/07/11

Nova versão

Padronização dos nomes de cataia, todas como Pimenta cf. pseudocaryophyllus.
ind. 63954 tinha fuste 0 (zero)! corrigido.
coluna “codigo09” padronizada:
1. NE's checados e mantidos apenas na coluna “status09”
2. todos os códigos separados por “;”
3. M's checados e mantidos apenas como D na coluna “status09”
4. A's redundantes com a coluna “status09”, excluídos.
5. NA's excluídos.
6. NC = não coletada, excluído.
NA's substituídos por células vazias.
Espécies “sp.” trocadas por Indet. (exceto Myrcia sp., que é uma espécie só.)
Nomes científicos na coluna “nomevulgar” que eram redundantes foram excluídos.

TAGs duplicados
1. O indivíduo em duplicata foi selecionado conforme as seguintes características:
  - sequência dos números na parcela distantes ao número duplicado;
  - ausência de dados no censo de 2009(indivíduos constava no status09 como NE ou D).
2. O indivíduo em duplicata foi renumerado com os seguintes terminais:
  - arv/arvfuste.1
    - provavelmente, o mesmo indíviduo foi mapeado duas vezes;
    - o status09 do indivíduo foi alterado para E (excluído);
    - na planilha de dados, essas situações tem como código TDE ( Status & Códigos) - coluna “codigo_2012”.
  - arv/arvfuste.9
    - provavelmente, são indíviduos distintos, porém com o mesmo tag;
    - o status09 do indivíduo não foi alterado;
    - na planilha de dados, essas situações tem como código TDA ( Status & Códigos) - coluna “codigo_2012”.
Alteração do status09 para indíviduos encontrados vivos (A) em 2011/12 e que anteriormente estavam como NE ou D.

Ajuste Censo 2010

Outubro 2010

Funções de ajuste dos dados

Junho 2011

Abril 2012

LabTrop