Link para os Dados em Uso — Gabriel 2011/06/07 18:26
Um diagnóstico rápido de alguns problemas que devem ser resolvidos ASAP! Baseado no arquivo abaixo peic10xy que não deveria estar aqui, veja a outra página de DADOS EM USO, tem arquivo com nome diferente!— Alexandre Adalardo 2010/10/12 06:26
## verificando os dados peic 2010 com a Julia. 12 out 2010
peic10=read.table("peic10_xy.txt", header=TRUE, as.is=TRUE, sep="\t")
str(peic10$dbh_09)
## codigo válido
unique(peic10$status09)
table(peic10$status09)
table(peic10$status09)
# A AS D E NE
# 76 47673 53 973 7 1575
sum(peic10$status09=="")
#[1] 76
peic10[(peic10$status09==""),]
## Esses registros não apresentam status09. Isso é possível? Achei que o campo status fosse obrigatório!!
##Verificar. Maioria digitada pelo Gabriel, na mesma semana de agosto na linha K.
##Um padrão interessante. Brigou com a namorada?!
n.parc=table(peic10$parcela)
mean(n.parc)
max(n.parc)
min(n.parc)
sd(n.parc)
hist(n.parc)
## temos uma parcela com 104 registro e outra com 398
## incluir ambas para fazer checagem no campo, ambos os valores estão muito fora da media, mas principalmente o que tem quase 400 (dobro)
## VIVAS EM 2009
table(peic10$status09)
peic10a=peic10[grep("A", peic10$status09),]
sum(peic10a$fuste==1)
sum(peic10a$fuste>1)
## JU aqui os dados com fuste 1 vivo em 2009 somam 40002.
##No seu problema os dados tinham menos fustes... o que fizemos de diferente?
## RESPOSTA JU: os meus dados têm menos porque já havia feito seleção de dados válidos, retirando dbh, x e y com NA...
str(peic10a)
peic10a$arvfuste[duplicated(peic10a$arvfuste)]
[1] "50803_1" "1203_1" "1205_1" "2345_1" "470_1" "896_1"
[7] "1133_1" "54007_1" "54008_1" "1321_1" "1825_1" "2488_1"
[13] "168_1" "2645_1" "5621_1" "6537_1" "6537_2" "6537_3"
[19] "364_1" "2724_1" "6195_1" "6517_1" "5996_1" "6574_1"
[25] "7002_1" "56938_1" "6828_1" "8189_1" "58706_1" "58707_1"
[31] "64548_1" "8099_1" "9479_1" "9481_1" "9489_1" "9491_1"
[37] "9493_1" "52646_1" "20821_1" "21199_1" "21355_1" "21357_1"
[43] "5331_1" "69479_1" "23167_1" "62674_1" "23098_1" "23269_1"
[49] "63300_1" "21525_1" "24543_1" "5490_1" "23472_1" "70042_1"
[55] "24506_1" "5531_1" "5531_2" "112050_1" "114274_1" "112400_1"
[61] "112400_2" "112449_1" "74103_1" "4883_1" "50315_1" "3418_1"
peic10af=peic10a[peic10a$fuste==1,]
str(peic10af)
peic10af$arvfuste[duplicated(peic10af$arvfuste)]
#Ju, todos esses números acima são fustes duplicados com status "A" ou "AS". Esse deve ser o problema... Veja se consegue resolver os conflitos logo para verificarmos se é isso mesmo! Quando a função area basal transforma o número da placa em fator ocorre a perda de dois indivíduos que devem ter
#Resposta Ju: acontece que esses fustes são de fato duplicados, não é erro de digitação mas sim erro de coleta de dados ou problema de tags duplicados no campo...
1. Função para criar os códigos das espécies
2. Script para ajustar as coordenadas das árvores para a parcela toda
Primeiro levantamento de problemas, já estou trabalhando neles e postarei uma versão corrigida do banco de dados em Dados em Uso quando a versão acumular algumas alterações — Gabriel 2011/06/07 18:30. Vou especificar aqui todas as modificações para que fique registrado e não voltem problemas já resolvidos.
Nova versão