|[[start|Recenso PPEIC]]|[[campo|controle de campo]]|[[digita|digitalização dos dados]]|[[controle|dados PPSP-PEIC]]| ====== Ajuste Censo 2010 ====== ** Link para os **[[dados_uso|Dados em Uso]] --- //[[gapfrey@yahoo.com|Gabriel]] 2011/06/07 18:26// ===== Outubro 2010 ===== Um diagnóstico rápido de alguns problemas que devem ser resolvidos ASAP! Baseado no arquivo abaixo peic10xy que não deveria estar aqui, veja a outra página de DADOS EM USO, tem arquivo com nome diferente!--- //[[adalardo@usp.br|Alexandre Adalardo]] 2010/10/12 06:26// ## verificando os dados peic 2010 com a Julia. 12 out 2010 peic10=read.table("peic10_xy.txt", header=TRUE, as.is=TRUE, sep="\t") str(peic10$dbh_09) ## codigo válido unique(peic10$status09) table(peic10$status09) table(peic10$status09) # A AS D E NE # 76 47673 53 973 7 1575 sum(peic10$status09=="") #[1] 76 peic10[(peic10$status09==""),] ## Esses registros não apresentam status09. Isso é possível? Achei que o campo status fosse obrigatório!! ##Verificar. Maioria digitada pelo Gabriel, na mesma semana de agosto na linha K. ##Um padrão interessante. Brigou com a namorada?! n.parc=table(peic10$parcela) mean(n.parc) max(n.parc) min(n.parc) sd(n.parc) hist(n.parc) ## temos uma parcela com 104 registro e outra com 398 ## incluir ambas para fazer checagem no campo, ambos os valores estão muito fora da media, mas principalmente o que tem quase 400 (dobro) ## VIVAS EM 2009 table(peic10$status09) peic10a=peic10[grep("A", peic10$status09),] sum(peic10a$fuste==1) sum(peic10a$fuste>1) ## JU aqui os dados com fuste 1 vivo em 2009 somam 40002. ##No seu problema os dados tinham menos fustes... o que fizemos de diferente? ## RESPOSTA JU: os meus dados têm menos porque já havia feito seleção de dados válidos, retirando dbh, x e y com NA... str(peic10a) peic10a$arvfuste[duplicated(peic10a$arvfuste)] [1] "50803_1" "1203_1" "1205_1" "2345_1" "470_1" "896_1" [7] "1133_1" "54007_1" "54008_1" "1321_1" "1825_1" "2488_1" [13] "168_1" "2645_1" "5621_1" "6537_1" "6537_2" "6537_3" [19] "364_1" "2724_1" "6195_1" "6517_1" "5996_1" "6574_1" [25] "7002_1" "56938_1" "6828_1" "8189_1" "58706_1" "58707_1" [31] "64548_1" "8099_1" "9479_1" "9481_1" "9489_1" "9491_1" [37] "9493_1" "52646_1" "20821_1" "21199_1" "21355_1" "21357_1" [43] "5331_1" "69479_1" "23167_1" "62674_1" "23098_1" "23269_1" [49] "63300_1" "21525_1" "24543_1" "5490_1" "23472_1" "70042_1" [55] "24506_1" "5531_1" "5531_2" "112050_1" "114274_1" "112400_1" [61] "112400_2" "112449_1" "74103_1" "4883_1" "50315_1" "3418_1" peic10af=peic10a[peic10a$fuste==1,] str(peic10af) peic10af$arvfuste[duplicated(peic10af$arvfuste)] #Ju, todos esses números acima são fustes duplicados com status "A" ou "AS". Esse deve ser o problema... Veja se consegue resolver os conflitos logo para verificarmos se é isso mesmo! Quando a função area basal transforma o número da placa em fator ocorre a perda de dois indivíduos que devem ter #Resposta Ju: acontece que esses fustes são de fato duplicados, não é erro de digitação mas sim erro de coleta de dados ou problema de tags duplicados no campo... ==== Funções de ajuste dos dados ==== 1. Função para criar os códigos das espécies * {{spcode2010.r|}} 2. Script para ajustar as coordenadas das árvores para a parcela toda * {{minxy.parc.r|}} ==== Junho 2011 ==== Primeiro levantamento de problemas, já estou trabalhando neles e postarei uma versão corrigida do banco de dados em [[dados_uso|Dados em Uso]] quando a versão acumular algumas alterações --- //[[gapfrey@yahoo.com|Gabriel]] 2011/06/07 18:30//. Vou especificar aqui todas as modificações para que fique registrado e não voltem problemas já resolvidos. - Padronização dos indivíduos sem identificação: há registros 'entra dados', 'Indet', 'Morta', etc. -> Todos como Indet * As coletas dos indivíduos sem identificação foram iniciadas em 17/05/2011. **Link para log das conferências de campo aqui ** - Samambaiaçus com nome padronizado: no campo com o Renato em nov/2010 e posterior confirmação com especialista indicou que ocorre apenas uma espécie de Samambaiaçu e a espécie é //Cyathea microdonta//. **OBS: nem todos os indivíduos foram observados, mas supõe-se que todos sejam a mesma espécie.** - Na coluna **Familia**, padronização de todas não identificadas para "A_indet". * Os campos encontrados foram "Entra dados", "Morta", "NA" e campo vazio. - Na coluna **genero**, padronização de todos não identificados para "Indet". * Os campos encontrados foram "entra dado", "Morta" e campo vazio. - Na coluna **specie**, padronização de todas não identificadas para "Indet" * Os campos encontrados foram "entra dado", "Morta" e campo vazio. - Erro de digitação para alguns indivíduos no campo **Familia**, **Rubiacea** foi corrigido para **Rubiaceae** - //Geonoma sp.// é //Geonoma schottiana//, corrigido. - Gênero //Geonoma// com espécie "Indet", corrigido para //Geonoma schottiana//. - Coluna **eg_campo2009** padronizada * todos os nomes em caixa baixa * todos os nomes padronizados (du/edu=eduardo, junior=juninho, jualdo=ivaldo, edson=edison) - Coluna **digita_2009** padronizada, nomes começando com maiúsculas. - Conferências e correções de identificações feitas em campo pelo Renato em nov/2010 foram incorporadas. - Células vazias preenchidas com "NA" nas seguintes colunas: **dataCol_2004** , **alt_05** , **pom_09** , **alt_09** , **codigo09** , **nomevulgar** , **obs_09** . - Ind. 50803: a coluna **pom_05** estava com a data de coleta de 2004, corrigido. - Ind. 76329: a coluna **dataCol_2004** estava com o gênero, corrigido para "NA". - Coluna **dataCol_2004** padronizada: 7-Jan -> 07/01/2004, 1-Jul -> 01/07/2004 , 2-Jul -> 02/07/2004 - Incorporação de dados de mapeamento e DBH corrigidos na linha A. - **fechamento desta versão em 02/07/11** Nova versão - Padronização dos nomes de cataia, todas como Pimenta cf. pseudocaryophyllus. - ind. 63954 tinha fuste 0 (zero)! corrigido. - coluna "codigo09" padronizada: - NE's checados e mantidos apenas na coluna "status09" - todos os códigos separados por ";" - M's checados e mantidos apenas como D na coluna "status09" - A's redundantes com a coluna "status09", excluídos. - NA's excluídos. - NC = não coletada, excluído. - NA's substituídos por células vazias. - Espécies "sp." trocadas por Indet. (exceto Myrcia sp., que é uma espécie só.) - Nomes científicos na coluna "nomevulgar" que eram redundantes foram excluídos. ==== Abril 2012 ==== - TAGs duplicados - O indivíduo em duplicata foi selecionado conforme as seguintes características: * sequência dos números na parcela distantes ao número duplicado; * ausência de dados no censo de 2009(indivíduos constava no status09 como NE ou D). - O indivíduo em duplicata foi renumerado com os seguintes terminais: * arv/arvfuste**.1** * provavelmente, o mesmo indíviduo foi mapeado duas vezes; * o status09 do indivíduo foi alterado para E (excluído); * na planilha de dados, essas situações tem como código TDE ([[codigos| Status & Códigos]]) - coluna "codigo_2012". * arv/arvfuste**.9** * provavelmente, são indíviduos distintos, porém com o mesmo tag; * o status09 do indivíduo não foi alterado; * na planilha de dados, essas situações tem como código TDA ([[codigos| Status & Códigos]]) - coluna "codigo_2012". - Alteração do status09 para indíviduos encontrados vivos (A) em 2011/12 e que anteriormente estavam como NE ou D.