Causas de mortalidade
20 ago 2011
Dúvida análise causas de morte RA x RB:
Oi Alê, tudo bem?
Estou com uma dúvida que está me emperrando. É sobre as causas de morte (sintomas) das minhas plântulas. Quero saber se as causas de morte diferem entre as plântulas colocadas na RA e na RB (lembrando que são 10 parcelas em cada ambiente, com 15 plântulas de cada espécie em cada parcela; ou seja 150 plantas na RB e 150 na RA para cada espécie).
H0: causas de morte não diferem entre os ambientes
A princípio achei que seria apenas uma análise tabular, com a contagem, entre as plântulas mortas, aquelas que apresentaram cada tipo de sintoma, separadamente por ambiente. Por exemplo. Para Clusia criva os dados são estes ( nº total de plântulas mortas com cada sintoma):
Sintoma|ambiente RB RA apodrecimento 18 11 Dano físico 2 3 Murcha e seca 1 2 Não determinada 7 17 Patógeno foliar 0 1 Predação severa 39 71 totais 67 105
E então usaria chi-quadrado (ou outra análise semelhante), separadamente para cada sp.
Mas para usar esse tipo de análise as réplicas devem ser independentes (ver pag 203 do Gotelli verde). E aí vem a dúvida, porque no meu caso as plântulas que estão em uma mesma parcela não são independentes certo? A morte de uma pode não ser independente da morte das outras (por exemplo se passou um bicho e comeu algumas de uma só vez). O Gotelli sugere então usar os dados como proporções ( o que torna a variável resposta contínua).
1)Então teria que fazer para cada parcela a proporção de plântulas mortas com cada sintoma? Então teria uma proporção média de plantas com cada sintoma em cada ambiente (RA x RB)? Isso seria um desenho de ANOVA two-way (fatores: ambiente com dois níves e sintomas com seis níveis)?? Posso pensar em ANOVA mesmo que o fator “sintomas” não tenha sido aplicado, mas sim observado entre aquelas que morreram?
2) Se usar proporções então cada réplica vão ser as plântulas mortas em cada parcela, certo? Só que esse número varia entre as parcelas ( de 3 a 13 indivíduos mortos no caso da Clusia por exemplo). Não tem problema essa falta de balanceamento? Além disso vai ter um monte de zeros no meio (parcelas em que um determinado sintoma não apareceu).
Você tem alguma outra sugestão de como pensar nessa análise? Algo com Monte Carlo?
Resposta Alê:
Oi Dani, Monte Carlo pode ser uma possibilidade, vou pensar… A principio, preciso pensar melhor, o seu modelo é um multinomial misto. Ou melhor uma regressão logística multinomial (+ mista). Parece que cada planta pode ser classificada em uma das categorias definidas, ou seja há uma probabilidade associada a ela ser de dada categoria. O problema é que é há um efeito randomico associado ás parcelas que deve ser levado em consideração. Se fosse só multinomial não teria problema, mas temos que ver como incluir o bloco. Nunca fiz uma análise com essas características, mas imagino que seja muito comum em outras áreas e que deve ter algo no R já implementado. Vou dar um procurada…
Oi Dani,
Acho que podemos usar o “nested multinomial regression” descrito no link abaixo:
http://cran.r-project.org/web/packages/mlogit/vignettes/mlogit.pdf
Veja o linque abaixo tb. É sobre análises em Ciências Sociais: http://cran.r-project.org/web/views/SocialSciences.html
