O primeiro GLM para Rudgea: variável resposta = abundância
Começando pelo modelo mais completo
mod.1 <- glm(abund ~ dossel * serap * adultos * flor, family=poisson, data=dados)
Resultado
summary(mod.1)
Call:
glm(formula = abund ~ dossel * serap * adultos * flor, family = poisson,
data = dados)
Deviance Residuals:
Min 1Q Median 3Q Max
-5.4908 -1.4717 -0.3059 0.7598 7.9097
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.890873 0.595529 4.854 1.21e-06 ***
dossel -0.257446 0.143638 -1.792 0.07308 .
serap -0.242865 0.118591 -2.048 0.04057 *
adultos 0.337992 0.468025 0.722 0.47019
florjeanzao -0.719509 1.616034 -0.445 0.65615
flormedico -11.478219 5.154742 -2.227 0.02597 *
florodorico -0.126093 1.644449 -0.077 0.93888
florosasco 3.482358 1.035320 3.364 0.00077 ***
florteomar 3.366860 1.082812 3.109 0.00187 **
dossel:serap 0.032199 0.020627 1.561 0.11852
dossel:adultos 0.066767 0.157305 0.424 0.67124
serap:adultos -0.030853 0.115958 -0.266 0.79018
dossel:florjeanzao 0.166020 0.227422 0.730 0.46538
dossel:flormedico 0.820495 0.616884 1.330 0.18350
dossel:florodorico -0.032358 0.390574 -0.083 0.93397
dossel:florosasco -0.317100 0.207600 -1.527 0.12665
dossel:florteomar -0.297238 0.274469 -1.083 0.27883
serap:florjeanzao 0.157155 0.417284 0.377 0.70646
serap:flormedico 0.931591 0.567465 1.642 0.10066
serap:florodorico -0.199085 0.327104 -0.609 0.54277
serap:florosasco -0.156472 0.166092 -0.942 0.34615
serap:florteomar -0.489335 0.259063 -1.889 0.05891 .
adultos:florjeanzao 0.734964 4.237335 0.173 0.86230
adultos:flormedico 1.896027 1.079190 1.757 0.07894 .
adultos:florodorico -0.272340 0.666816 -0.408 0.68297
adultos:florosasco 1.454350 0.974466 1.492 0.13558
adultos:florteomar -0.713619 0.485635 -1.469 0.14171
dossel:serap:adultos -0.017190 0.040485 -0.425 0.67113
dossel:serap:florjeanzao -0.026047 0.053276 -0.489 0.62491
dossel:serap:flormedico -0.060543 0.067943 -0.891 0.37288
dossel:serap:florodorico 0.048150 0.072328 0.666 0.50559
dossel:serap:florosasco 0.008791 0.027938 0.315 0.75302
dossel:serap:florteomar 0.088009 0.064792 1.358 0.17436
dossel:adultos:florjeanzao -0.285558 0.727116 -0.393 0.69452
dossel:adultos:flormedico -0.211370 0.188549 -1.121 0.26227
dossel:adultos:florodorico -0.033312 0.200516 -0.166 0.86805
dossel:adultos:florosasco -0.473579 0.253015 -1.872 0.06124 .
dossel:adultos:florteomar 0.022086 0.160923 0.137 0.89084
serap:adultos:florjeanzao -0.399910 1.224290 -0.327 0.74394
serap:adultos:flormedico -0.204817 0.165617 -1.237 0.21620
serap:adultos:florodorico 0.025898 0.151729 0.171 0.86447
serap:adultos:florosasco -0.081103 0.168488 -0.481 0.63026
serap:adultos:florteomar 0.127629 0.120851 1.056 0.29093
dossel:serap:adultos:florjeanzao 0.110264 0.206674 0.534 0.59368
dossel:serap:adultos:flormedico 0.033912 0.042284 0.802 0.42254
dossel:serap:adultos:florodorico 0.010934 0.046827 0.234 0.81537
dossel:serap:adultos:florosasco 0.042465 0.049027 0.866 0.38640
dossel:serap:adultos:florteomar -0.006228 0.041559 -0.150 0.88088
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 1891.35 on 178 degrees of freedom
Residual deviance: 674.34 on 131 degrees of freedom
(1 observation deleted due to missingness)
AIC: 1339.1
Number of Fisher Scoring iterations: 6
Não sei se entendi direito o que significa o p no summary().
Tu falou que “o p que aparece é simplesmente o teste se esse valor (diferença) é diferente de zero”.
O Dalgaard (2002) diz que (não vou traduzir pois acho que estou entendendo errado): “the test says anything about what happens only if you remove one variable and leave in all the others. You cannot see whether a variable would be statiscally significant in a reduced model…”(p.152 capítulo sobre Regressão Múltipla).
O teste diz se há efeito remover a variável e não se ela em si é significativamente importante:?:
> anova(mod.1, test="Chi")
Analysis of Deviance Table
Model: poisson, link: log
Response: abund
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 178 1891.35
dossel 1 242.75 177 1648.60 9.868e-55
serap 1 21.80 176 1626.80 3.019e-06
adultos 1 190.58 175 1436.22 2.374e-43
flor 5 305.47 170 1130.74 6.663e-64
dossel:serap 1 4.79 169 1125.95 0.03
dossel:adultos 1 78.44 168 1047.51 8.236e-19
serap:adultos 1 58.45 167 989.06 2.084e-14
dossel:flor 5 122.20 162 866.85 1.072e-24
serap:flor 5 10.59 157 856.27 0.06
adultos:flor 5 100.94 152 755.33 3.350e-20
dossel:serap:adultos 1 19.66 151 735.66 9.230e-06
dossel:serap:flor 5 5.03 146 730.63 0.41
dossel:adultos:flor 5 40.15 141 690.48 1.393e-07
serap:adultos:flor 5 7.64 136 682.84 0.18
dossel:serap:adultos:flor 5 8.50 131 674.34 0.13
Mas tem overdispersion, então tem que refazer com quasipoisson…
> mod.2 <- glm(abund ~ dossel * serap * adultos * flor, family=quasipoisson, data=dados)
> summary(mod.2)
Call:
glm(formula = abund ~ dossel * serap * adultos * flor, family = quasipoisson,
data = dados)
Deviance Residuals:
Min 1Q Median 3Q Max
-5.4908 -1.4717 -0.3059 0.7598 7.9097
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.890873 1.457789 1.983 0.0495 *
dossel -0.257446 0.351611 -0.732 0.4654
serap -0.242865 0.290296 -0.837 0.4043
adultos 0.337992 1.145673 0.295 0.7684
florjeanzao -0.719509 3.955872 -0.182 0.8560
flormedico -11.478219 12.618231 -0.910 0.3647
florodorico -0.126093 4.025427 -0.031 0.9751
florosasco 3.482358 2.534347 1.374 0.1718
florteomar 3.366860 2.650603 1.270 0.2063
dossel:serap 0.032199 0.050492 0.638 0.5248
dossel:adultos 0.066767 0.385065 0.173 0.8626
serap:adultos -0.030853 0.283852 -0.109 0.9136
dossel:florjeanzao 0.166020 0.556702 0.298 0.7660
dossel:flormedico 0.820495 1.510063 0.543 0.5878
dossel:florodorico -0.032358 0.956081 -0.034 0.9731
dossel:florosasco -0.317100 0.508181 -0.624 0.5337
dossel:florteomar -0.297238 0.671870 -0.442 0.6589
serap:florjeanzao 0.157155 1.021464 0.154 0.8780
serap:flormedico 0.931591 1.389092 0.671 0.5036
serap:florodorico -0.199085 0.800715 -0.249 0.8040
serap:florosasco -0.156472 0.406574 -0.385 0.7010
serap:florteomar -0.489335 0.634157 -0.772 0.4417
adultos:florjeanzao 0.734964 10.372522 0.071 0.9436
adultos:flormedico 1.896027 2.641737 0.718 0.4742
adultos:florodorico -0.272340 1.632290 -0.167 0.8677
adultos:florosasco 1.454350 2.385385 0.610 0.5431
adultos:florteomar -0.713619 1.188780 -0.600 0.5493
dossel:serap:adultos -0.017190 0.099103 -0.173 0.8626
dossel:serap:florjeanzao -0.026047 0.130413 -0.200 0.8420
dossel:serap:flormedico -0.060543 0.166316 -0.364 0.7164
dossel:serap:florodorico 0.048150 0.177051 0.272 0.7861
dossel:serap:florosasco 0.008791 0.068388 0.129 0.8979
dossel:serap:florteomar 0.088009 0.158603 0.555 0.5799
dossel:adultos:florjeanzao -0.285558 1.779899 -0.160 0.8728
dossel:adultos:flormedico -0.211370 0.461546 -0.458 0.6477
dossel:adultos:florodorico -0.033312 0.490841 -0.068 0.9460
dossel:adultos:florosasco -0.473579 0.619353 -0.765 0.4459
dossel:adultos:florteomar 0.022086 0.393920 0.056 0.9554
serap:adultos:florjeanzao -0.399910 2.996924 -0.133 0.8941
serap:adultos:flormedico -0.204817 0.405411 -0.505 0.6143
serap:adultos:florodorico 0.025898 0.371416 0.070 0.9445
serap:adultos:florosasco -0.081103 0.412440 -0.197 0.8444
serap:adultos:florteomar 0.127629 0.295830 0.431 0.6669
dossel:serap:adultos:florjeanzao 0.110264 0.505916 0.218 0.8278
dossel:serap:adultos:flormedico 0.033912 0.103507 0.328 0.7437
dossel:serap:adultos:florodorico 0.010934 0.114628 0.095 0.9242
dossel:serap:adultos:florosasco 0.042465 0.120012 0.354 0.7240
dossel:serap:adultos:florteomar -0.006228 0.101732 -0.061 0.9513
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for quasipoisson family taken to be 5.992156)
Null deviance: 1891.35 on 178 degrees of freedom
Residual deviance: 674.34 on 131 degrees of freedom
(1 observation deleted due to missingness)
AIC: NA
Number of Fisher Scoring iterations: 6
> anova(mod.2, test="Chi")
Analysis of Deviance Table
Model: quasipoisson, link: log
Response: abund
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 178 1891.35
dossel 1 242.75 177 1648.60 1.954e-10
serap 1 21.80 176 1626.80 0.06
adultos 1 190.58 175 1436.22 1.704e-08
flor 5 305.47 170 1130.74 8.735e-10
dossel:serap 1 4.79 169 1125.95 0.37
dossel:adultos 1 78.44 168 1047.51 2.967e-04
serap:adultos 1 58.45 167 989.06 1.789e-03
dossel:flor 5 122.20 162 866.85 1.054e-03
serap:flor 5 10.59 157 856.27 0.88
adultos:flor 5 100.94 152 755.33 4.803e-03
dossel:serap:adultos 1 19.66 151 735.66 0.07
dossel:serap:flor 5 5.03 146 730.63 0.97
dossel:adultos:flor 5 40.15 141 690.48 0.24
serap:adultos:flor 5 7.64 136 682.84 0.94
dossel:serap:adultos:flor 5 8.50 131 674.34 0.92
Se tirasse a interação com floresta
> mod.3 <- glm(abund ~ dossel * serap * adultos + flor, family=quasipoisson, data=dados)
> summary(mod.3)
Call:
glm(formula = abund ~ dossel * serap * adultos + flor, family = quasipoisson,
data = dados)
Deviance Residuals:
Min 1Q Median 3Q Max
-4.9842 -1.9581 -0.5765 0.7899 9.4687
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.626947 0.542471 6.686 3.34e-10 ***
dossel -0.232751 0.106941 -2.176 0.030936 *
serap -0.274982 0.119616 -2.299 0.022759 *
adultos -0.093734 0.083944 -1.117 0.265764
florjeanzao 0.143037 0.325359 0.440 0.660779
flormedico 0.167257 0.406209 0.412 0.681054
florodorico -0.625191 0.328299 -1.904 0.058597 .
florosasco 1.055442 0.281405 3.751 0.000243 ***
florteomar 0.838115 0.241160 3.475 0.000651 ***
dossel:serap 0.012638 0.018702 0.676 0.500126
dossel:adultos 0.009543 0.015492 0.616 0.538721
serap:adultos 0.020474 0.018604 1.100 0.272713
dossel:serap:adultos 0.001076 0.002754 0.391 0.696592
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for quasipoisson family taken to be 6.907554)
Null deviance: 1891.4 on 178 degrees of freedom
Residual deviance: 988.0 on 166 degrees of freedom
(1 observation deleted due to missingness)
AIC: NA
Number of Fisher Scoring iterations: 5
> anova(mod.3, test="Chi")
Analysis of Deviance Table
Model: quasipoisson, link: log
Response: abund
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev P(>|Chi|)
NULL 178 1891.35
dossel 1 242.75 177 1648.60 3.063e-09
serap 1 21.80 176 1626.80 0.08
adultos 1 190.58 175 1436.22 1.499e-07
flor 5 305.47 170 1130.74 2.087e-08
dossel:serap 1 4.79 169 1125.95 0.40
dossel:adultos 1 78.44 168 1047.51 7.520e-04
serap:adultos 1 58.45 167 989.06 3.627e-03
dossel:serap:adultos 1 1.06 166 988.00 0.70
>
> anova(mod.2, mod.3, test="Chi")
Analysis of Deviance Table
Model 1: abund ~ dossel * serap * adultos * flor
Model 2: abund ~ dossel * serap * adultos + flor
Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1 131 674.34
2 166 988.00 -35 -313.66 0.03
>
Pelo teste, tem que continuar com a interação.
No entanto, por mais que eu tenha lido nos livros, acho que não sei interpretar os resultados do modelo com todas essas variáveis explicativas.
Estou pensando seriamente em fazer esse artigo só com a abertura do dossel, pois como o próprio Crawley fala no capítulo de regressão, a seleção de modelos é sem fim… Eu precisaria mais tempo para estudar e é uma pena perder a disciplina do Paulo.
Teria muita teoria para estudar. Estava comversando com o pós-doc do Emilio, o Paul Gagnon (ele era pós-doc do Kyle Harms, que coincidência!) e na opinião dele eu teria um modelo misto, onde floresta seria um fator randômico. Ele trabalhou com modelos mistos no doutorado.
Enfim, acho inviável, mesmo aplicando um GLM normal, conseguir algum resultado em tempo, pois estou desde sexta estudando isso e só conseguir rodar pra uma espécie e pra uma variével resposta e nem sequer consegui tirar uma conclusão decente.
Aguardo teu comentário.