coex_st R Documentation
Coexistência espaço-temporal de linhagens no registro fóssil
Descrição:
Cria uma série temporal de determinação de coexistência linhagens do registro fóssil,
no espaço e no tempo
Uso:
coex_st(df, time.series = 1, space = "polygon", plot.longs = F)
Argumentos:
df
data.frame com as ocorrências fósseis do grupo de interesse.
time.series
define o vetor de série temporal a ser utilizado. Pode ser fornecido um único valor,
que define a frequência com que o tempo será dividido, e.g.: time.series = 1 define que
o tempo será dividido de 1 em 1 milhão de anos. Também pode ser fornecido o vetor
com a série temporal definida, e.g.: time.series <- c(37.8,33.9,27.82,23.03, 20.44,
15.97,13.82,11.63,7.246,5.333,3.6,2.58,1.8,0.781,0.126,0.0117,0); nesse caso a função
utilizará esses momentos no tempo para a construção da série temporal
space
determina o método de coexistência espacial a ser utilizado. Aceita apenas três opções:
"site", "coords", "polygon". Veja detalhes para a descrição dos métodos. Default =
"polygon"
plot.longs
lógico, default FALSE. Se TRUE, retorna um gráfico com as longevidades das linhagens
e os momentos da série temporal
Detalhes:
#Conjunto de dados
O conjunto de dados deve ser fornecido exatamente como o proposto, com as colunas:
"taxon_name", "collection_no", "lng", "lat", "max_ma", "min_ma", similar ao modelo
como as ocorrências fósseis são descritas pela base de dados "Paleobiology Database",
banco de dados referência mundial de coleções fósseis. O modelo sugerido pressupõe que
as ocorrências estejam associadas a um intervalo de tempo estratigráfico (max_ma,
min_ma), um identificador de coleção (collection_no), e coordenadas geográficas (lng,
lat). A coleção refere-se à assembléia fóssil que cada ocorrência foi encontrada,
enquanto que os identificadores de coordenada geralmente estão associados ao sítio
fossilífero, ou à localidade geopolítica associada com o sítio fossilífero. Essa
diferença discrimina fósseis que são encontrados explicitamente juntos, na mesma camada
estratigráfica, e mesmo horizonte fossilífero (collection), enquanto que as coordenadas
indicam uma região associada, não necessariamente fósseis com a mesma localidade são
encontrados no mesmo horizonte fossilífero, muito menos na mesma assembléia.
# Longevidade
A longevidade real das linhagens é estimada com o método de intervalos de
confiança de Marshall (1990), baseando-se no pressuposto de "range-through"
(Foote 2007), em que assume-se que o táxon esteve presente desde o momento de sua
ocorrência mais antiga à ocorrência mais recente. O método de Marshall calcula os
intervalos de confiança de 50% do momento real de surgimento/extinção em torno do
valor observado de uma leitura direta do registro fóssil (ocorrência mais antiga ou
mais recente). Esse estimador é um estimador não-enviesado dos momentos de
surgimento/extinção baseado no número de ocorrências conhecidadas para aquele táxon,
mas depende de uma série de premissas, como potencial de fossilização aleatório,
e amostragem constante do registro fóssil do grupo de interesse. Entretanto, o método
é robusto o suficiente a violações dessas premissas para a maioria dos casos
Marshall 2010).
# Coexistência temporal
A coexistência no tempo é definida com base no mesmo pressuposto de "range-through":
se a longevidade de dois táxons se sobrepõem no mesmo momento de tempo, considera-se
que os dois táxons estavam vivos no mesmo momento de tempo.
# Coexistência espacial
A coexistência espacial pode ser definida de 3 formas diferentes, com diferentes graus
de permissividade. Esses diferentes graus refletem a confiança que o usuário pode ter
na evidência de coexistência espacial, indo do mais restritivo ao mais abrangente.
O primeiro grau, definido com o método "site", define que apenas táxons que possuem
ocorrências fósseis encontradas na mesma assembléia, isto é, juntos, sejam considerados
co-ocorrentes. Esta é a evidência mais direta de coexistência. Entretanto, relaxando-se
essa premissa, no segundo grau, "coords", as ocorrências não necessariamente precisam
ser encontradas juntas, mas sim estarem associadas às mesmas coordenadas geográficas.
O terceiro grau, "polygon", permite que o usuário reconstrua áreas de vida dos táxons
extintos a partir do método de mínimos polígonos convexos, que é considerado bastante
confiável para o registro fóssil (Darroch & Saupe 2018). Táxons cujos
polígonos se sobrepõem serão considerados como co-ocorrentes. O método utilizado
também permite que táxons em que não é possível construir polígonos (com menos que 3
pontos de ocorrência geográfica) também sejam sobrepostos, e.g., se um táxon possui
apenas um ponto de ocorrência, mas está dentro da aréa de um polígono de outro táxon,
ambos coexistem.
# Multiplicação de matrizes
As matrizes de coexistência temporal e espacial guardam a informação binária de
coexistência, cada uma em uma dimensão. A multiplicação vetorial garante que apenas
há coexistência de fato, quando há coexistência nas duas dimensões, i.e.: 0 * 1 = 0,
0 * 0 = 0, 1 * 1 = 1.
Valor:
lista com n matrizes de série temporal, para cada momento de tempo. Cada matriz
possui os nomes da linhas e colunas com os nomes dos táxons do grupo de interesse,
preenchida com '1' para as combinações par a par de táxons coexistentes no tempo e
no espaço.
Aviso:
Os pacotes "plyr", "tidyverse", "rgeos" e "rgdal", são necessários para a manipulação
dos dados e operações subsequentes. A função carrega automaticamente os pacotes, mas
eles devem ser instalados pelo usuário. A qualidade taxonômica dos dados de entrada
também deve ser observada. O usuário pode estar interessado em utilizar apenas espécies,
apenas gêneros ou qualquer outro nível taxonômico, e, portanto, as entradas do conjunto
de dados devem ser consistentes, i.e., no mesmo nível taxonômico.
Nota:
Da forma como a função foi implementada, ela calcula os polígonos de distribuição dos
táxons utilizando-se todas as ocorrências, assumindo uma área constante durante a
longevidade do táxon. Isso não necessariamente reflete a realidade, pois a área de
distribuição de um táxon pode mudar ao longo do tempo. Uma abordagem mais próxima
da realidade seria construir os polígonos para momentos de diferentes do tempo, porém
isso necessita um conhecimento mais preciso sobre a real qualidade do registro e a
incerteza associada à cada ocorrência do conjunto de dados, pois cada ocorrência precisa
ser alocada à um intervalo estratigráfico de interesse.
Autor (es):
Rodolfo Pereira Graciotti
rodolfo.graciotti@gmail.com
Referências:
Marshall, Charles R. "Confidence intervals on stratigraphic ranges." Paleobiology 16.1 (1990): 1-10.
Marshall, Charles R. "Using confidence intervals to quantify the uncertainty in the end-points of stratigraphic ranges." The Paleontological Society Papers 16 (2010): 291-316.
Foote, Michael, et al. Principles of paleontology. Macmillan, 2007.
https://paleobiodb.org/#/
Darroch, Simon AF, and Erin E. Saupe. "Reconstructing geographic range-size dynamics from fossil data." Paleobiology 44.1 (2018): 25-39.
Exemplo:
# lendo o data.frame de exemplo
can <- read.csv("canidae_data_frame.csv", header = T) # importa o data.frame de
# exemplo, apenas com espécies de Canidae
names(can) # conferindo se os nomes batem com o proposto
db.site.1 <- coex_st(df = can, time.series = 1, space = "site", plot.longs = T)
# aplica a função com um vetor de 1 milhão de anos, space como "site"
db.coord.1 <- coex_st(df = can, time.series = 1, space = "coords", plot.longs = T)
# aplica a função com um vetor de 1 milhão de anos, space como "coords"
db.poly.1 <- coex_st(df = can, time.series = 1, space = "polygon", plot.longs = T)
# aplica a função com um vetor de 1 milhão de anos, space como "polygon"
db.site.v <- coex_st(df = can,
time.series = c(37.2,33.9,33.3,30.8,20.43,15.97,13.6,10.3,4.9,1.8,0.3,0.0117,0),
space = "site", plot.longs = T)
# aplica a função com um vetor específico, space como "site"
db.coord.v <- coex_st(df = can,
time.series = c(37.2,33.9,33.3,30.8,20.43,15.97,13.6,10.3,4.9,1.8,0.3,0.0117,0),
space = "coords", plot.longs = T)
# aplica a função com um vetor específico, space como "coords"
db.poly.v <- coex_st(df = can,
time.series = c(37.2,33.9,33.3,30.8,20.43,15.97,13.6,10.3,4.9,1.8,0.3,0.0117,0),
space = "polygon", plot.longs = T)
# aplica a função com um vetor específico, space "polygon"
# caso a premissa de que os graus de coexistência espacial aumentam a permissividade
# da co-ocorrência, ao comparar o resultado dos diferentes métodos com o mesmo conjunto
# de dados e tempo, espera-se que o número absoluto de instâncias em que há
# co-ocorrência deva ser: site < coords < polygon
sum(sapply(db.site.1, sum))
sum(sapply(db.coord.1, sum))
sum(sapply(db.poly.1, sum))
sum(sapply(db.site.v, sum))
sum(sapply(db.coord.v, sum))
sum(sapply(db.poly.v, sum))