73 Tilia tomentosa
73.1 Données d’occurrences GBIF
Collecte des données du GBIF :
<<gbif download metadata>>
Status: SUCCEEDED
DOI: 10.15468/dl.t99wfm
Format: SIMPLE_CSV
Download key: 0252140-230224095556074
Created: 2023-05-20T11:54:15.780+00:00
Modified: 2023-05-20T11:55:22.745+00:00
Download link: https://api.gbif.org/v1/occurrence/download/request/0252140-230224095556074.zip
Total records: 14917
Conversion en objets géographiques (format Simple feature
de sf
) et
exploration rapide des données (classe du jeu de données et premières lignes du
tableau) :
Simple feature collection with 1035 features and 50 fields
Attribute-geometry relationship: 50 constant, 0 aggregate, 0 identity
Geometry type: POINT
Dimension: XY
Bounding box: xmin: -123.282614 ymin: -39.907019 xmax: 175.027011 ymax: 63.434
Geodetic CRS: WGS 84
# A tibble: 1,035 × 51
gbifID datasetKey occurrenceID kingdom phylum class order family genus species infraspecificEpithet
* <int64> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <lgl>
1 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
2 3.e9 d1e9202b-… NYCstreetTr… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
3 3.e9 d1e9202b-… NYCstreetTr… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
4 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
5 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
6 3.e9 d1e9202b-… NYCstreetTr… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
7 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
8 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
9 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
10 3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
# ℹ 1,025 more rows
# ℹ 40 more variables: taxonRank <chr>, scientificName <chr>, verbatimScientificName <chr>,
# verbatimScientificNameAuthorship <chr>, countryCode <chr>, locality <chr>, stateProvince <chr>,
# occurrenceStatus <chr>, individualCount <int>, publishingOrgKey <chr>, decimalLatitude <dbl>,
# decimalLongitude <dbl>, coordinateUncertaintyInMeters <dbl>, coordinatePrecision <lgl>,
# elevation <dbl>, elevationAccuracy <dbl>, depth <lgl>, depthAccuracy <lgl>, eventDate <dttm>,
# day <int>, month <int>, year <int>, taxonKey <int>, speciesKey <int>, basisOfRecord <chr>, …
Il y a 1 035 occurrences dans le jeu de données. On les affiche sur la carte du monde :

Figure 73.1: Occurrences de Tilia tomentosa dans le monde.
73.1.1 Données par région
On évalue la proportion d’occurrences dans chaque région, en utilisant les 3 masques créés précédemment. Si on a au moins 50 % des occurrences dans une région, on peut continuer en travaillant uniquement sur ces données. Sinon, on vérifie qu’au moins 67 % des données tombent dans l’ensemble des régions, et on prend la région la plus représentée. Au final, s’il s’agit d’une espèce endémique d’Europe, on n’a pas besoin de manipulation supplémentaire.
[1] 0.8850241546
[1] 0.1140096618
[1] 0

Figure 73.2: Occurrence de Tilia tomentosa dans la région d’endémisme.
73.1.2 Licences
On s’intéresse ici au problème particulier des licences :
CC_BY_4_0
646
CC_BY_NC_4_0
168
CC0_1_0
39
https://creativecommons.org/licenses/by-nc/4.0/legalcode
42
https://creativecommons.org/licenses/by/4.0/legalcode
21
[1] 77.07423581

Figure 73.3: Occurrence de Tilia tomentosa dans la région d’endémisme, selon la licence : CC BY-NC en bleu ; CC0 et CC BY en orange.
Idéalement, on aimerait avoir au moins 50 % de données vraiment libres
d’utilisation (c’est-à-dire sans la clause -NC
). On continue en supprimant les
données en CC BY-NC.
[1] 706
73.1.3 Sous-échantillonnage
Si le jeu de données contient 25 000 occurrences ou plus, on procède au sous-échantillonnage aléatoire pour en conserver un maximum de 25 000.
Simple feature collection with 706 features and 50 fields
Attribute-geometry relationship: 50 constant, 0 aggregate, 0 identity
Geometry type: POINT
Dimension: XY
Bounding box: xmin: -9.287368 ymin: 37.276715 xmax: 43.41229 ymax: 63.434
Geodetic CRS: WGS 84
# A tibble: 706 × 51
gbifID datasetKey occurrenceID kingdom phylum class order family genus species infraspecificEpithet
<int64> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <lgl>
1 9e8 cd6e21c8-… "http://spe… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
2 9e8 cd6e21c8-… "http://spe… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
3 8e8 271c444f-… "INBO:FLORA… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
4 8e8 271c444f-… "INBO:FLORA… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
5 8e8 38b4c89f-… "urn:lsid:a… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
6 8e8 38b4c89f-… "urn:lsid:a… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
7 8e8 38b4c89f-… "urn:lsid:a… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
8 8e8 6a122346-… "" Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
9 7e8 f6f1d320-… "" Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
10 4e8 857aa892-… "" Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA
# ℹ 696 more rows
# ℹ 40 more variables: taxonRank <chr>, scientificName <chr>, verbatimScientificName <chr>,
# verbatimScientificNameAuthorship <chr>, countryCode <chr>, locality <chr>, stateProvince <chr>,
# occurrenceStatus <chr>, individualCount <int>, publishingOrgKey <chr>, decimalLatitude <dbl>,
# decimalLongitude <dbl>, coordinateUncertaintyInMeters <dbl>, coordinatePrecision <lgl>,
# elevation <dbl>, elevationAccuracy <dbl>, depth <lgl>, depthAccuracy <lgl>, eventDate <dttm>,
# day <int>, month <int>, year <int>, taxonKey <int>, speciesKey <int>, basisOfRecord <chr>, …
73.2 Modélisation de la niche climatique
73.2.1 Préparer les données
Organisation des données d’entrées (occurrences et données environnementales) et des données produites de pseudo-absences :
class : SpatVector
geometry : points
dimensions : 706, 0 (geometries, attributes)
extent : -9.287368, 43.41229, 37.27672, 63.434 (xmin, xmax, ymin, ymax)
coord. ref. : lon/lat WGS 84 (EPSG:4326)
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= tito Data Formating -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
! Response variable is considered as only presences... Is it really what you want?
! No data has been set aside for modeling evaluation
!!! Some data are located in the same raster cell.
Please set `filter.raster = TRUE` if you want an automatic filtering.
Checking Pseudo-absence selection arguments...
> random pseudo absences selection
> Pseudo absences are selected in explanatory variables
! Some NAs have been automatically removed from your data
!!! Some data are located in the same raster cell.
Please set `filter.raster = TRUE` if you want an automatic filtering.
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Done -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
-=-=-=-=-=-=-=-=-=-=-=-=-=-= BIOMOD.formated.data -=-=-=-=-=-=-=-=-=-=-=-=-=-=
dir.name = Output
sp.name = tito
704 presences, 0 true absences and 2118 undefined points in dataset
6 explanatory variables
temp_max_august temp_min temp_wet_quart temp_season
Min. : 7.348 Min. :-21.572 Min. :-8.665 Min. : 251.3
1st Qu.:20.694 1st Qu.: -8.612 1st Qu.: 9.416 1st Qu.: 644.4
Median :24.504 Median : -3.116 Median :13.680 Median : 747.6
Mean :25.184 Mean : -4.209 Mean :12.741 Mean : 764.7
3rd Qu.:28.140 3rd Qu.: 0.795 3rd Qu.:16.806 3rd Qu.: 891.0
Max. :44.400 Max. : 9.938 Max. :23.717 Max. :1354.3
prec_wet_quart prec_season
Min. : 5.0 Min. : 8.169
1st Qu.: 176.0 1st Qu.: 23.423
Median : 219.0 Median : 30.972
Mean : 221.5 Mean : 35.289
3rd Qu.: 262.0 3rd Qu.: 39.979
Max. :1157.0 Max. :118.545
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
On visualise les pseudo-absences :

Figure 73.5: Les données d’occurrences (en haut à gauche) et les trois jeux de données aléatoires de pseudo-absences.
$data.vect
class : SpatVector
geometry : points
dimensions : 4934, 2 (geometries, attributes)
extent : -9.8125, 46.97917, 29.02083, 70.9375 (xmin, xmax, ymin, ymax)
coord. ref. :
names : resp dataset
type : <num> <chr>
values : 10 Initial dataset
10 Initial dataset
10 Initial dataset
$data.label
9 10
"**Presences**" "Presences (calibration)"
11 12
"Presences (validation)" "Presences (evaluation)"
19 20
"**True Absences**" "True Absences (calibration)"
21 22
"True Absences (validation)" "True Absences (evaluation)"
29 30
"**Pseudo-Absences**" "Pseudo-Absences (calibration)"
31 1
"Pseudo-Absences (validation)" "Background"
$data.plot

Figure 73.6: Les données d’occurrences (en haut à gauche) et les trois jeux de données aléatoires de pseudo-absences.
73.2.2 Modèles individuels de niche
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Build Single Models -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
Checking Models arguments...
Creating suitable Workdir...
! Weights where automatically defined for tito_PA1 to rise a 0.5 prevalence !
! Weights where automatically defined for tito_PA2 to rise a 0.5 prevalence !
! Weights where automatically defined for tito_PA3 to rise a 0.5 prevalence !
-=-=-=-=-=-=-=-=-=-=-=-=-=-= tito Modeling Summary -=-=-=-=-=-=-=-=-=-=-=-=-=-=
6 environmental variables ( temp_max_august temp_min temp_wet_quart temp_season prec_wet_quart prec_season )
Number of evaluation repetitions : 1
Models selected : GAM MARS MAXNET GBM ANN RF
Total number of model runs: 18
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
-=-=-=- Run : tito_PA1
-=-=-=--=-=-=- tito_PA1_RUN1
-=-=-=- Run : tito_PA2
-=-=-=--=-=-=- tito_PA2_RUN1
-=-=-=- Run : tito_PA3
-=-=-=--=-=-=- tito_PA3_RUN1
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Done -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
73.2.2.1 Évaluation de la performance
full.name PA run algo metric.eval cutoff sensitivity
1 tito_PA1_RUN1_GAM PA1 RUN1 GAM TSS 485.0 96.980
2 tito_PA1_RUN1_GAM PA1 RUN1 GAM ROC 483.0 96.980
3 tito_PA1_RUN1_MARS PA1 RUN1 MARS TSS 396.0 92.718
4 tito_PA1_RUN1_MARS PA1 RUN1 MARS ROC 394.0 92.895
5 tito_PA1_RUN1_MAXNET PA1 RUN1 MAXNET TSS 443.0 86.856
6 tito_PA1_RUN1_MAXNET PA1 RUN1 MAXNET ROC 440.5 86.856
specificity calibration validation evaluation
1 47.965 0.449 0.433 NA
2 47.965 0.645 0.696 NA
3 76.283 0.690 0.574 NA
4 76.106 0.923 0.871 NA
5 83.717 0.706 0.596 NA
6 83.717 0.927 0.885 NA

Figure 73.7: Évaluation de la performance des modèles individuels : True Skill Statistic & aire sous la courbe de ROC.
73.2.2.2 Importance des variables environnementales
full.name PA run algo expl.var rand var.imp
1 tito_PA1_RUN1_GAM PA1 RUN1 GAM temp_max_august 1 0.398373
2 tito_PA1_RUN1_GAM PA1 RUN1 GAM temp_min 1 0.517487
3 tito_PA1_RUN1_GAM PA1 RUN1 GAM temp_wet_quart 1 0.025071
4 tito_PA1_RUN1_GAM PA1 RUN1 GAM temp_season 1 0.050337
5 tito_PA1_RUN1_GAM PA1 RUN1 GAM prec_wet_quart 1 0.117156
6 tito_PA1_RUN1_GAM PA1 RUN1 GAM prec_season 1 0.000104

Figure 73.8: Pourcentage de variance expliquée pour chaque variable, décomposé par algorithme.

Figure 73.9: Pourcentage de variance expliquée pour chaque variable, décomposé par variable.