73 Tilia tomentosa

73.1 Données d’occurrences GBIF

Collecte des données du GBIF :

<<gbif download metadata>>
  Status: SUCCEEDED
  DOI: 10.15468/dl.t99wfm
  Format: SIMPLE_CSV
  Download key: 0252140-230224095556074
  Created: 2023-05-20T11:54:15.780+00:00
  Modified: 2023-05-20T11:55:22.745+00:00
  Download link: https://api.gbif.org/v1/occurrence/download/request/0252140-230224095556074.zip
  Total records: 14917

Conversion en objets géographiques (format Simple feature de sf) et exploration rapide des données (classe du jeu de données et premières lignes du tableau) :

Simple feature collection with 1035 features and 50 fields
Attribute-geometry relationship: 50 constant, 0 aggregate, 0 identity
Geometry type: POINT
Dimension:     XY
Bounding box:  xmin: -123.282614 ymin: -39.907019 xmax: 175.027011 ymax: 63.434
Geodetic CRS:  WGS 84
# A tibble: 1,035 × 51
     gbifID datasetKey occurrenceID kingdom phylum class order family genus species infraspecificEpithet
 *  <int64> <chr>      <chr>        <chr>   <chr>  <chr> <chr> <chr>  <chr> <chr>   <lgl>               
 1     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 2     3.e9 d1e9202b-… NYCstreetTr… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 3     3.e9 d1e9202b-… NYCstreetTr… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 4     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 5     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 6     3.e9 d1e9202b-… NYCstreetTr… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 7     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 8     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 9     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
10     3.e9 c4e1739b-… BISON:New Y… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
# ℹ 1,025 more rows
# ℹ 40 more variables: taxonRank <chr>, scientificName <chr>, verbatimScientificName <chr>,
#   verbatimScientificNameAuthorship <chr>, countryCode <chr>, locality <chr>, stateProvince <chr>,
#   occurrenceStatus <chr>, individualCount <int>, publishingOrgKey <chr>, decimalLatitude <dbl>,
#   decimalLongitude <dbl>, coordinateUncertaintyInMeters <dbl>, coordinatePrecision <lgl>,
#   elevation <dbl>, elevationAccuracy <dbl>, depth <lgl>, depthAccuracy <lgl>, eventDate <dttm>,
#   day <int>, month <int>, year <int>, taxonKey <int>, speciesKey <int>, basisOfRecord <chr>, …

Il y a 1 035 occurrences dans le jeu de données. On les affiche sur la carte du monde :

Occurrences de Tilia tomentosa dans le monde.

Figure 73.1: Occurrences de Tilia tomentosa dans le monde.

73.1.1 Données par région

On évalue la proportion d’occurrences dans chaque région, en utilisant les 3 masques créés précédemment. Si on a au moins 50 % des occurrences dans une région, on peut continuer en travaillant uniquement sur ces données. Sinon, on vérifie qu’au moins 67 % des données tombent dans l’ensemble des régions, et on prend la région la plus représentée. Au final, s’il s’agit d’une espèce endémique d’Europe, on n’a pas besoin de manipulation supplémentaire.

[1] 0.8850241546
[1] 0.1140096618
[1] 0

Espèce endémique d’Europe

Occurrence de Tilia tomentosa dans la région d'endémisme.

Figure 73.2: Occurrence de Tilia tomentosa dans la région d’endémisme.

73.1.2 Licences

On s’intéresse ici au problème particulier des licences :


                                               CC_BY_4_0 
                                                     646 
                                            CC_BY_NC_4_0 
                                                     168 
                                                 CC0_1_0 
                                                      39 
https://creativecommons.org/licenses/by-nc/4.0/legalcode 
                                                      42 
   https://creativecommons.org/licenses/by/4.0/legalcode 
                                                      21 
[1] 77.07423581
Occurrence de Tilia tomentosa dans la région d'endémisme, selon la licence : CC BY-NC en bleu ; CC0 et CC BY en orange.

Figure 73.3: Occurrence de Tilia tomentosa dans la région d’endémisme, selon la licence : CC BY-NC en bleu ; CC0 et CC BY en orange.

Idéalement, on aimerait avoir au moins 50 % de données vraiment libres d’utilisation (c’est-à-dire sans la clause -NC). On continue en supprimant les données en CC BY-NC.

[1] 706

73.1.3 Sous-échantillonnage

Si le jeu de données contient 25 000 occurrences ou plus, on procède au sous-échantillonnage aléatoire pour en conserver un maximum de 25 000.

Moins de 25 000 occurrences : pas de sous-échantillonnage

Simple feature collection with 706 features and 50 fields
Attribute-geometry relationship: 50 constant, 0 aggregate, 0 identity
Geometry type: POINT
Dimension:     XY
Bounding box:  xmin: -9.287368 ymin: 37.276715 xmax: 43.41229 ymax: 63.434
Geodetic CRS:  WGS 84
# A tibble: 706 × 51
     gbifID datasetKey occurrenceID kingdom phylum class order family genus species infraspecificEpithet
    <int64> <chr>      <chr>        <chr>   <chr>  <chr> <chr> <chr>  <chr> <chr>   <lgl>               
 1      9e8 cd6e21c8-… "http://spe… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 2      9e8 cd6e21c8-… "http://spe… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 3      8e8 271c444f-… "INBO:FLORA… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 4      8e8 271c444f-… "INBO:FLORA… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 5      8e8 38b4c89f-… "urn:lsid:a… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 6      8e8 38b4c89f-… "urn:lsid:a… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 7      8e8 38b4c89f-… "urn:lsid:a… Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 8      8e8 6a122346-… ""           Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
 9      7e8 f6f1d320-… ""           Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
10      4e8 857aa892-… ""           Plantae Trach… Magn… Malv… Malva… Tilia Tilia … NA                  
# ℹ 696 more rows
# ℹ 40 more variables: taxonRank <chr>, scientificName <chr>, verbatimScientificName <chr>,
#   verbatimScientificNameAuthorship <chr>, countryCode <chr>, locality <chr>, stateProvince <chr>,
#   occurrenceStatus <chr>, individualCount <int>, publishingOrgKey <chr>, decimalLatitude <dbl>,
#   decimalLongitude <dbl>, coordinateUncertaintyInMeters <dbl>, coordinatePrecision <lgl>,
#   elevation <dbl>, elevationAccuracy <dbl>, depth <lgl>, depthAccuracy <lgl>, eventDate <dttm>,
#   day <int>, month <int>, year <int>, taxonKey <int>, speciesKey <int>, basisOfRecord <chr>, …

73.1.4 Carte finale

On prépare la carte finale des occurrences :

Occurrence de Tilia tomentosa dans la région d'endémisme après sous-échantillonnage éventuel.

Figure 73.4: Occurrence de Tilia tomentosa dans la région d’endémisme après sous-échantillonnage éventuel.

73.2 Modélisation de la niche climatique

73.2.1 Préparer les données

Organisation des données d’entrées (occurrences et données environnementales) et des données produites de pseudo-absences :

 class       : SpatVector 
 geometry    : points 
 dimensions  : 706, 0  (geometries, attributes)
 extent      : -9.287368, 43.41229, 37.27672, 63.434  (xmin, xmax, ymin, ymax)
 coord. ref. : lon/lat WGS 84 (EPSG:4326) 

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= tito Data Formating -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=

      ! Response variable is considered as only presences... Is it really what you want?
      ! No data has been set aside for modeling evaluation
 !!! Some data are located in the same raster cell. 
          Please set `filter.raster = TRUE` if you want an automatic filtering.

Checking Pseudo-absence selection arguments...

   > random pseudo absences selection
   > Pseudo absences are selected in explanatory variables
 ! Some NAs have been automatically removed from your data
 !!! Some data are located in the same raster cell. 
          Please set `filter.raster = TRUE` if you want an automatic filtering.
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Done -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=

-=-=-=-=-=-=-=-=-=-=-=-=-=-= BIOMOD.formated.data -=-=-=-=-=-=-=-=-=-=-=-=-=-=

dir.name =  Output

sp.name =  tito

     704 presences,  0 true absences and  2118 undefined points in dataset


     6 explanatory variables

 temp_max_august     temp_min       temp_wet_quart    temp_season    
 Min.   : 7.348   Min.   :-21.572   Min.   :-8.665   Min.   : 251.3  
 1st Qu.:20.694   1st Qu.: -8.612   1st Qu.: 9.416   1st Qu.: 644.4  
 Median :24.504   Median : -3.116   Median :13.680   Median : 747.6  
 Mean   :25.184   Mean   : -4.209   Mean   :12.741   Mean   : 764.7  
 3rd Qu.:28.140   3rd Qu.:  0.795   3rd Qu.:16.806   3rd Qu.: 891.0  
 Max.   :44.400   Max.   :  9.938   Max.   :23.717   Max.   :1354.3  
 prec_wet_quart    prec_season     
 Min.   :   5.0   Min.   :  8.169  
 1st Qu.: 176.0   1st Qu.: 23.423  
 Median : 219.0   Median : 30.972  
 Mean   : 221.5   Mean   : 35.289  
 3rd Qu.: 262.0   3rd Qu.: 39.979  
 Max.   :1157.0   Max.   :118.545  

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=

On visualise les pseudo-absences :

Les données d'occurrences (en haut à gauche) et les trois jeux de données aléatoires de pseudo-absences.

Figure 73.5: Les données d’occurrences (en haut à gauche) et les trois jeux de données aléatoires de pseudo-absences.

$data.vect
 class       : SpatVector 
 geometry    : points 
 dimensions  : 4934, 2  (geometries, attributes)
 extent      : -9.8125, 46.97917, 29.02083, 70.9375  (xmin, xmax, ymin, ymax)
 coord. ref. :  
 names       :  resp         dataset
 type        : <num>           <chr>
 values      :    10 Initial dataset
                  10 Initial dataset
                  10 Initial dataset

$data.label
                              9                              10 
                "**Presences**"       "Presences (calibration)" 
                             11                              12 
       "Presences (validation)"        "Presences (evaluation)" 
                             19                              20 
            "**True Absences**"   "True Absences (calibration)" 
                             21                              22 
   "True Absences (validation)"    "True Absences (evaluation)" 
                             29                              30 
          "**Pseudo-Absences**" "Pseudo-Absences (calibration)" 
                             31                               1 
 "Pseudo-Absences (validation)"                    "Background" 

$data.plot
Les données d'occurrences (en haut à gauche) et les trois jeux de données aléatoires de pseudo-absences.

Figure 73.6: Les données d’occurrences (en haut à gauche) et les trois jeux de données aléatoires de pseudo-absences.

73.2.2 Modèles individuels de niche


-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Build Single Models -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=


Checking Models arguments...

Creating suitable Workdir...

            ! Weights where automatically defined for tito_PA1 to rise a 0.5 prevalence !
            ! Weights where automatically defined for tito_PA2 to rise a 0.5 prevalence !
            ! Weights where automatically defined for tito_PA3 to rise a 0.5 prevalence !


-=-=-=-=-=-=-=-=-=-=-=-=-=-= tito Modeling Summary -=-=-=-=-=-=-=-=-=-=-=-=-=-=

 6  environmental variables ( temp_max_august temp_min temp_wet_quart temp_season prec_wet_quart prec_season )
Number of evaluation repetitions : 1
Models selected : GAM MARS MAXNET GBM ANN RF 

Total number of model runs: 18 

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=


-=-=-=- Run :  tito_PA1 


-=-=-=--=-=-=- tito_PA1_RUN1 


-=-=-=- Run :  tito_PA2 


-=-=-=--=-=-=- tito_PA2_RUN1 


-=-=-=- Run :  tito_PA3 


-=-=-=--=-=-=- tito_PA3_RUN1 

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Done -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=

73.2.2.1 Évaluation de la performance

             full.name  PA  run   algo metric.eval cutoff sensitivity
1    tito_PA1_RUN1_GAM PA1 RUN1    GAM         TSS  485.0      96.980
2    tito_PA1_RUN1_GAM PA1 RUN1    GAM         ROC  483.0      96.980
3   tito_PA1_RUN1_MARS PA1 RUN1   MARS         TSS  396.0      92.718
4   tito_PA1_RUN1_MARS PA1 RUN1   MARS         ROC  394.0      92.895
5 tito_PA1_RUN1_MAXNET PA1 RUN1 MAXNET         TSS  443.0      86.856
6 tito_PA1_RUN1_MAXNET PA1 RUN1 MAXNET         ROC  440.5      86.856
  specificity calibration validation evaluation
1      47.965       0.449      0.433         NA
2      47.965       0.645      0.696         NA
3      76.283       0.690      0.574         NA
4      76.106       0.923      0.871         NA
5      83.717       0.706      0.596         NA
6      83.717       0.927      0.885         NA
Évaluation de la performance des modèles individuels : True Skill Statistic & aire sous la courbe de ROC.

Figure 73.7: Évaluation de la performance des modèles individuels : True Skill Statistic & aire sous la courbe de ROC.

73.2.2.2 Importance des variables environnementales

          full.name  PA  run algo        expl.var rand  var.imp
1 tito_PA1_RUN1_GAM PA1 RUN1  GAM temp_max_august    1 0.398373
2 tito_PA1_RUN1_GAM PA1 RUN1  GAM        temp_min    1 0.517487
3 tito_PA1_RUN1_GAM PA1 RUN1  GAM  temp_wet_quart    1 0.025071
4 tito_PA1_RUN1_GAM PA1 RUN1  GAM     temp_season    1 0.050337
5 tito_PA1_RUN1_GAM PA1 RUN1  GAM  prec_wet_quart    1 0.117156
6 tito_PA1_RUN1_GAM PA1 RUN1  GAM     prec_season    1 0.000104
Pourcentage de variance expliquée pour chaque variable, décomposé par algorithme.

Figure 73.8: Pourcentage de variance expliquée pour chaque variable, décomposé par algorithme.

Pourcentage de variance expliquée pour chaque variable, décomposé par variable.

Figure 73.9: Pourcentage de variance expliquée pour chaque variable, décomposé par variable.

73.2.2.3 Courbes de réponses

Courbes de réponse de chaque variable climatique selon l'algorithme (en couleurs).

Figure 73.10: Courbes de réponse de chaque variable climatique selon l’algorithme (en couleurs).

73.2.3 Modèles d’ensemble de niche

Seulement modèles avec TSS > 0.8