You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
grade_code("Vous voyez comme c'est facile ! Les fonctions SciViews vous facilitent la tâche. Naturellement, vous pouvez aussi choisir d'autres paires de variables pour visualiser votre regroupement.")
203
203
```
204
204
205
-
## Indice de diversité
205
+
## Indices de diversité
206
206
207
207
La notion de diversité est complexe. On peut néanmoins faire ressortir deux éléments principaux que sont le nombre d'espèces différentes présentes sur la zone d'étude et l'abondance de chaque espèce. Il existe une multitude d'indices, dont la richesse spécifique, l'indice de Simpson, l'indice de Shannon...
208
208
209
-
Un des premiers indices mis au point est la richesse spécifique. Cet indice dénombre les espèces sur une zone déterminée. Déterminez la richesse spécifique pour chaque station. Employez l'objet`fish`et utilisez la fonction adéquate.
209
+
Un des premiers indices mis au point est la richesse spécifique. Cet indice dénombre les espèces dans les stations étudiées. À titre d'exercice, déterminez la richesse spécifique pour chaque station du tableau`fish`en utilisant la fonction adéquate.
210
210
211
-
```{r richness_h2, exercise = TRUE}
212
-
___::___()
211
+
```{r richness_h2, exercise=TRUE}
212
+
___::___(___)
213
213
```
214
214
215
215
```{r richness_h2-hint-1}
@@ -224,7 +224,7 @@ vegan::specnumber(fish)
224
224
```
225
225
226
226
```{r richness_h2-check}
227
-
grade_code("Bien joué ! Vous avez utilisé la fonction adéquate. La fonction specnumber() se trouve dans le package {vegan}. Ce package a été développé pour aider à l'étude des communautés en écologie. Il ne vous reste plus qu'à analyser le résultat afin de répondre à la question suivante.")
227
+
grade_code("La fonction `specnumber()` du package {vegan} effectue ce calcul. Inspectez le résultat afin de répondre à la question suivante.")
228
228
```
229
229
230
230
```{r qu_richness}
@@ -235,17 +235,17 @@ question("Quelle est la station avec la richesse spécifique la plus élevée ?"
235
235
answer("Station 29", correct = TRUE),
236
236
answer("Station 30"),
237
237
allow_retry = TRUE,
238
-
correct = "Bravo, Vous avez trouvé la bonne réponse.",
238
+
correct = "Vous avez trouvé la bonne réponse.",
239
239
incorrect = "Retentez votre chance. Les stations sont affiché de la numéro 1 à la numéro 30.")
240
240
```
241
241
242
-
Cet indice est simple et facile à comprendre. Attention, ce dernier a donc une limite que vous devez bien retenir. Cet indice ne tient pas compte de l'abondance de chaque espèce étudiée. Il pourrait tout à fait être complété par l'indice de Shannon.
242
+
Cet indice est simple et facile à comprendre. Attention, toutefois, qu'il ne tient pas compte de l'abondance de chaque espèce étudiée dans les stations, ni des compositions respectives entre les stations (espèces communes ou exclusives à l'une ou l'autre station). Il est donc utile de compléter votre étude en ajoutant une information complémentaire.
243
243
244
-
Vous avez découvert une série d'indices de similarité ou de dissimilarité au cours de ce module 6. Nous vous proposons d'employer à présent l'indice de Jaccard. Cet indice permet une comparaison entre deux sites en calculant le rapport entre les espèces communes aux deux sites et celles propres à chaque relevé. La formule est la suivante:
244
+
Vous avez découvert une série d'indices de similarité ou de dissimilarité au cours de ce module 6. Nous vous proposons d'employer à présent l'indice de Jaccard. Cet indice permet une comparaison entre deux sites en calculant le rapport entre les espèces communes aux deux sites et celles propres à chaque relevé. La formule est la suivante:
245
245
246
-
$$I = \frac{N_c}{N_1 + N2 – N_c}$$
246
+
$$J = \frac{N_c}{N_1 + N2 – N_c}$$
247
247
248
-
où:
248
+
où:
249
249
250
250
- $N_c$ correspond au nombre de taxons communs entre les deux sites
251
251
- $N_1$ et $N_2$ le nombre de taxons présents sur le site 1 et 2, respectivement
@@ -255,55 +255,58 @@ Les valeurs de l'indice varient entre 0 lorsque les deux sites n'ont aucune esp
255
255
Comparez les stations entre elles deux à deux à l'aide de l'indice de Jaccard sur le tableau `fish`. Nommez cet objet `fish_jacc`.
grade_code("Bien joué ! Vous avez utilisez la fonction adéquate. L'indice de Jaccard traite un tableau de type absence/présence que vous spécifié à l'aide de binary = TRUE.")
273
+
grade_code("L'indice de Jaccard nécessite des données de type présence/absence (1 ou 0). Le tableau `fish` présente des abondances en semi-quantitatif (valeurs entre 0 et 5). Grâce à l'argument `binary = TRUE`, ce tableau est transformé en présence/absence à l'intérieur du calcul de `dissimilarity()` afin qu'il convienne ensuite au calcul de cet indice.")
271
274
```
272
275
273
-
À présent que vous avez obtenu votre matrice de distance (`fish_jacc`), vous pouvez l'employer afin d'obtenir un dendrogramme avec la méthode `ward.D2`.
276
+
À présent que vous avez obtenu votre matrice de distance (`fish_jacc`), vous pouvez effectuer un regroupement à l'aide de la CAH avec la méthode `ward.D2` et en tracer un dendrogramme.
grade_code("Bien joué ! Vous avez obtenu un dendrogramme horizontal intéressant. On peut par exemple observer que les station 23, 24 et 25 sont regroupées. Elles se différencient des stations précédentes (16-22) et des stations suivantes (26-30) entre autre par une richesse spécifique plus faible. On ne tient pas compte de la station 8 qui ne comprend pas espèce.")
304
+
grade_code("Vous avez obtenu un dendrogramme horizontal intéressant. On peut, par exemple, observer que les station 23, 24 et 25 sont regroupées. Elles se différencient des stations précédentes (16-22) et des stations suivantes (26-30) du point de vue de la diversité selon l'indice de Jaccard (on ne tient pas compte de la station 8 qui ne comprend pas espèce).")
302
305
```
303
306
304
307
## Conclusion
305
308
306
-
Vous venez de terminer votre auto-évaluation relative à la classification par les k-moyenne et les indices de diversité. Vous êtes maintenant prêts pour les appliquer sur d'autres données par vous-même dans une assignation GitHub.
309
+
Vous venez de terminer votre auto-évaluation relative à la classification par les k-moyenne et les indices de diversité. Vous allez maintenant appliquer ces techniques sur d'autres données dans une assignation GitHub.
L'Analyse Factorielle des Correspondances (AFC) est une variante de l'Analyse en Composantes Principales (ACP) qui permet de traiter les variables qualitatives. Ce tutoriel vous permettra de :
50
+
L'Analyse Factorielle des Correspondances (AFC) est une variante de l'Analyse en Composantes Principales (ACP) qui permet de traiter les variables qualitatives (deux variables qualitatives transformées en un tableau de contingence à double entrée). Elle permet aussi de traiter des variables quantitatives discrètes (entiers nuls ou positifs) comme des dénombrements d'espèces à divers stations, ce qui s'apparente également dans un certain sens à un tableau de contingence qui croise espèce et station. Ce tutoriel vous permettra de :
53
51
54
52
- Réaliser de manière guidée une AFC
55
53
@@ -61,7 +59,7 @@ Avant toute chose, assurez-vous d'avoir bien compris le contenu du [module 7](ht
61
59
62
60
## Les macroinvertébrés de la Loire (France)
63
61
64
-
La Loire est un cours d'eau qui prend sa source dans le Massif central pour se jeter dans l'atlantique proche de Nantes. On dénombre 38 stations de mesures couvrant plus de 800km du fleuve de la source jusqu'à 200 km de son embouchure.
62
+
La Loire est un cours d'eau qui prend sa source dans le Massif Central pour se jeter dans l'Atlantique près de Nantes. Dans le jeu de données que nous traiterons ici, on dénombre 38 stations couvrant plus de 800 km du fleuve de sa source jusqu'à environ 200 km de son embouchure.
Une chute rapide de l'altitude est observée de la source à 250km de cette dernière. Ensuite, la diminution est linéaire jusqu'à la dernière station située à 10m d'altitude. On peut observer un saut de plus de 50 km et de 150m d'altitude entre la station 8 (Serre de la Fare) et la station 9 (Vorey).
72
+
Une diminution rapide de l'altitude est observée de la source à 250 km de cette dernière. Ensuite, la diminution est linéaire jusqu'à la dernière station située à 10m d'altitude. On peut observer un saut de plus de 50 km et de 150m d'altitude entre la station 8 (Serre de la Fare) et la station 9 (Vorey).
75
73
76
74
Les chercheurs ont dénombré 40 espèces d'invertébrés présentées ci-dessous.
77
75
@@ -87,24 +85,25 @@ Voici le tableau des dénombrements effectués.
87
85
invert
88
86
```
89
87
90
-
Proposez un graphique intéressant afin de visualiser les dénombrements des espèces réalisés par les chercheurs. Sélectionner les colonnes intéressantes à l'aide de leur position. Votre tableau se nomme `invert`.
88
+
Élaborez un graphique permettant de visualiser les dénombrements des espèces réalisés par les chercheurs. Sélectionnez les colonnes intéressantes à l'aide de leur position. Votre tableau se nomme `invert`.
@@ -126,7 +125,7 @@ Le graphique précédent nous permet d'observer de grandes disparités entre les
126
125
127
126
Vous avez à présent toutes les connaissances afin de transformer vos variables numériques avec la fonction `log1p()` et puis d'afficher le même graphique que précédemment.
128
127
129
-
```{r visu2_h2, exercise = TRUE}
128
+
```{r visu2_h2, exercise=TRUE}
130
129
# Transformation des variables numériques
131
130
invert2 <- smutate(invert, ___(___:___, ___))
132
131
# Réalisation du même graphique que précédement.
@@ -166,14 +165,14 @@ invert2 %>.%
166
165
```
167
166
168
167
```{r visu2_h2-check}
169
-
grade_code("Vous venez d'ajouter à votre liste de fonction utile, la fonction across. N'hésitez pas à consulter la page d'aide de cette fonction. La transformation log+1 fut très efficace afin de réduire les écarts entre les observations. On observe par exemple que *Hydropsyche contubernalis* (E26) et Hydropsyche exocellata (E28) sont des espèces présentes dans de très nombreuses stations.")
168
+
grade_code("Vous venez d'ajouter à votre liste de fonction utile, la fonction `across()`. N'hésitez pas à consulter la page d'aide de cette fonction. La transformation `log(x + 1)` fut très efficace afin de réduire les écarts entre les observations. On observe par exemple que *Hydropsyche contubernalis* (E26) et Hydropsyche exocellata (E28) sont des espèces présentes dans de très nombreuses stations.")
170
169
```
171
170
172
171
## AFC
173
172
174
-
Calculez à présent votre AFC avec la fonction `ca()` et nommez votre objet `invert_ca`. La variable `Station` ne doit pas être employée dans l'AFC. Nous vous proposons de débuter par retirer la variable Station et la placer comme nom des lignes du tableau invert2 avec la fonction`column_to_rownames()`. Consultez la page d'aide de cette fonction afin d'en connaitre les arguments.
173
+
Calculez à présent votre AFC avec la fonction `ca()` et nommez votre objet `invert_ca`. La variable `Station` ne doit pas être employée dans l'AFC. Nous vous proposons de débuter par retirer la variable Station et la placer comme nom des lignes du tableau `invert2` à l'aide de`column_to_rownames()`. Consultez la page d'aide de cette fonction afin d'en connaitre les arguments.
175
174
176
-
```{r ca_h3, exercise = TRUE}
175
+
```{r ca_h3, exercise=TRUE}
177
176
# Conversion de la colonne Station en nom de lignes
# Conversion de la colonne Station en nom de lignes
187
-
invert2 <- ___(invert2, var = "")
186
+
invert2 <- ___(invert2, var = "___")
188
187
# Calcul de l'AFC
189
188
___ <- ___(invert2)
190
189
# Affichage du résumé
@@ -248,9 +247,9 @@ grade_code("La part de la variance exprimée par l'AFC est faible avec à peine
248
247
249
248
## Conclusion
250
249
251
-
Cette AFC nous a permis d'y voir plus clair entre les différentes stations et les espèces qui y vivent. Sans rien connaître sur ces espèces, nous avons pu mettre en évidence une certaine tendance.
250
+
Cette AFC nous a permis d'y voir plus clair entre les différentes stations et les espèces qui y vivent. Sans rien connaître sur ces espèces, nous avons pu mettre en évidence une tendance.
252
251
253
-
Maintenant que vous avez compris la logique, que vous maitriser les méthodes pour de préparer vos données et que vous êtes capable d'écrire le code permettant de réaliser une AFC, vous pouvez appliquer cette technique par vous-même (assignation GitHub dans le cours).
252
+
Maintenant que vous avez compris la logique, que vous maîtriser les techniques pour préparer vos données et que vous êtes capable d'écrire le code permettant de réaliser une AFC, vous pouvez appliquer tout cela dans une assignation GitHub (voir dans le cours).
0 commit comments