Skip to content

Commit c391c2d

Browse files
committed
Revision of B07Lb_ca
1 parent a6bf316 commit c391c2d

File tree

1 file changed

+24
-22
lines changed

1 file changed

+24
-22
lines changed

inst/tutorials/B07Lb_ca/B07Lb_ca.Rmd

Lines changed: 24 additions & 22 deletions
Original file line numberDiff line numberDiff line change
@@ -40,50 +40,52 @@ L'Analyse Factorielle des Correspondances (AFC) est une variante de l'Analyse en
4040

4141
- Effectuer les graphiques associés à cette analyse
4242

43-
- Vous préparez à interpréter par vous-même les résultats de vos AFC
43+
- Vous préparer à interpréter par vous-même les résultats de vos AFC
4444

4545
Avant toute chose, assurez-vous d'avoir bien compris le contenu du [module 7](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2022/acp-afc.html) du cours et en particulier la [section 7.3](https://wp.sciviews.org/sdd-umons2/?iframe=wp.sciviews.org/sdd-umons2-2022/analyse-factorielle-des-correspondances.html).
4646

4747
## Couleur des yeux et des cheveux
4848

49-
L'étude porte sur 5387 personnes vivant dans l'ancienne région de Caithness, se situant au nord de l'Écosse.
49+
L'étude porte sur 5387 personnes provenant du Nord de l'Écosse. Le jeu de données se nomme `caith`.
5050

5151
```{r, echo=TRUE}
5252
caith <- read("caith", package = "MASS")
5353
caith
5454
```
5555

56-
Le tableau de données est un tableau de contingence à double entrée. Observez les colonnes. On en dénombre `r dim(caith)[2]` colonnes. La première colonne est particulièrement intéressante en portant un nom particulier `.rownames`.
56+
Il s'agit d'un tableau de contingence à double entrée. Observez les colonnes. On en dénombre `r dim(caith)[2]`. La première est de type `character`. Elle porte un nom particulier : `.rownames`.
5757

58-
Rappelez-vous que nous retrouvons plusieurs types d'objets pour les tableaux de données : les `data.frames`, les `data.tables` ou encore les `tibbles`. Par défaut en utilisant les fonctions `SciViews`, les tableaux de données sont des `data.tables`. Vous pouvez vérifier la classe d'un objet avec la fonction `class()`.
58+
Rappelez-vous que nous retrouvons plusieurs types d'objets dans R pour les tableaux de données : les `data.frame`s, les `data.table`s ou encore les `tibble`s. Par défaut dans `SciViews::R`, les tableaux de données sont des `data.table`s. Vous pouvez vérifier la classe d'un objet avec `class()`.
5959

6060
```{r, echo=TRUE}
6161
class(caith)
6262
```
6363

64-
## Réalisation de l'ACF
64+
## Préparation des données
6565

66-
Le tableau nécessaire afin de réaliser une analyse factorielle des correspondances ne doit comprendre que des valeurs numériques. La première colonne `.rownames` est donc un problème. Une solution serait de la retirer avec la fonction `sselect()`. Elle n'est cependant pas la meilleure solution. Cette colonne apporte une information très intéressante dont on ne veut pas se passer. Il est donc préférable d'employer un objet différent. Les `data.frames` supporte les noms des lignes (*rownames*).
66+
Le tableau nécessaire afin de réaliser une analyse factorielle des correspondances ne doit comprendre que des valeurs numériques. La première colonne `.rownames` est donc un problème. Une solution serait de la retirer avec, par exemple, `sselect()`. Ce n'est cependant pas la meilleure solution. Cette colonne apporte une information très intéressante dont on ne veut pas se passer : un label pour les lignes du tableau. Il est donc préférable de convertir en un objet différent qui prendra en compte ces labels. Les `data.frame`s supportent des noms pour les lignes (*rownames*) autant que les colonnes à la différence des `data.table`s et des `tibble`s.
6767

68-
Convertissez l'objet `caith` un `data.tables` en `data.frames` à l'aide de la fonction `as_dtf()`. Nommez ce nouvel objet `caith_df`.
68+
Convertissez l'objet `caith` en `data.frame` à l'aide de `as_dtf()`. Nommez ce nouvel objet `caith_df`.
6969

7070
```{r dtf, exercise=TRUE}
7171
caith_df <- ___(___)
72-
# affichez le tableau
72+
# Afficher le tableau
7373
caith_df
7474
```
7575

7676
```{r dtf-solution}
7777
caith_df <- as_dtf(caith)
78-
# affichez le tableau
78+
# Afficher le tableau
7979
caith_df
8080
```
8181

8282
```{r dtf-check}
83-
grade_code("La conversion du tableau de données entre le `data.tables` en `data.frames` est simple avec la fonction `as_dtf()`. par defaut, la fonction reconnait la colonne .rownames et la converti en nom de ligne pour un objet de class data.frames qui les accepte.")
83+
grade_code("La conversion du tableau en `data.frames` est simple avec la fonction `as_dtf()`. Par defaut, la fonction reconnait la colonne `.rownames` et la converti en nom de lignes. Si la colonne à transformer en nom des lignes porte un autre nom que `.rownames`, alors vous pouvez utiliser l'argument `rownames =` pour indiquer quelle colonne utiliser.")
8484
```
8585

86-
Réalisez à présent une analyse factorielle des correspondances sur l'objet `caith_df` et nommez cet objet `caith_ca`. Proposez en plus le résumé de cet objet.
86+
## Réalisation de l'ACF
87+
88+
Réalisez à présent une analyse factorielle des correspondances sur l'objet `caith_df` et nommez-la `caith_ca`. Réalisez ensuite le résumé de ce dernier objet.
8789

8890
```{r ca_h2, exercise=TRUE}
8991
# AFC
@@ -94,7 +96,7 @@ ___(___)
9496

9597
```{r ca_h2-hint-1}
9698
# AFC
97-
caith_ca <- ca()
99+
caith_ca <- ca(___)
98100
# Résumé de l'objet
99101
___(caith_ca)
100102
```
@@ -107,10 +109,10 @@ summary(caith_ca)
107109
```
108110

109111
```{r ca_h2-check}
110-
grade_code("Le code est simple à réaliser. Le résumé de l'objet met en avant qu'avec les deux premiers axes ont couvre 99.6% de la variance. Le premier axe couvre plus de 86%. L'essentiel de l'information se lira sur ce seul axe.")
112+
grade_code("Le code est simple. Le résumé de l'objet met en avant qu'avec les deux premiers axes on couvre 99.6% de la variance. Le premier axe couvre déjà plus de 86%. L'essentiel de l'information se lira donc dans le premier plan de projection.")
111113
```
112114

113-
Proposez le graphique des éboulis associé à l'objet `caith_ca`
115+
Réalisez le graphique des éboulis de votre analyse.
114116

115117
```{r scree, exercise=TRUE}
116118
___$___()
@@ -121,10 +123,10 @@ chart$scree(caith_ca)
121123
```
122124

123125
```{r scree-check}
124-
grade_code("Ce graphique vient en complément du premier tableau proposé dans le résumé. On observe que le premier axe comprend une grande part de la variance.")
126+
grade_code("Ce graphique vient en complément du résumé. On observe que le premier axe comprend une grande part de la variance.")
125127
```
126128

127-
Proposez enfin la carte (biplot) de votre objet `caith_ca`.
129+
Réalisez enfin la carte (biplot) de votre AFC.
128130

129131
```{r biplot, exercise=TRUE}
130132
___$___()
@@ -135,12 +137,12 @@ chart$biplot(caith_ca)
135137
```
136138

137139
```{r biplot-check}
138-
grade_code("Ce graphique va s'analyser en 3 étapes. On va d'abord s'intéresser aux yeux, puis au cheveux et enfin les deux ensembles. Faites le travail par vous même avant de vous rendre dans la section suivante pour comparer votre analyse avec celle que nous vous proposons.")
140+
grade_code("Ce graphique va s'analyser en trois étapes. On va d'abord s'intéresser aux yeux, puis au cheveux et enfin les deux ensemble. Faites le travail par vous-même avant de vous rendre dans la section suivante pour comparer votre analyse avec celle que nous vous proposons.")
139141
```
140142

141-
## Interprétation de ACF
143+
## Interprétation d'une ACF
142144

143-
Les instructions réalisées pour obtenir l'AFC sont assez simples, mais toute la subtilité vient de l'analyse des résultats.
145+
Les instructions pour obtenir l'AFC sont assez simples, au delà de la petite difficulté éventuelle liée au label des lignes du tableau, mais toute la subtilité vient de l'interprétation des résultats.
144146

145147
```{r}
146148
caith_df <- as_dtf(read("caith", package = "MASS"))
@@ -149,13 +151,13 @@ summary(caith_ca)
149151
chart$biplot(caith_ca, repel = TRUE)
150152
```
151153

152-
Les deux premiers axes couvrent 99.6% de la variance. Du point de vue des cheveux, on observe une transition des cheveux clairs à gauche vers les cheveux foncés à droite. Du point de vue des yeux, les yeux clairs sont à gauche et les yeux foncés à droite.
154+
Les deux premiers axes couvrent 99.6% de la variance. Du point de vue des cheveux (représentés ici en rouge), on observe une transition des cheveux clairs (*fair* = blond) à gauche vers les cheveux foncés à droite. Du point de vue des yeux (ici en turquoise), les yeux clairs (*blue* et *light*) sont à gauche et les yeux foncés à droite.
153155

154-
On observe la même transition du clair vers le foncé aussi bien pour les cheveux que pour les yeux. Les individus aux yeux clairs vont être liés aux cheveux clairs et les individus aux yeux foncés sont associés aux cheveux foncés.
156+
On observe la même transition du clair vers le foncé aussi bien pour les cheveux que pour les yeux. Les individus aux yeux clairs vont être liés aux cheveux clairs et les individus aux yeux foncés sont associés aux cheveux foncés (proximité des points rouges et turquoises pour l'interprétation de ces associations).
155157

156158
## Conclusion
157159

158-
Cette AFC nous a permis d'y voir plus clair entre les différentes stations et les espèces qui y vivent. Sans rien connaître sur ces espèces, nous avons pu mettre en évidence une tendance.
160+
Cette AFC nous a permis d'observer des tendances dans nos données. Le fait que les blonds ont tendance à avoir des yeux clairs et les bruns des yeux foncés ne devra pas vous étonner, de même que le contraste entre ces deux extrêmes aussi bien pour les cheveux que pour les yeux. Donc, vous pouvez constater que l'AFC présente une telle information assez clairement sur le biplot.
159161

160162
Maintenant que vous avez compris la logique, que vous maîtrisez les techniques pour préparer vos données et que vous êtes capable d'écrire le code permettant de réaliser une AFC, vous pouvez appliquer tout cela dans une assignation GitHub (voir dans le cours).
161163

0 commit comments

Comments
 (0)