You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
#' A total of 3810 rice grain's images were taken for the two species (Cammeo and Osmancik),
4
+
#' processed and feature inferences were made. Seven morphological features were obtained for each grain of rice.
5
+
#'
6
+
#' @format A data frame with 8 variables and 3810 observations:
7
+
#' \describe{
8
+
#' \item{\code{area}}{The number of pixels within the boundaries of the rice grain.}
9
+
#' \item{\code{perimeter}}{The perimeter of the rice grain.}
10
+
#' \item{\code{major_axis_length}}{The longest line that can be drawn on the rice grain.}
11
+
#' \item{\code{minor_axis_length}}{The shortest line that can be drawn on the rice grain.}
12
+
#' \item{\code{eccentricity}}{It measures how round the ellipse, which has the same moments as the rice grain, is.}
13
+
#' \item{\code{convex_area}}{The the pixel count of the smallest convex shell of the region formed by the rice grain.}
14
+
#' \item{\code{extent}}{the ratio of the region formed by the rice grain to the bounding box pixels.}
15
+
#' \item{\code{class}}{A **factor** with two levels: `"Cammeo"`, and `"Osmancik"`.}
16
+
#' }
17
+
#' @source {Cinar, I. and Koklu, M. (2019). Classification of Rice Varieties Using Artificial Intelligence Methods. International Journal of Intelligent Systems and Applications in Engineering, vol.7, no.3 (Sep. 2019), pp.188-194. doi:10.18201/ijisae.2019355381}
Ce tutoriel s'intéresse à la régression linéaire. Il débute par un rappel sur la corrélation et les corrélogrammes. Cette matière est détaillée dans le module 12 de [science des données I](https://wp.sciviews.org/sdd-umons). Les objectifs de ce tutoriel sont:
48
+
Ce tutoriel sur la régression linéairedébute par un rappel sur la corrélation et les corrélogrammes. Cette matière est détaillée dans le [module 12 de science des données I](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2022/correlation.html). Les objectifs de ce tutoriel sont:
49
49
50
50
- Revoir la corrélation et les indices de Pearson et Spearman
51
51
52
52
- Maîtriser la régression linéaire dans R, en particulier la fonction `lm()`.
53
53
54
+
<!-- TODO: paramétriser un modèle, c'est super-important! -->
55
+
54
56
## Biométrie des crabes
55
57
56
-
Cinq mesures morphologiques ont été étudiées sur 200 crabes. On retrouve quatre groupes composés de 50 individus. On retrouve les crabes bleu mâles et femelles et les crabes orange mâles et femelles.
58
+
Cinq mesures morphologiques ont été étudiées sur 200 crabes. On retrouve quatre groupes composés de 50 individus, soit des crabes bleu mâles et femelles et des crabes orange mâles et femelles.
57
59
58
60
```{r, echo = TRUE}
59
61
crabs <- read("crabs", package = "MASS")
60
62
skimr::skim(crabs)
61
63
```
62
64
63
-
La fonction `skim()` vous permet d'obtenir de nombreuses informations sur le tableau `crabs`. N'hésitez pas à consulter la page d'aide du jeu de données pour en apprendre davantage.
65
+
La fonction `skimr::skim()` vous permet d'obtenir de nombreuses informations sur le tableau `crabs`. N'hésitez pas à consulter la page d'aide du jeu de données pour en apprendre davantage.
64
66
65
-
C'est à vous de jouer! Réalisez une matrice de corrélation avec l'indice de Pearson. N'utilisez que les variables pertinentes. Sélectionnez ces variables sur base de leur nom. Affichez un corrélogramme avec la partie supérieure uniquement (`upper`).
67
+
C'est à vous de jouer! Réalisez une matrice de corrélation avec l'indice de Pearson. N'utilisez que les variables pertinentes. Sélectionnez ces variables sur base de leur nom. Affichez un corrélogramme avec la partie supérieure uniquement (`upper`).
66
68
67
69
```{r corr1_h3, exercise=TRUE, exercise.lines=2}
68
-
crabs_corr <- correlation(sselect(___, ___:___), use = ___, method = ___)
70
+
crabs_corr <- correlation(sselect(___, ___:___),
71
+
use = ___, method = ___)
69
72
plot(crabs_corr, ___ = ___)
70
73
```
71
74
72
75
```{r corr1_h3-hint-1}
73
-
crabs_corr <- correlation(sselect(___, ___:___), use = "complete.obs", method = "pearson")
76
+
crabs_corr <- correlation(sselect(___, ___:___),
77
+
use = "complete.obs", method = "pearson")
74
78
plot(crabs_corr, type = ___)
75
79
# Relisez le chapitre 12 du livre science des données 1 <https://wp.sciviewg/sdd-umons/>
76
80
```
77
81
78
82
```{r corr1_h3-hint-2}
79
-
correlation(sselect(crabs, ___:___), use = "complete.obs", method = "pearson")
83
+
correlation(sselect(crabs, ___:___),
84
+
use = "complete.obs", method = "pearson")
80
85
plot(crabs_corr, type = "upper")
81
86
#### ATTENTION: Hint suivant = solution !####
82
87
```
83
88
84
89
```{r corr1_h3-solution}
85
90
## Solution ##
86
-
crabs_corr <- correlation(sselect(crabs, front:depth), use = "complete.obs", method = "pearson")
TODO: ce tutoriel doit encore être écrit. Vous devez probablement penser à installer une version plus récente du package qui contient les exercices finalisés !
38
+
- Utiliser la fonction `lm()` afin d'obtenir un modèle de régression linéaire simple.
40
39
41
-
Utiliser la fonction lm() afin d'obtenir un modèle qui touche à la régression linéaire est simple. Il est plus compliqué de réaliser une fonction linéaire pertinente. Étudier le résumé du modèle linéaire et s'intéresser à l'analyse des résidus est plus complexe. L'objectif de ce tutoriel est.
40
+
-Étudier le résumé du modèle linéaire
42
41
43
-
-d'étudier les graphiques dédiés à l'analyse des résidus.
42
+
-Être capable de réaliser une analyse des résidus
44
43
45
44
## Description des données
46
45
47
46
Des scientifiques s'intéressent à deux variétés de riz cultivées en Turquie. Ils ont l'objectif de mettre en place un outil capable sur base d'analyse d'image de classer des grains de riz.
48
47
49
48
```{r, echo = TRUE}
50
-
rice <- read("rice", package = "BioDataScience3")
49
+
rice <- read("rice", package = "BioDataScience2")
51
50
```
52
51
53
52
Vous avez à disposition le tableau `rice` qui comprend les variables suivantes `r names(rice)`. Consultez la page d'aide afin d'en apprendre davantage.
54
53
55
-
Votre objectif est de réaliser une régression linéaire de la variable `area`grâce à la variable `major_axis_length`. Vous devrez ensuite analyser le résumé de cette régression et les outils de diagnostic des résidus.
54
+
Votre objectif est de réaliser une régression linéaire de la variable `area`sur à la variable `major_axis_length`. Vous devrez ensuite analyser le résumé de cette régression et utilser les outils de diagnostic des résidus.
56
55
57
56
Débutez cette analyse par proposer un nuage de point de la variable `area` en fonction de la variable `major_axis_length`.
@@ -151,18 +151,20 @@ Vous avez à votre disposition l'objet `rice_lm` que vous avez réalisé précé
151
151
chart$___(___)
152
152
# graphique quantile-quantile
153
153
chart$___(___)
154
-
# Position et echelle des résidus
154
+
# Position et échelle des résidus
155
155
chart$___(___)
156
156
# Distance de Cook
157
157
chart$___(___)
158
158
```
159
159
160
160
```{r resid_h2-hint-1}
161
161
# Consultez la page d'aide `modelit::chart.lm()`
162
+
162
163
#### ATTENTION: Hint suivant = solution !####
163
164
```
164
165
165
166
```{r resid_h2-solution}
167
+
## Solution ##
166
168
# distribution des résidus
167
169
chart$resfitted(rice_lm)
168
170
# graphique quantile-quantile
@@ -174,7 +176,7 @@ chart$cooksd(rice_lm)
174
176
```
175
177
176
178
```{r resid_h2-check}
177
-
grade_code("Bravo ! Vous avez réalisé les quatres graphiques les plus courants de l'analyse des résidus. Serez vous à présent répondre à la question suivante.")
179
+
grade_code("Bravo ! Vous avez réalisé les quatres graphiques les plus courants de l'analyse des résidus. Saurez-vous à présent répondre à la question suivante.")
0 commit comments