L'objectif est d'estimer le prix de vente d'un bien immobilier en fonction de ses caractéristiques.
Tout d'abord, sur la plateforme Kaggle j'ai téléchargé un jeu de données remplies de variables informatives sur les caractéristiques de biens immobiliers. Bien entendu, on retrouve dans ces variables, le prix auquel chaque bien a été vendu.
Ensuite, il a fallu passer par une phase de nettoyage de données, de création de variables, d'encodage ainsi que de sélection de variables.
À l'aide du langage Python et de la bibliothèque Scikit-Learn, j'ai testé différents modèles de Machine Learning. Celui qui a eu les meilleurs performances fut l'algorithme du Gradient Boosting.
Enfin, après quelques optimisations des performances, le résultat du modèle fut le suivant : 14 % d'erreur (par rapport au prix de vente réel).
Voici le code du projet : notebook