Bu projede, dengelenmiş bir veri kümesi (balanced_update_data_dt.csv) üzerinde çeşitli geleneksel makine öğrenmesi sınıflandırma algoritmaları kullanılarak performans karşılaştırması yapılmıştır.
- Decision Tree (Karar Ağacı)
- Support Vector Machine (SVM)
- Naive Bayes
- Random Forest
-
Veri Yükleme ve Hazırlık:
Veri kümesi yüklenmiş,classsütunu hedef değişken olarak ayrılmıştır. Eğitim ve test kümeleri %80-%20 oranında bölünmüştür. -
Sınıf Dağılımının Görselleştirilmesi:
Sınıf dağılımı çubuk grafikle gösterilerek dengenin sağlandığı doğrulanmıştır. -
Korelasyon Isı Haritası:
Hedef değişken ile öznitelikler arasındaki ilişki ısı haritası ile görselleştirilmiştir. -
Model Eğitimi ve Değerlendirme:
Her bir model, eğitim verisi ile eğitilip test verisi üzerinde değerlendirilmiştir. Değerlendirme metrikleri:- Accuracy (Doğruluk)
- Precision, Recall, F1-Score
- Confusion Matrix (Karışıklık Matrisi)
-
Görselleştirme:
Her model için karışıklık matrisi ayrı ayrı ısı haritası olarak çizdirilmiştir.
pip install pandas matplotlib seaborn scikit-learn