Bu proje, Scikit-Learn kütüphanesini kullanarak Breast Cancer Wisconsin (Diagnostic) Dataset verileri üzerinde K-Nearest Neighbors (KNN) algoritması ile sınıflandırma yapmaktadır.
- Veri Seti:
load_breast_cancerile göğüs kanseri teşhisi için veri seti yüklendi. - Özellik ve Hedef Değerler: Veri setindeki bağımsız değişkenler (
features) ve bağımlı değişken (target) incelendi. - Veri Bölme:
train_test_splitfonksiyonu ile veri seti eğitim (%80) ve test (%20) olarak ayrıldı. - KNN Modeli:
KNeighborsClassifier()modeli ile eğitim yapıldı ve test verisi üzerinde tahmin gerçekleştirildi. - Performans Analizi:
confusion_matrixile hata matrisi oluşturuldu ve Seaborn kütüphanesi ile görselleştirildi.
Bu proje aşağıdaki Python kütüphanelerini kullanmaktadır:
scikit-learnseabornmatplotlibpandas
Eğer bu kütüphaneler yüklü değilse, aşağıdaki komutu kullanarak yükleyebilirsiniz:
pip install scikit-learn seaborn matplotlib pandas📊 Sonuç Görselleştirme
Projede Confusion Matrix kullanılarak modelin performansı değerlendirilmektedir.
🔹 Malignant (Kötü Huylu) ve Benign (İyi Huylu) sınıfları için hata matrisi görselleştirilmiştir.