"Enter"a basıp içeriğe geçin

Ay: Mayıs 2020

ROC Curve ve AuC

Makine Öğrenmesi Sınıflandırma metriklerinden bir diğeri ise ROC (Receiver Operating Characteristics) eğrisi ve bu eğrinin altında kalan alanı ifade eden AuC’tur (Area under Curve). Kimi zaman AuROC (Area under ROC Curve) olarak da ifade edilebilir. ROC’tan önce hata matrisi (confusion…

Sınıflandırma Modelleri İçin Performans Değerlendirme

Sınıflandırma modellerinin performanslarını değerlendirmek için kullanılan metrikleri aşağıdaki şekilde sıralayabiliriz: Doğruluk (Accuracy) Duyarlılık (Recall) Kesinlik (Precision) F-skor Matthews Correlation Coefficient (MCC) ROC (Receiver Operator Characteristics) Curve ve AuC (Area under Curve) Bu yazıda Doğruluk, Duyarlılık, Kesinlik ve F-Skor ve MCC…

Tahminleme ve Veri Görselleştirme

Geçtiğimiz yazıda Scikit-Learn kütüphanesini kullanarak elimizdeki veri seti ile farklı modeller için eğitim (training) gerçekleştirdik. Ancak bu modelleri kullanabilmek için modellere tahmin (prediction) yaptırabilmemiz gerekiyor. Modellerin ne kadar iyi çalıştığını anlamak için ise kullandığımız yönteme ve veri setine uygun ölçme…

Pandas kütüphanesi ile Keşifsel Veri Analizi (Exploratory Data Analysis – EDA)

Keşifsel Veri Analizi çoğu zaman özet istatistiklerin yardımı ile verinin boyutsal olarak kavrandığı, içerisindeki anomalilerin keşfedildiği, hipotezlerin test edildiği, korelasyonların belirlendiği kritik sürece verilen isimdir. ilk olarak yine örnek veri setini bilgisayarlarımıza indirerek başlayalım. CSV uzantılı dosyamızı indirdiysek pandas‘ın read_csv…

Hiyerarşik Kümeleme (Hierarchical Clustering)

Hiyererşik Kümeleme (Hierarchical Clustering) K-Means gibi yaygın kümeleme yöntemlerinden biridir. Önceki yazıdan hatırlayacağınız gibi K-Means Kümelemede kaç farklı küme yapacağımızı baştan belirtmemiz gerekiyordu. Hiyerarşik Kümelemeyi ise küme sayısını bilmediğimiz durumlarda kullanıyoruz. Fakat her makine öğrenmesi yöntemi gibi bu yöntemde de…

Kümeleme (Clustering)

Şu ana kadar gördüğümüz yöntemler aslında etiketli (labeled) diye tarif ettiğimiz veri setleri ile ilgilenen makine öğrenmesi alt dalı olan gözetimli öğrenme (supervised learning) tekniği idi. Bunun alt kırılımı olarak sınıflandırma (classification) ve regresyon (regression) dallarına örnekler verdik. Bu kısımda…

Translate »