"Enter"a basıp içeriğe geçin

Yazar: Halil Burak YILMAZ

Model Komplekslik Grafiği, Doğrulama Seti ve Grid-Search

model complexity graph, validation set and grid-search Birçok yazıda makine öğrenmesi modellerini eğitirken elde edilmek istenen sonucun en iyi genelleme yapan model olduğundan söz etmiştik. Bu yazıda mevcut olasılıklar arasından en iyi genelleme yapan modelin nasıl seçileceğinden bahsedeceğiz. Bir sonraki…

Overfitting ve Underfitting

Makine Öğrenmesi sınıflandırma ve regresyon problemlerine yönelik modellerde iki temel hata çeşidinden söz edilebilinir: Overfitting (Aşırı Öğrenme ya da Ezberleme) ve Underfitting (Eksik Öğrenme). Bu kavramları öğrenmeden önce makine öğrenmesi modellerini eğitirken amacın en iyi genelleme (generalization) yapan modele erişmek…

Python ile Regresyon Modelleri için Performans Değerlendirme

Bir önceki yazımızda regresyon modellerinin performansını değerlendirmek üzere dört farklı yönteme değinmiştik: Ortalama Mutlak Hata (Mean Absolute Error – MAE) Ortalama Karesel Hata (Mean Squared Error – MSE) Kök Ortalama Karesel Hata (Root Mean Squared Error – RMSE) R Kare…

Regresyon Modelleri için Performans Değerlendirme

Regresyon (regression) problemleri daha önce de değindiğimiz gibi sınıflandırma (classification) problemlerinden farklılık gösterir. Sınıflandırma problemlerinde sınırlı sayıda durum ya da sınıf içerisinden doğru olanı tahmin etmeye çalışırken regresyon problemlerinde sürekli olarak ifade ettiğimiz değerler içerisinden doğru değeri tahmin etmeye çalışırız.…

Python ile Sınıflandırma Modelleri için Performans Değerlendirme

Önceki iki yazımızda Sınıflandırma (Classification) modellerine ilişkin performans değerlendirme metriklerinin neler olduğunu ve nasıl hesaplandığını öğrendik. Bu yazımızda ise Jupyter Notebook üzerinde yapacağımız python uygulamaları ile bu bilgilerimizi pratiğe çevireceğiz. Pratik uygulamamız için sklearn kütüphanesinin sağladığı iris veri setini kullanacağız.…

ROC Curve ve AuC

Makine Öğrenmesi Sınıflandırma metriklerinden bir diğeri ise ROC (Receiver Operating Characteristics) eğrisi ve bu eğrinin altında kalan alanı ifade eden AuC’tur (Area under Curve). Kimi zaman AuROC (Area under ROC Curve) olarak da ifade edilebilir. ROC’tan önce hata matrisi (confusion…

Sınıflandırma Modelleri İçin Performans Değerlendirme

Sınıflandırma modellerinin performanslarını değerlendirmek için kullanılan metrikleri aşağıdaki şekilde sıralayabiliriz: Doğruluk (Accuracy) Duyarlılık (Recall) Kesinlik (Precision) F-skor Matthews Correlation Coefficient (MCC) ROC (Receiver Operator Characteristics) Curve ve AuC (Area under Curve) Bu yazıda Doğruluk, Duyarlılık, Kesinlik ve F-Skor ve MCC…

Tahminleme ve Veri Görselleştirme

Geçtiğimiz yazıda Scikit-Learn kütüphanesini kullanarak elimizdeki veri seti ile farklı modeller için eğitim (training) gerçekleştirdik. Ancak bu modelleri kullanabilmek için modellere tahmin (prediction) yaptırabilmemiz gerekiyor. Modellerin ne kadar iyi çalıştığını anlamak için ise kullandığımız yönteme ve veri setine uygun ölçme…

Translate »