"Enter"a basıp içeriğe geçin

Etiket: pandas

Veri Temizleme

Data Cleaning Veri temizleme (Data Cleaning) veri setinde var olan ve uygulanacak makine öğrenmesi modelinin performansını olumsuz yönde etkileyecek problemlerin ortadan kaldırılmasını amaçlayan veri ön işleme adımlarının bütünüdür. Çoğunlukla çalışma yapılan alanla ilgili bilgi (domain knowledge) gerektirir. Veri temizleme yöntemleri…

Temel Bileşenler Analizi

Principle Component Analysis (PCA) Temel Bileşenler Analizi boyut azaltma (dimentionality reduction) amacı ile kullanılan veri ön işleme yöntemlerinden biridir. Sıkça kullanılan feature extraction yöntemlerindendir. Fikrin ya da yöntemin ortaya çıkma sebebini anlamak için aşağıdaki grafiği inceleyelim: Görsele baktığınızda iki boyutlu…

Log Dönüşümü ile Çarpıklık Giderme

Log-Transform skewed data Çarpıklık (skewness) sürekli ya da diğer bir deyiş ile kategorik olmayan veri setlerinde veri dağılımında simetrinin bozuk olma durumuna verilen isimdir denilebilir. Diğer bir deyiş ile asimetri ölçütüdür. Özetle gerçekte veri setlerinin dağılımının normal dağılım (normal distribution)…

Pandas kütüphanesi ile Keşifsel Veri Analizi (Exploratory Data Analysis – EDA)

Keşifsel Veri Analizi çoğu zaman özet istatistiklerin yardımı ile verinin boyutsal olarak kavrandığı, içerisindeki anomalilerin keşfedildiği, hipotezlerin test edildiği, korelasyonların belirlendiği kritik sürece verilen isimdir. ilk olarak yine örnek veri setini bilgisayarlarımıza indirerek başlayalım. CSV uzantılı dosyamızı indirdiysek pandas‘ın read_csv…

Translate »