"Enter"a basıp içeriğe geçin

Veri Ön İşleme Nedir?

Data Preprocessing

Veri bilimi projelerinde sahip olunan veriler düzensiz halde bulunabilir, bozuk kayıtlar içerebilir ya da uygulayacağınız analize uygun halde bulunmayabilirler. Dahası daha iyi sonuçlar elde edebilmek üzere çeşitli filtrelerden geçirmek, anomalilerden işin başında kurtulmak istenilebilir. Bu ve benzeri bir çok duruma müdahaleyi içeren yöntemler bütününe veri ön işleme diyoruz.

Veri ön işleme

Veri ön işleme ile alakalı atlanılmaması gereken önemli bir nokta ise veriyi nasıl dönüştürdüğümüzü bir akış (pipeline) halinde saklamak ve proje ürüne dönüştükten sonra modeli tahminleme yaptırmak üzere kullanacak verilere de birebir aynı dönüşümü sağlamaktır.

Makine Öğrenmesi’nin 7 adımı adlı yazıda Veri Ön İşleme adımı için yapılan açıklamayı tekrar hatırlayalım:

Veri Ön İşleme veri setinin model eğitimine hazır hale getirilmesine ilişkin tüm adımları içerir. Tekrarlayan (duplicate) verilerin silinmesi, hatalı kayıtların düzeltilmesi, interpolasyon (interpolation), normalizasyon (normalization), model eğitiminde kullanılacak verilere karar verilmesi (feature selection), verinin dönüştürülmesi (feature extraction), test için kullanılacak verinin ayrıştırılması (train test split), çeşitli kodlama yöntemleri (encoding), anomali yaratan verilerin tespiti (anomaly detection) ve hatta probleme ilişkin gerek görülen tüm safhaları içerir.

Bu yazı dizisinde yukarıda bahsedilenler ve en çok uygulanan yöntemleri uygun veri setleri üzerinde inceleyerek uygulayacağız.

Keyifli öğrenmeler 🙂

İlk Yorumu Siz Yapın

Bir Cevap Yazın

Translate »
%d blogcu bunu beğendi: