"Enter"a basıp içeriğe geçin

Naive Bayes

Bir önceki yazıda karar ağacı modelinin temel çalışma prensibini incelemiştik. Bu yazıda ise Naive Bayes modelini spam posta ayrıştırması üzerinden öğreneceğiz.

E-posta kutularımızda spam postalar için ayrı bir klasör bulunur. Bazı postalar bu kutulara gider. Genelde açıp bakmayız ancak bazen spam olmayanların da buraya gittiği olur. Peki hangi postanın oraya gideceğine nasıl karar veriliyor dersiniz?

Bu kararı bizim adımıza verecek bir modele ihtiyacımız var. Bu modelin ise veriye. İleri yazılarımızda gerçek verilerle bunu yapacağız ama şimdilik 100 adet e-posta verisinin elimizde olduğunu ve bunların 25 adedinin spam olarak gerçek kişilerce etiketlendiğini varsayalım.

SPAM posta tespiti (SPAM Detection)

Bu aşamada bir iddiada bulunalım ve SPAM postalar ile para kelimesi arasında bir ilişki olduğunu düşünerek bunu inceleyelim:

para kelimesi geçen postalar

Kırmızı ile işaretli postalarda para kelimesi geçtiğini varsayalım. Bu durumda ilk sorumuz şu olacak: bir postada para kelimesi geçiyor ise % kaç ihtimal ile SPAM’dır?

25 adet para kelimesi geçen postamız var ve bunlardan 20’si SPAM. Bu durumda cevabımız (20/25)*100 = %80 olacak.

Bu ve benzeri bir çok ilişki ile elde ettiğimiz olasılık skorlarını ileri yazılarda detaylıca işleyeceğimiz naive bayes formülü ile bir araya getirdiğimizde tahmin yeteneğimiz %100’e doğru ilerliyor.

Sonraki yazımızda Doğrusal Regresyon (Linear Regression) konusunu basit bir örnek üzerinden inceleyeceğiz.

Keyifli öğrenmeler 🙂

İlk Yorumu Siz Yapın

Bir Cevap Yazın

Translate »
%d blogcu bunu beğendi: