"Enter"a basıp içeriğe geçin

Basitçe Makine Öğrenmesi Modelleri

İlk yazımızda Makine Öğrenmesi Nedir‘i incelemiştik. Bu yazıda ise detaylara girmeden bir kaç farklı Makine Öğrenmesi modelini inceleyerek hem kelime dağarcığımızı genişleteceğiz hem de makine öğrenmesinin büyüsünü bozacağız.

Karar Ağacı (Decision Tree)

Elimizde farklı cinsiyette ve çevrimiçi süresine sahip 6 tüketicinin bilgisayar, tablet ya da telefon ürünlerinden hangisini satın aldığına dair bir veri olduğunu var sayalım. Elbette ki bu kadar az örnek ve bilgi (cinsiyet ve çevrimiçi süresi) ile karar vermek mümkün değil ancak Karar Ağacı modellerinin çalışma prensiplerini öğrenmek için kullanılabilir.

Farklı cinsiyet ve çevrimiçi süresine sahip tüketicilerin satın alma bilgileri

Müşterilerine doğru ürünü önermek isteyen bir internet mağazasının bu veriler ışığında sanal mağazasında gezinen müşterilerin bakabileceği 2 özelliği var: Cinsiyet ve Çevrimiçi Süresi. Tablo bu hali ile (binlerce satır olduğunu düşünelim) bize pek bir şey ifade etmeyecektir. Bunu bir karar ağacına çevirmek istersek bu 2 özellikten hangisinin daha iyi bir genelleme yaptığını, ürün ile arasında daha kuvvetli bir ilişki barındırdığını bulmamız gerekiyor.

Hangi değişken daha kararlı?

Önce cinsiyet‘i inceleyelim. Satın alma ayrımını cinsiyet ile yaptığımızda kadın müşterilerin bilgisayar ve telefon, erkek müşterilerin ise tablet ve bilgisayar satın aldığı görülüyor. Her iki cinsiyetin de farklı iki ürün aldığını söyleyebiliyoruz.

Peki Çevrimiçi Süresi ile bu ayrımı yapmak istersek: 20 saatin altında çevrimiçi süresine sahip müşterilerin bilgisayar, 20 saatin üzerinde çevrimiçi süresine sahip müşterilerin ise tablet ya da telefon satın aldığını görebiliyoruz. Bu durumda ürünlerin ayrıştırılmasında bu özelliğin daha iyi performans gösterdiğini dolayısı ile ağacımızın ilk sorusu çevrimiçi süresi olmalı.

20 saatin altında olan müşterilerin tamamı bilgisayar aldığına göre, bu kişiler için cinsiyet incelemesi yapmak anlamsız. Ancak 20 saatin üzerindeki müşterileri hala tam olarak ayıramadık çünkü onlara tablet mi yoksa telefon mu önereceğimize henüz karar vermedik. Bu kullanıcıların cinsiyetine bakarsak kadın müşterilerin telefon, erkek müşterilerin ise tablet aldığını görüyoruz. Dolayısı ile resimdeki gibi bir ağaç sanal mağazanın sorularına cevap verecektir:

Örnek veri seti ve oluşan karar ağacı

Bu özelliklerin her birinin hedef (target, label) ile ilişkisine bilgi kazanımı (information gain) deniyor. Bilgi kazanımı sıralamasına göre karar ağacı oluşturuluyor.

Görüldüğü üzere, sıkça başvurulan makine öğrenmesi modellerinden olan Karar Ağacı (Decision Tree) bu temel ve basit prensip ile çalışıyor.

Bir sonraki yazımızda posta kutumuza gelen spam postaların nasıl ayrıştırıldığını öğreneceğiz.

Keyifli öğrenmeler 🙂

İlk Yorumu Siz Yapın

Bir Cevap Yazın

Translate »
%d blogcu bunu beğendi: