"Enter"a basıp içeriğe geçin

Doğrusal Regresyon (Linear Regression)

Önceki iki yazımızda kullandığımız örnekler birer sınıflandırma problemi idi. Müşteri bilgisayar mı alacaktı yoksa tablet mi? Ya da gelen e-posta SPAM mıydı yoksa değil mi? gibi. Peki ya bir evin değerini tahmin etmek istersek? Bir emlakçıya girdiğinizde bu ev 300 bin mi 500 bin mi diye sormuyoruz çünkü 337856 lira da olabilir. Tüm ihtimalleri saymak da mümkün değil. İşte bu gibi “sürekli” (continuous) olan değerlerin tahminine regresyon (regression) deniyor. Linear Regression da bu tarz problemlerin çözümünde kullanılan yöntemlerden biri ve en sık başvurulanlardan.

Anlatımı sadeleştirmek adına elimizde evlerle ilgili sadece boyutu (m2) ve fiyatı olsun:

Örnek regresyon problemi

Ancak evlerin fiyatlarını metre kare değerlerine böldüğümüzde sabit bir sayı bulamayalım. Bu işin doğası gereği mümkün ama yine de ortalama bir değer hesaplamak isteriz ki hak ettiğinden çok fazla ödemeyelim.

Doğrusal Regresyon (Linear Regression)

Yukarıdaki grafikte görüleceği gibi farklı ev büyüklüklerinin farklı fiyatları var ve bunu en iyi genelleyen siyah çizgiyi bulma işine doğrusal regresyon diyoruz. Bir defa doğrusal regresyon fonksiyonumuzu belirlediğimizde büyüklüğünü bildiğimiz diğer evlerin fiyatlarını da basit grafik okuma yöntemi ile belirleyebiliyoruz.

Peki bu çizgiyi nasıl çiziyoruz. İlk önce tamamen rastgele bir doğru çiziliyor. Ardından bu doğrunun noktalara olan uzaklığı ayrı ayrı hesaplanıyor ve toplanıyor. Sonra doğru denklemi (y=mX+b) m (eğim) ve b (bias) değerleri değiştirilerek bu toplam tekrar hesaplanıyor. Eğer toplam azaldı ise fonksiyonumuz daha doğru arttı ise daha yanlış tahminde bulunuyor demek oluyor. Bu şekilde doğru fonksiyon hesaplanıyor. Bu basit işleme doğrusal regresyon deniyor.

Aşağıdaki galeride resimleri kaydırarak bahsettiğimiz bu modelleme sürecini kabaca görüntüleyebilmek mümkün.

Burada fark edileceği üzere noktaların doğruya mesafelerinin toplamı aslında bir hata fonksiyonu. Doğruyu hatanın azaldığı yöne doğru hareket ettirmek (m ve b değerlerini değiştirmek) aslında hatayı azaltmayı amaçlayan bir yöntem ve bu yöntemin adı (şimdilik sadece adını duymuş olmanız yeterli) Gradient Descent.

Gradient Descent nedir?

Gradient bir yüzeyde lokal maksimumu gösteren yön vektörüdür. Gradient’ın tersi yönünde ilerlenirse lokal minimuma doğru ilerleme ihtimali yüksektir. Bu yönde ilerleme işlemine Gradient Descent denir. Bu yönde ne kadar ilerleneceği ise ileride öğreneceğiniz gibi Öğrenme Hızı’dır (Learning Rate).

Görüldüğü üzere diğer bir makine öğrenmesi modellerinden olan doğrusal regresyon’un arkasındaki prensip de hiç karmaşık değil.

Bir sonraki yazıda modelleri tanımaya devam edeceğiz. Sıradaki konumuz Logistic Regression olacak.

Keyifli öğrenmeler 🙂

İlk Yorumu Siz Yapın

Bir Cevap Yazın

Translate »
%d blogcu bunu beğendi: