"Enter"a basıp içeriğe geçin

Hiyerarşik Kümeleme (Hierarchical Clustering)

Hiyererşik Kümeleme (Hierarchical Clustering) K-Means gibi yaygın kümeleme yöntemlerinden biridir. Önceki yazıdan hatırlayacağınız gibi K-Means Kümelemede kaç farklı küme yapacağımızı baştan belirtmemiz gerekiyordu. Hiyerarşik Kümelemeyi ise küme sayısını bilmediğimiz durumlarda kullanıyoruz. Fakat her makine öğrenmesi yöntemi gibi bu yöntemde de bazı parametreleri baştan belirtmemiz gerekiyor. Burada da baştan belirlememiz gereken en önemli parametre küme elemanlarının birbirine olan mesafesinin en fazla ne kadar olacağı.

Mesafe alışılmış olarak uzayda iki noktanın birbirine olan en kısa uzaklığı olarak algılansa da bir çok farklı mesafe metriği bulunmakta. Örneğin söz konusu bir şehir ise kuş uçuşu mesafe yerine güzergah ya da ulaşma süresi daha doğru bir mesafe aracı olabilir. Kümeleme analizlerinde mesafe tanımının doğru belirlenmesi sonuca önemli ölçüde etki eder.

Hiyerarşik kümeleme çok basitçe birbirine en yakın nokta ya da iterasyonlar sırasında oluşmuş kümeleri birbirine bağlayarak küme oluşturur. Belirleyeceğiniz maksimum mesafe metriği ise kümelerin genişlemeyi ne zaman bitireceğini belirler. Kümelerin oluşumu sırasında oluşan hiyerarşinin çizimine ise dendrogram deniyor.

Öncelikle hiyerarşik kümelemenin nasıl çalıştığına ve dendrogram’ın nasıl oluştuğuna yine basit bir animatif görsel setimiz ile bakalım:

Animatif görsel setinde görüldüğü üzere tekrarlayan şekilde noktalardan ya da kümelerden en yakın olanları birbirine bağlanıyor ve en kısa mesafe önceden belirttiğimiz iki küme elemanı için birbirine olabilecek en uzak mesafeden uzun olduğunda algoritma duruyor. Durduğu anda elde kalan ayrık kümeler ise algoritmanın sonucunu belirliyor.

Burada dikkat edilirse mesafe ölçümü noktalar üzerinden ilerliyor. Ancak problemin özelliklerine göre tercih edilirse küme merkezi de mesafe ölçümünde kullanılabilir. Bu durumda bambaşka sonuçlar ortaya çıkabilir.

Bu yazı ile beraber Basitçe Makine Öğrenmesi adlı ünitenin sonuna gelmiş olduk. Ünite ile herhangi bir uygulama yapmadan genel hatları ile makine öğrenmesinin temelleri hakkında fikir sahibi olduk.

Bir sonraki ünitede öğrendiğimiz modellerin scikit-learn kütüphanesi ile uygulamalarını yapacağız.

Keyifli Öğrenmeler 🙂

İlk Yorumu Siz Yapın

Bir Cevap Yazın

Translate »
%d blogcu bunu beğendi: