K-Ortalama Algoritması (K-Means Algorithm)


Yazan : Şadi Evren ŞEKER

Sınıflandırmada (clustering) kullanılan algoritmalardan birisidir. Amaç özellik çıkarımı (Feature extraction) yapılmış bir grup verinin birden fazla sınıfa göre doğru sınıflandırılmasıdır.

Kullanılan matematiksel yöntem her sınıf için merkez belirlenen noktaya uzaklığa (aynı zamanda bu hata miktarıdır) göre yeni sınıfların yerleştirilmesidir.

Algoritma temel olarak 4 aşamadan oluşur:

  1. Sınıf merkezlerinin belirlenmesi
  2. Merkez dışındaki örneklerin mesafelerine göre sınıflandırılması
  3. Yapılan sınıflandırmaya göre yeni merkezlerin belirlenmesi (veya eski merkezlerin yeni merkeze kaydırılması)
  4. Kararlı hale (stable state) gelinene kadar 2. ve 3. adımların tekrarlanması

Çalışmayı daha net anlamak için aşağıdaki örnek uzaya dağılmış olan örnekleri inceleyelim:

Yukarıda verilen ve uzayda koordinatları kodlanmış olan örnekler için iki adet hedef küme tanımlıyoruz. (iki sınıf ve bu sınıfların karakterlerini tanımlıyoruz)

Bu sınıf tanımlarına uzaklıklarına göre (örneğin öklit mesafesi (euclid distance) ) bütün örneklerimizi sınıflandırıyoruz. (hangi renge daha yakınsa)

Oluşan sınıfları ayıran bir hat aşağıdaki şekilde çizilebilir:

Daha önceden sınıflandırdığımız örneklerin merkezlerini buluyoruz. (yuvarlak ile gösterilen ve sınıf karakteristiğini temsil eden ilk örneklerin yerini değiştirmek olarak da düşünülebilir)

Merkezleri hareket ettirdikten sonra örneklerden bazıları yeni merkezlere daha yakın olabilir. Buna göre örnek kümelerimizin sınıflandırılmasını güncelliyoruz.

Yukarıda son hali gösterilen k-means algoritmasında yeni merkezler ve her örneğin hangi sınıfa girdiği bulunmuştur.


« YACC   |   Self Organizing Maps (Özdüzenleyici Haritalar) »



Yorumlar

Kullanıcı girişi yaparak ya da zorunlu olan * alanlarını doldurarak yorum yapabilirsiniz.

İsminiz *

Email adresiniz *

Web siteniz

Mesajınızı buraya yazabilirsiniz:

Bu Yazı Hakkında

Bilgisayar Kavramları üzerinde şu anda okumakta olduğunuz 'K-Ortalama Algoritması (K-Means Algorithm)' isimli yazı 15 Dec 2008 tarihinde, saat: 03:07 'de Şadi Evren ŞEKER tarafından gönderilmiş, toplam 1432 defa okunmuştur.

Benzer yazıları Bilgisayar Kavramları, Bilgisayar Matematiği, Yapay Sinir Ağları (Artificial Neural Networks) kategorilerinden okuyabilirsiniz. Yazar ile irtibat kurmak için email gönderebilirsiniz. Yazıya yorum yapabilir ya da yapılan yorumları RSS 2.0 ile takibe alabilirsiniz.


Yazarın Kitabı

Bu yazının yazarı Şadi Evren ŞEKER'in son çıkan kitabı "Programlama ve Veri Yapılarına giriş (C, C++ ve JAVA ile)" hakkında bilgi almak için Buraya tıklayabilirsiniz.
Eklenen Son Yazılar
Yapılan Son Yorumlar
Yakın Yazılar
Bağlantılar