• Bağış
  • Külliyat (corpus)

    Yazan: Şadi Evren ŞEKER

    Dil biliminde ve günümüz doğal dil işleme çalışmalarında külliyat (corpus) kelimesi ile kastedilen, çok sayıdaki metnin düzenli ve yapısal olarak bir arada bulunması durumudur.

    Külliyatlar, muhteviyatına göre tek dilli (tek bir dilden metinler içeren) veya çok dilli (birden fazla dilden metinler içeren) olarak sınıflandırılabilir.

    Külliyatların, doğal dil işlemede kullanılmasının sağladığı bir avantaj da kelimelerin sınıflandırılması sırasında her kelime için yardımcı önermelerin (lemma) çıkarılmasıdır.  Buna göre aynı yazılışa sahip (eş sesli) farklı anlamda kelimeler bulunması durumlarında bu kelimelerin anlam çözümlemelerinde kullanılabilecek bilgiler külliyata göre değişiklik göstermekle birlikte, mevcut külliyat bu anlamın tespitinde yardımcı rol oynayabilir. Bu konuda Kelime-İfade Belirsizliği (word-sense ambiguity) konusuna bakabilirsiniz.

    Benzer Yazılar:

    Bilgisayar Kavramları üzerinde şu anda okumakta olduğunuz 'Külliyat (corpus)' isimli yazı 25 Mar 2008 tarihinde, saat: 03:52 'de Şadi Evren ŞEKER tarafından gönderilmiş, toplam 461 defa okunmuştur.

    Benzer yazıları Doğal Dil İşleme (NLP) kategorilerinden okuyabilirsiniz. Yazar ile irtibat kurmak için email gönderebilirsiniz. Yazıya yorum yapabilir ya da yapılan yorumları RSS 2.0 ile takibe alabilirsiniz.


    Category: Doğal Dil İşleme (NLP)
    No response to “Külliyat (corpus)”
    1. [...] ve pragma çıkarılmasında önemli bir alternatif niteliğindedir. Benzer bir çıkarım ise külliyat (corpus) üzerine [...]

    Leave a Reply