Külliyat (corpus)
Yazan: Şadi Evren ŞEKER
Dil biliminde ve günümüz doğal dil işleme çalışmalarında külliyat (corpus) kelimesi ile kastedilen, çok sayıdaki metnin düzenli ve yapısal olarak bir arada bulunması durumudur.
Külliyatlar, muhteviyatına göre tek dilli (tek bir dilden metinler içeren) veya çok dilli (birden fazla dilden metinler içeren) olarak sınıflandırılabilir.
Külliyatların, doğal dil işlemede kullanılmasının sağladığı bir avantaj da kelimelerin sınıflandırılması sırasında her kelime için yardımcı önermelerin (lemma) çıkarılmasıdır. Buna göre aynı yazılışa sahip (eş sesli) farklı anlamda kelimeler bulunması durumlarında bu kelimelerin anlam çözümlemelerinde kullanılabilecek bilgiler külliyata göre değişiklik göstermekle birlikte, mevcut külliyat bu anlamın tespitinde yardımcı rol oynayabilir. Bu konuda Kelime-İfade Belirsizliği (word-sense ambiguity) konusuna bakabilirsiniz.
« Normal Şekil (Canonical Form) | Terminoloji Çıkarımı (Terminology Extraction) »
Yorumlar
Bilgisayar Kavramları üzerinde şu anda okumakta olduğunuz 'Külliyat (corpus)' isimli yazı 25 Mar 2008 tarihinde, saat: 03:52 'de Şadi Evren ŞEKER tarafından gönderilmiş, toplam 299 defa okunmuştur.
Benzer yazıları Doğal Dil İşleme (NLP) kategorilerinden okuyabilirsiniz. Yazar ile irtibat kurmak için email gönderebilirsiniz. Yazıya yorum yapabilir ya da yapılan yorumları RSS 2.0 ile takibe alabilirsiniz.
Yazarın Kitabı
Bu yazının yazarı Şadi Evren ŞEKER'in son çıkan kitabı "Programlama ve Veri Yapılarına giriş (C, C++ ve JAVA ile)" hakkında bilgi almak için Buraya tıklayabilirsiniz.
Eklenen Son Yazılar
- Visual Basic ile Gösterici (Pointer) Kullanımı
- Hasse Çizgeleri (Hasse Diagrams)
- Zeki Vekiller (Akıllı Ajanlar, Intelligent Agents, Zeki Etmenler )
- Integral Kriptoanalizi ( Toplam Tecessüsü , Integral Cryptoanalysis)
- Diferansiyel Kriptoanalizi ( Fark Tecessüsü , Differential Cryptoanalysis)
- Sierpinski Üçgeni (Sierpinski Triangle)
- C ile programlamaya giriş final sınavı çözümleri
- Çok Seviyeli Sıralar (Multi Level Queues)
- Çift Özetleme (Double Hashing)
- İkinci Dereceden Sondalama (Quadratic Probing)
Yapılan Son Yorumlar
- Şadi Evren ŞEKER: Sıralama işleminiz poligonu...
- Şadi Evren ŞEKER: bahsettiğiniz sıralama algoritması...
- Abdurrahman ulusoy: merhaba hocam. gelişigüzel...
- Oguz Okutan: Merhaba hocam.. Fonksiyonlarda degere göre...
- Şadi Evren ŞEKER: Null, NULL, nil veya null olarak...
- Fatih Kabakci: hocam merhabalar,...
- kara: Çok güzel anlatılmış gerçekten teşekkürler...
- Şadi Evren ŞEKER: Bahsettiğiniz şekil dönüşümü...
- Caner: Kullanıcıdan açı girdisi almıyorsanız...
- Furkan Yediyildiz: Algoritmanin mantigi cok güzel...
- havva: çok sağolun çok güzel açıklamalar var tşk...
- Şadi Evren ŞEKER: typedef komutu, bir yapıdan yeni bir...
- fatih kabakci: hocam ben structures ile ilgili bir sorum...
- Şadi Evren ŞEKER: evet, yukarıda açıklanan, herhangi...
- Abdurrahman ulusoy: fi açısından teta kadar döndürme...
- Şadi Evren ŞEKER: Hayır yok, bir noktanın, herhangi...
- Abdurrahman ulusoy: Bu durumda yukarıdaki formüllerin...
- Abdurrahman ulusoy: Merhaba hocam Üstteki mesajımda...
- mustafa ekmekcioğlu: merhaba şadi bey ben hacettepe...
- Şadi Evren ŞEKER: Talebiniz üzerine...
Yakın Yazılar
Bağlantılar
[...] ve pragma çıkarılmasında önemli bir alternatif niteliğindedir. Benzer bir çıkarım ise külliyat (corpus) üzerine [...]