Yazan : Şadi Evren ŞEKER

Temel olarak bir dilde (language) tanımlı olan öğelerin (kelime, işlem, sembol yada değerlerin) anlamlı bir dizilim oluşturmasıyla ilgilenen bilimdir.

Örnekler

Örneğin Türkçe için aşağıdaki cümle anlamlı bir cümledir:

"Ali okula geldi"

yukarıdaki cümlede herhangi bir yazım hatası ve dizilim sorunu bulunmamaktadır. Bununla birlikte:

"okula Ali geldi"

cümlesi de Türkçe açısından uygun bir cümle iken

"geldi okula Ali"

cümlesi hem devrik hem de anlamını yitirmiş bir cümledir. Benzer durum matematiksel işlemler için de aşağıdaki şekilde gösterilebilir:

( 3 + 4 )

Yukarıdaki matematiksel işlem dizilim açısından sorunsuzken:

( 3 4 + )

Yukarıdaki halde de yazılabilir (postfix notation).

3 ) ( 4 +

Ancak yukarıdaki yazılış dizilim açısından hatalıdır.

Yukarıdaki örneklerde görüldüğü üzere her dilin kendisine göre bir dizilimi ve dizilime göre farklı anlamları bulunmaktadır. İşte sözdizim (syntax) bu konuda çalışmaktadır.

Anlam çıkarımı

Sözdizim çalışmalarının önemli bir kısmı da dilin işlendiği bilgisayar tarafından girilen cümleye (Statement) anlam verilmesidir.  Cümlelerin anlamlarını çalışan anlambilim (Semantics) açısından genelde cümlenin bir anlamını gösteren model bulunmakta ve anlam çıkarımında hedeflenen amaç girilen cümleyi bu modele çevirmke olmaktadır.

Bu çevirim için çeşitli yaklaşımlar mevcuttur. Örneği yacc gibi sözdizim (syntax) analizi yapan ve makine dilleri (machine languages) için başarılı bir şekilde çalışan ve yapısında içerik bağımsız dil (context free language) barındıran, kod üretme  programları bulunmaktadır. Yacc ve benzeri kod üreticilerinede (code builder) hedeflenen dil genelde CFG ile gösterilebilen bir makine dilidir ve başarı oranı oldukça yüksektir.

Buna karşılık doğal dillerin analizi ve semantik gösterimi (semantic representation) için tam başarı ne yazık ki neredeyse imkansızdır.  Ayrıca doğal dilin analizi sonucunda elde edilen sonucun gösteriminde de ciddi problemler bulunmaktadır.

Cümle üretimi (Syntax Generation)

Anlam çıkarımına benzer şekilde, ifade edilmek istenen anlamın üretilmesi de bir problemdir. Örneğin 4 sayısını toplama işlemi ve pozitif tamsayılar kümesi ile göstermek istersek:

1+3
2+2
3+1

gösterilmerinin tamamı üretmek istediğimiz değer olabilir. Benzer şekilde doğal dil üretimi (natural language generation) yukarıdaki örneğe göre oldukça karmaşık bir üretim yapısını desteklemek zorundadır. (Yukarıdaki örnekte yaşanan karmaşıklık (ambiguity) çözümü için belirli sonlu otomat (deterministic finite automata) kullanılabilir, burada sadece probleme örnek verilmiştir)

Örneğin Ali’nin okula gelmesinden, ders dinlemesinden ve eve dönmesinden bahsetmek isteyelim. Muhtemel bir bilgisayar çıktısı:

Ali okula geldi. Ali ders dinledi. Ali eve döndü.

Şeklinde olabilir. Ancak dikkat edileceği üzere insanlar konuşurken bu tip cümleler sıralamazlar. Örneğin

Ali okula geldi. O ders dinledi. O eve döndü.

Şeklindeki cümleler daha insana yakındır. (dönüştü (anaphora resolution) kullanılmıştır)

Benzer şekilde:

Ali okula geldi, ders dinledi ve eve döndü.

Cümlesi insan kullanımına çok daha yakındır (ellipsis (hazf) kullanılmıştır)

Yukarıda görüldüğü üzere doğal dil üretimi sırasında da söz dizimden faydalanılmaktadır.

Şablon Yapısı (templates)

Bu sözdizim çalışması yaklaşımına göre dilde bulunan cümlelerin anlamlarının anlaşılması (veya bu dilde bir cümle üretimi) için çeşitli şablonlar kullanılır. Bir söz dizim çalışmasının en temelini oluşturan şablon kullanımı (çeşitli kaynaklarda çerçeve (Frame) olarak da isimlendirilmektedir). Oldukça katı(rigid) bir yapıya sahiptir. Anlamak için şablona mutlak uyum şarttır. Ürettiği sonuçlar ise ancak şablon yapısında olmaktadır.

Kategorik Dilbilgisi (Categorical Grammer)

Sözdizim çalışmalarında dilin modellenmesi sırasında kullanılan bir dilbilgisi örneğdir. Bu yapıda dilde bulunan öğeler anlamsal olarak gruplanır ve modellenir. Örneğin “bahçeli okul” şeklindeki bir tamlamada aslında iki farklı kelime vardır. Kategorik dilbilgisinde bu iki kelimenin oluşturduğu gruba dilbilgisindeki bir kategori ismi verilir.

Genelde çok sık kullanılan kategoriler NP ve VP olarak da geçen isim kelime grubu (noun phrase) ve fiil kelime grubudur. (verb phrase)

Bağlılık Dilbilgisi (Dependency Grammer)

Dilbilgisindeki kelime veya kelime gruplarının tanımlanması ve sıralarının belirlenmesine ilave olarak şayet bu kategoriler arasında bir bağlantı tanımı yapılıyorsa bu dilbilgisi çeşidine bağlılık dilbilgisi ismi verilir.

Basitçe bir öznenin, bir fiilin faili (agent) olması durumu bu grup gramer tanımındandır.

Örneğin cebirsel sözdizimler (algebraic syntax) bu gruptan sayılabilir.

Fonksiyonel Dilbilgisi (Functionalist Grammer)

Bu dilbilgisi grubunda ise dilde bulunan kelimelerin ve kelime gruplarının kullanım amaçları ve üstlendikleri görevler değerlendirilir.

Örneğin “At, tay doğurdu” cümlesindeki doğurmak fiili üretken bir fiildir ve modellenen dünyaya yeni bir varlık ekler. Buna karşılık “Ali peynir yedi” fiili tüketken bir fiildir ve modellenen dünyadan bir varlık eksilir. Bu durumda iki fiili iki ayrı grupta ele almak mümkündür.

Stokastik Dizilimler (Stochastic Grammers)

İstatistiksel dilbilimin (Probabilistic Linguistic) çalışma alanı olan bu sözdizim çeşidinde çeşitli olasılık ağları (örneğin markof modelleri (markov chain) ) vasıtasıyla dizilim modellemesi yapılır.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir