Doğal Dil İşleme (NLP)

Reichenbach Zaman Analizi (Reichenbachian Tense Analysis)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinin çalışma alanlarından birisi olan doğal dil işleme ve bu alana bağlı olarak çalışılan soru cevaplama (question answering) konularında zaman çıkarımı ve olayların zamanlarının tespit edilmesi (tense, modal, aspect) önemli bir yer tutar. Olay zamanlarının analiz edilmesi sırasında yazılı metinlerden faydalanıldığı düşünülürse teorik olarak üç farklı zamandan bahsetmek gerekir: [...]

Şadi Evren ŞEKER tarafından, 03/05/2009 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Zamani (Temporal, Zamansal, Zamane, Mevkut)

Yazan : Şadi Evren ŞEKER Zamani kavramları açıklamak için kullanılan terimdir. Basitçe insanın zaman algısı ve bu algı üzerine kurulu olan felsefi ve yaşamsal düşünceleri geçmiş, şimdi ve gelecek üzerine kuruludur. Bu durumda zamani kavramlarda bu değerlerin etkisidine şekillendirilmektedir. Aslında din ve felsefede derin tartışmalar açmış bu konuya insanlığın var olduğu tarih boyunca hemen her [...]

Zaman Sırası (Sequence of Tenses)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinin bir çalışma konusu olan doğal dil işlemede çeşitli amaçlarla kullanılan zaman belirleme işlemleri açısından önemli bir kavramdır. Basitçe bir birleşik cümledeki ana cümlenin ve alt cümlenin zamanlarının arasındaki uyumu açıklamak için kullanılır. Örneğin Ali eve geldiğinde Ayşe uyuyordu Ali eve geldiğinde Ayşe uyumuştu Ali eve geldiğinde Ayşe uyuyacaktı [...]

Şadi Evren ŞEKER tarafından, 23/03/2009 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Uyum (Agreement, Kabul, Bağıt, Mutabakat)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinin bir çalışma alanı olan doğal dil işleme (Natural language processing) konusunda ve dolayısıyla dilbilim (linguistic) konusunda kullanılan bir kavramdır. Bu kavrama göre bir dilde aynı anlama gelen kelimelerin sayı, cinsiyet, kişi veya duruma göre farklı kelimelerle ifade edilmesidir. Örneğin Türkçede çoğul kelimelerin kullanımı bir uyum örneğidir. Kelimebilim (lexicology) [...]

Şadi Evren ŞEKER tarafından, 21/03/2009 tarihinde yazıldı. | bilgisayar felsefesi, Doğal Dil İşleme (NLP) | A yorum var

İçerikten Bağımsız Gramer (context free grammer, CFG)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, dil tasarımı sırasında kullanılan bir gramer tipidir. Basitçe bir dilin kurallarını (dilbilgisini, grammer) tanımlamak için kullanılır. Örneğin: S -> a Yukarıdaki dil tanımında bir büyük harfle gösterilen (S) bir de küçük harfle gösterilen (a) sembolleri bulunmaktadır. Bu satır, S devamlısının(nonterminal) a sonuncusuna(terminal) dönüştüğünü göstermektedir. Kısaca dildeki kuralları ifade [...]

İçerikten bağımsız dil (Context Free Language, CFL)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde bir dilin tasarımı sırasında, içerik bağımsız bir gramer ile oluşturulması durumudur. Basitçe bir aşağı sürüklemeli otomat (push down automata) tarafından kabul edilen dil çeşididir. Bazı kaynaklarda bağlamdan bağımsız dil olarak da geçmektedir. Örneğin çok meşhur L= {anbn , n>0} dilini ele alalım. Bu dil örneğinin bu kadar meşhur [...]

Kelime (Lexeme)

Yazan : Şadi Evren ŞEKER Doğal dil işlemenin (natural language processing) en önemli parçası olan ve bir dildeki en küçük anlamlı birim olan İngilizcedeki “Lexeme” kelimesi, genelde “kelime” kelimesine karşılık olarak kullanılmaktadır. Bu tam olarak yanlış olmasa da yanlış anlaşılmaya açıktır. Lexeme anlam olarak herhangi bir kelime değildir, daha çok kelimenin ifade ettiği anlamdır. Örneğin, [...]

Şadi Evren ŞEKER tarafından, 09/03/2009 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Soru Cevaplama (Question Answering, QA)

Yazan: Şadi Evren ŞEKER Doğal dil işleme (natural language processing) çalışmalarının bir parçası olan soru cevaplama çalışmalarında amaç, doğal dildeki bir soruya doğru cevap verebilmektir. Soru cevaplama çalışmalarını bir kaç farklı şekilde gruplamak mümkündür. Unutulmaması gereken, soru cevaplama çalışmalarının hedefinde insan gibi davranabilen bilgisayar programları bulunmaktadır. Yani ulaşılmak istenen noktada aynı  soruyu bir insana sorduğunuzda [...]

Kesinlik Zarfları (Katî Zarflar, Sentential Prepositions)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinin bir alt dalı olan yapay zekanın çalışma alanlarından doğal dil işleme (natural language processing) konusunda kullanılan bir dilbilim (linguistic) terimidir. Bu zarf (adverb) tipleri, cümledeki bir alt cümle ile ana cümle arasında bağlantı kurmaya yarar. Örneğin “önce, sonra, çünkü, dolayısıyla” gibi kelimeler bu gruptan sayılabilir. “Ayşe hazırlandıktan sonra [...]

Koşaç (Mafsal, Haber Edatı, Copula)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde önemli bir konu olan yapay zekanın bir alt dalı olan doğal dil işleme konusunda kullanılan bir terimdir. Basitçe bir dildeki özneyi, o dildeki zarflara veya (adverbs) veya kaziyelere (önerme, predicate) bağlamaya yarayan kelimelerdir. Copula kelimesi latincedeki bağlama (bu yüzden çiftleşme anlamında da kullanılmaktadır) anlamından gelmektedir.  Örneğin yazılım mühendisliğindeki [...]

Hazf (Eksilti, Ellipsis)

Yazan : Şadi Evren ŞEKER Sözlük anlamı olarak giderme, kaldırma manalarına gelen bu kelime bir cümlede gerekli olan bütün bilgileri bulundurmayıp bir takım bilgileri önceki ve sonraki cümlelere atfederek kaldırmaya verilen isimdir. Bilgisayar bilimlerinde, doğal dil işleme sırasında yaşanan problemlerden birisidir ve çeşitli çözüm yöntemleri geliştirilmiştir. Örneğin “Bana, işletim sistemleri dersini alan öğrencilerin listesini ver. [...]

Şadi Evren ŞEKER tarafından, 27/02/2009 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Gösterim İşlemi (Projection Operator)

Yazan : Şadi Evren ŞEKER İlişkisel cebirde (relational algebra) kullanılan işlemlerden birisidir. Basitçe bir küme üzerinden herhangi bir kolonun seçilmesi işlemini gerçekleştirir. Sembolü “Π” işaretidir ve gösterilecek olan (project) kolon ismi indis olarak yazılır. Örneğin aşağıdaki tabloya T1 ismi verelim: İsim Soyisim Yaş Melsek Şadi Evren ŞEKER 30 Bilgisayar Müh. Ali Baba 50 Tüccar Veli [...]

Parçalama Ağacı (Parse Tree)

Yazan : Şadi Evren ŞEKER Parçalam işlemi  (parsing) bilgisayar bilimlerinde çeşitli amaçlar için kullanılmaktadır. Özellikle de dil ile ilgili işlemlerin hemen hepsinde ihtiyaç duyulan bir işlemdir. Örneğin bir programlama dilinde yazılan komutların algılanması için öncelikle kelimeleirn parçalanması (parse) gerekir. Benzer şekilde dopal dil işleme (natural language processing) işlemlerinde de doğal dilde bulunan kelimelerin algılanması bir [...]

Türkçe için TimeML

Yazan: Şadi Evren ŞEKER Bu dökümanın amacı TimeML isimli zaman modelleme dilinin Türkçe için nasıl kullanılabileceğini göstermektir. TimeML İngilizce esas alınarak geliştirilmiş bir dildir ve ne yazık ki TimeML tam bir makine dili değildir bu yüzden TimeML içerisinde bir takım doğal dile ait olan özelliklerin Türkçeye tam olarak uygulanması mümkün değildir. Bu özelliklerin başında fiillerin [...]

Şadi Evren ŞEKER tarafından, 07/10/2008 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Cümle Zamanları (Tense) ve Bakış (aspect)

Yazan : Şadi Evren ŞEKER Bir cümlenin geçtiği zamanı belirten yapıdır. Genellikle fiil cümlelerinde fiilin taşıdığı zaman yapısına göre belirlenir. Örneğin “Ali uyudu” cümlesindeki “uyudu” fiili olayın geçmiş zamanda olduğunu -du eki ile belirtmektedir. Cümle zamanlarının, bakışlardan (aspect) farkı ise, bakışın olayın ne zamanı etkilediğidir. Örneğin yukarıdaki “Ali uyudu” cümlesi ile aynı zamanda olan aşağıdaki [...]

Şadi Evren ŞEKER tarafından, 16/09/2008 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Sıralama Algoritmaları (Sorting Algorithms)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde verilmiş olan bir grup sayının küçükten büyüğe (veya tersi) sıralanması işlemini yapan algoritmalara verilen isimdir. Örneğin aşağıdaki düzensiz sayıları ele alalım: 5 9 2 3 7 11 -4 6 Bu sayıların sıralanmış hali -4 2 3 5 6 7 11 olacaktır. Bu sıralama işlemini yapmanın çok farklı yolları [...]

TimeML

Yazan : Şadi Evren ŞEKER TimeML, olaylara bağlı zaman kavramlarını ve bu zamanlar ve olaylar arasındaki ilişkileri tutmak için ağırlıklı olarak James Pustejovsky tarafından 2003 yılından beri geliştirilen XML tabanlı bir işaretleme dilidir. Dilin web üzerindeki sayfasına http://www.timeml.org adresinden erişilebilir. Dilde temel olarak 3 seviye öğe bulunmaktadır bunlar: Zaman içerikli olayların saklandığı ve ağacın yapraklarını [...]

Şadi Evren ŞEKER tarafından, 15/07/2008 tarihinde yazıldı. | Bilgisayar Standartları, Doğal Dil İşleme (NLP), yapay zeka (artificial intelligence) | A yorum var

HTML+TIME

Yazan: Şadi Evren ŞEKER HTML -> Hyper Text Markup Language (Hiper metin işaretleme dili) TIME -> Timed Interactive Multimedia Extensions (Zaman etkileşimli çoklu ortam uzantıları) Microsoft, Compac/DEC ve Macromedia firmaları tarafından W3C’a gönderilen bir dil önerisidir. Dil, XML üzerine kurulu SMIL (Synchronized Multimedia Integration Language , Eş güdümlü çoklu ortam uyarlama dili) üzerine kuruludur ve [...]

Şadi Evren ŞEKER tarafından, 28/04/2008 tarihinde yazıldı. | Bilgisayar Standartları, Doğal Dil İşleme (NLP), Programlama Dilleri | A yorum var

OWL Time (OWL Zaman, Web Varlıkbilim Dili Zaman)

Yazan : Şadi Evren ŞEKER Gelişen zamanlama ihtiyaçları ile birlikte zamanın gösterimi ve formüllenmesi de bir ihtiyaç haline gelmiştir. Örneğin yapılan her siparişte, siparişin zamanının tutulması, basir bir kiralama işleminde veya bilet satış işleminde yapılan işlemin hangi tarih ve saatler için yapıldığının tutulması artık sıradan birer gereksinim haline gelmiştir. Bu amaçla doğmuş olan OWL Time [...]

TTML (Time Tabling Markup Language, Zaman Çizelgeleme İşaretleme Dili)

Yazan : Şadi Evren ŞEKER Zaman çizelge işareteleme dili (Timetabling Markup Language (TTML)), XML üzerine kurulmuştur. MathML üzerine kurulu zaman çizelgeleme problemlerinin çözümünde kullanılmaktadır. TTML üzerinde kullanılan formülleme dili küme teorisine dayandırılabilir. Örneğin MathML üzerinde kullanıcılara tamamen yeni semboller ile bu sembollerin ifade ettiği yeni fonksiyon ve formülleri tanımlama imkanı sağlanır. Bu durum MathML kullanan [...]

Hitabe (Nutuk, Söylev, Discourse)

Yazan: Şadi Evren ŞEKER Hitabe, dil bilim açısından bir konu üzerine yoğunlaşmış birden fazla cümleden meydana gelen açıklama, konuşma, diyalog ya da tartışmalara verilen isimdir. Anlambilimsel (semantic) çalışmalar açısından aynı konuya yönelmiş cümlelerin anlattığı konunun bulunması kolay hale gelmektedir. Hitabe metinlerinin analizi doğal dil işleme açısından da büyük önem taşımaktadır çünkü metinler temel olarak bir [...]

Şadi Evren ŞEKER tarafından, 25/03/2008 tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Terminoloji Çıkarımı (Terminology Extraction)

Yazan: Şadi Evren ŞEKER Terminoloji çıkarımı doğal dil işlemenin uygulama konularından birisi olan bilgi çıkarımının alt konusudur. Amaç verilen bir külliyattan (corpus) otomatik olarak terimleri ve anlamlarını çıkarmaktır. Günümüzde gelişen İnternet kaynaklarına bağlı olarak anlambilimsel ağlar (Semantic web) çalışmaları ve buna paralel olarak ağ uygulamaları (web applications),  ağ hizmetleri (web services) , ağ dolaşıcıları (web [...]

Şadi Evren ŞEKER tarafından, tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Külliyat (corpus)

Yazan: Şadi Evren ŞEKER Dil biliminde ve günümüz doğal dil işleme çalışmalarında külliyat (corpus) kelimesi ile kastedilen, çok sayıdaki metnin düzenli ve yapısal olarak bir arada bulunması durumudur. Külliyatlar, muhteviyatına göre tek dilli (tek bir dilden metinler içeren) veya çok dilli (birden fazla dilden metinler içeren) olarak sınıflandırılabilir. Külliyatların, doğal dil işlemede kullanılmasının sağladığı bir [...]

Şadi Evren ŞEKER tarafından, tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Eş Atıf (Coreference)

Yazan: Şadi Evren ŞEKER Bir isim zincirinde (birbirine atıfta bulunarak ilişkilendirilen kelime listesi) aynı kelimeye atıfta bulunan birden fazla kelimenin bulunması durumudur. Örneğin “Sen, o adamın, senin arkadaşın olduğunu söylemiştin” cümlesinde “Sen”  ve “senin” kelimleri aynı kişiye atıfta bulunmaktadır. Bu konuyla ilgili daha fazla bilgi için: Dönüştü Analizi (anaphora resolution)  Genel Ön Kelime (Generic antecedents) [...]

Şadi Evren ŞEKER tarafından, tarihinde yazıldı. | Doğal Dil İşleme (NLP) | A yorum var

Bilgi Çıkarımı (Information Extraction)

Yazan: Şadi Evren ŞEKER Bilgi çıkarımı konusu, genellikle bir metin üzerinde doğal dil işleme kullanılarak belirli kriterdeki bilgileri elde etmeyi hedefler. Bu işlem sırasında örneğin bir kalıba uygun olan verilerin çıkarılması istenebilir. Amaç çok miktardaki veriyi otomatik olarak işleyen bir yazılım üreterek insan müdahalesini asgarî seviyeye indirmektir. Bilginin çıkarılacağı ortam genellikle yazılı metinlerdir ancak bu [...]

Şadi Evren ŞEKER tarafından, 24/03/2008 tarihinde yazıldı. | bilgisayar felsefesi, Bilgisayar Kavramları, Doğal Dil İşleme (NLP), yapay zeka (artificial intelligence) | A yorum var