Back

ⓘ Doğal dil isleme



Doğal dil isleme
                                     

ⓘ Doğal dil isleme

Doğal Dil Isleme, yaygın olarak NLP olarak bilinen yapay zekâ ve dilbilim alt kategorisidir. Türkçe, Ingilizce, Almanca, Fransızca gibi doğal dillerin islenmesi ve kullanılması amacı ile arastırma yapan bilim dalıdır.

Gelecekte, konusma sentezleyiciler ve konusma anlama alanındaki gelismeler ve makine-insan iletisiminin gelismesi, insanın makineden beklentilerini yükseltecektir. Insanlar makinelerin kendisini anlamalarını isteyecek, karmasık kullanımı olan makineler pazar bulamayacaktır. Giderek gelisen ve insanı anlayan makinelerin daha zeki olması insanın yasam kalitesini yükselteceğinden, vazgeçilmez olması kaçınılmazdır. Zeki makine kavramı, yapay zekâ çalısmalarının hızlanmasına yol açmıstır. Geleceğin en önemli sektörlerinden biri olan yapay zekâ ile insanın iletisim kuracağı tek araç dildir.

Dil, insanoğlunun uygarlasmasını sağlamakla kalmamıs, onun zekâsının doğada daha önce görülmemis sekilde parlamasını sağlamıstır.Kültür dediğimiz insanlık birikimi, dil kullanan ve iletisim kuran insanın sosyallesme sürecinin ürünüdür.

                                     

1.1. Dilin Matematik Modeli Genisletilmis Geçis Ağları

ATN Genisletilmis Geçis Ağları Augmented Transition Network,Woods tarafından 1970 ve 1973 yılları arasında gelistirilmis bir yaklasımdır.

Genisletilmis geçis ağları GGA üç bilesenden olusur:

  • En az baslangıç ve son /s durumları olan sonlu sayıdaki durumlar kümesi,
  • Belli bir metindeki mümkün olan harflerden olusan alfabe e,
  • Sonlu sayıdaki bir durumdan diğer bir duruma geçisi sağlayacak geçisler kümesi.

Genisletilmis geçis ağlarında, bir durumdan diğer bir duruma geçmek için gerekli harf okunur ve bu harf geçilecek olan duruma geçmek için gereken harfle karsılastırılır; uygun ise diğer duruma geçilir. Geçis ağlarında doğru bir yol, bir baslangıç durumundan baslayıp, son duruma ulasan geçisler sağlandığında tamamlanır. Harflerin birbirine eklenmesiyle olusan metin, ağın kabul etmesi için verilen metin ise, bu metin ağ tarafından kabul edilmis demektir.

Yanda: "Bal" metnini kabul eden Genisletilmis Geçis Ağı.

                                     

2. Fonetik ve fonoloji

Fonetik, konusulurken, dil, gırtlak, ses telleri, damak, disler ve dudaklar ile çıkarılan sesleri ve bu seslerin dil ile olan iliskilerini tanımlamak için kullanılan bir terimdir.Doğal dillerde anlam ayırıcı olarak kullanılan en küçük ses fon dur phon dur. Fonetik terimi bu kökten gelmektedir.

Fon kavramı evrensel değildir ve her dilde farklı seslere kasılık gelir. Farklı dillerdeki fon ların tek ortak özelliği ayırıcı temel sesler olmalarıdır.Sesle ifade edilen dili, yani konusmayı kaydetmek için yazı icad edilmisti.Konusmayı yazı ile ifade etmek için ses birim veya fon ları harflerle eslestirmek gerekmekteydi. Bazı dillerde, örneğin Türkçe, Fince ve Japoncada, sesbirimler doğrudan harflere karsılık gelmektedir. Bu tip dillere fonetik diller denir.Ingilizce, Almanca, Fransızca gibi dillerde ise Fon lar harflere kasılık gelmezler.Bu yaklasımın yerine uluslararası olarak geçerliliği olan fonetik bir alfabe ses birimleri ifade etmek için kullanılır. Ses birimlerin simgesel olarak ifade edilmesi sonucu olusan simgeler fonem phoneme olarak adlandırılır. Bir baska deyisle aslında fonemlerin seslendirilmesiyle ses birimler phon olusur.

Dil deki ses birimler belirlenirken iki yaklasım kullanılır.Bunlar,

  • Parçalı sesbirimler segmental ve,
  • Parçalarüstü ses birimler supra-segmental, prosodic dir.
                                     

3. Dilin morfolojisi

Dil bilime terim olarak 1859 yılında August Schleicher tarafından kazandırılan morfoloji, dilde biçimi olusturan ögelerin türlerini tanımlamak ve özetle dil bilgisi kuralları denen biçimsel ögelerin sınıflandırmasını yapmaktır.

                                     

3.1. Dilin morfolojisi Morfolojik çözümlemede analitik yaklasımlar

Doğal dil isleme çalısmalarında anlam bütünsel çözümleme yapabilmek için, bazı yaklasımlar belirmistir. Bu yaklasımlar asağıdaki süreçlerden olusur.

                                     

3.2. Dilin morfolojisi Sözdizimsel sentaktik analiz

Sözdizimsel analiz, sözdizimini syntax veya cümleyi olusturan morfolojik ögelerin hiyerarsik kurallara uyumunu karsılastırarak ölçümlemektir. Böylece söz dizimin anlamlı olup olmadığının ölçülebilmesi için düzenleyici bir süreç gerçeklesmis olur.

Türkçede cümleler en genel sekliyle özne, nesne ve yüklem bilesenlerinden olusur. Cümleye eklenmek istenen anlamlar arttıkça cümleler, özne, yer tamlayıcısı, zarf tamlayıcısı, nesne ve yüklem gibi bilesenleri içerir.Ayrıca cümlenin anlamını kuvvetlendiren cümle dısı bilesenler de cümlede bulunabilir.Bunlara örnek olarak "ile, için, ama, çünkü" kelimeleri verilebilir. Türkçede özne ile yüklem cümlenin temel bilesenleridir ve genelde tüm cümlelerde yer alırlar. Yer tamlayıcısı, zarf tamlayıcısı, nesne gibi bilesenler bazı cümlelerde yer almayabilirler veya bazı cümlelerde sadece biri, bazılarında sadece ikisi bulunabilir. Bu bilesenlerin cümle içindeki sıralanısları da değisebilir.

Bilgisayarla doğal dilin modellenmesinde anlamsal analizden önce kelimelerden olusturulan yapının cümle olup olmadığının test edilmesi faydalıdır.Bu islem sentaktik eslestirme isleminde anlamsız eslesmelerin önlenmesine faydalı olur.

Yandaki Sekil: Sözdizimsel Analiz.

Simgeler: Ö: özne, D: dolaylı tümleç, Z: zarf tümleci, N: nesne, Y: yüklem, IG: isim grubu, SG: sıfat grubu, IN: isim nesnesi, SN: sıfat nesnesi, DZ: diğer zarflar, S: sıfat, I: isim, ZB: zaman belirteçleri, T: tamlayan, TN: tamlanan, ZM: zamir, NE: nesne eki, TE: tamlayan eki, TNE: tamlanan eki, KE: kip eki, ZE: zaman eki, DE: dolaylı tümleç eki, EF: ek fiil



                                     

4. Yapay konusma

Morfolojik çözümleme asamalarından sonra sözdizimsel kurgu veya yapay konusma süreci ile yapay zekâ ya veya uzman sistemlere iletisim becerisi kazandırılacaktır. Sözdizimsel çözümlemenin tersi süreçlerden olusan birlestirme sürecinde, önceki süreçlerde ele geçen bilgi yine morfolojik kurallar dahilinde birlestirilir.

                                     

5. Kaynakça

  • Ünal Çakıroğlu - KTU Sekiller, Sözdizimsel Analiz ve matematik model bölümü
  • Vasif Nabiyev - Yapay Zekâ: Problemler, Yöntemler, Algoritmalar, 764 say., Seçkin, Ankara, 2005
  • Devrim Çamoğlu - D.U.Y.G.U. Projesi arastırma tezleri.
                                     

6. Dıs bağlantılar

  • Survey of the State of the Art in Human Language Technology
  • ITÜ Doğal Dil Isleme Takımı
  • 2004 International Workshop on Natural Language Understanding and Cognitive Science
  • Fatih Ü. Doğal Dil Isleme Grubu
  • YTÜ Doğal Dil Isleme Arastırma Grubu
  • Cognitive Science Society of Trakya CSST
  • Natural Language Processing Group at the Johns-Hopkins University
  • CLAC: Computational Linguistics At Concordia
  • TCC: Cognitive and Communication Technologies TCC at ITC-Irst
  • Stanford Üniversitesi Doğal Dil Isleme Öbeği
  • DNLP - Dalhousie Natural Language Processing Group
Free and no ads
no need to download or install

Pino - logical board game which is based on tactics and strategy. In general this is a remix of chess, checkers and corners. The game develops imagination, concentration, teaches how to solve tasks, plan their own actions and of course to think logically. It does not matter how much pieces you have, the main thing is how they are placement!

online intellectual game →