image.jpg

Derginin Adı: Selçuk Üniversitesi Edebiyat Fakültesi Dergisi
Cilt: 2020/2
Sayı: 44
Makale Başlık: Türk ve Dünya Edebiyatından Eserlerin Doğal Dil İşlemeyle İncelenmesi
Makale Alternatif Dilde Başlık: Analysis of Literary Works from Turkish and World Literature with Natural Language Processing
Makale Eklenme Tarihi: 5.01.2021
Okunma Sayısı: 0
Makale Özeti: Yayınevleri tarafından ilkokul, ortaokul ve lise seviyesindeki öğrenciler için okuma kitapları hazırlanmaktadır. Bu çalışmada ortaokul öğrencilerine yönelik olan eserler kullanılmıştır. 5 yayınevinden aynı isimli 5 Türk ve 5 dünya edebiyatından eser, doğal dil işleme teknikleriyle Türkçe dil bilgisi kuralları çerçevesinde analiz edilmiştir. Bu çalışmayla eserlerin yazımında ve eserlerdeki Türkçe kullanımında yayınevleri arasındaki farklılık ve benzerlikleri tespit etmek, aynı zamanda Türkçenin kullanım özelliklerini ortaya koymak amaçlanmıştır. İşlemlerin gerçekleştirilmesinde geliştirilen yazılım ve Türkçe doğal dil işleme kütüphanesi Zemberek kullanılmıştır. Eserlerin analiziyle elde edilen sonuçlar 5 yayınevinde oransal olarak benzeşmektedir ve yayınevleri arasındaki farklılıklar genel anlamda düşük seviyededir. Yalnızca çözümlenemeyen kelime sayısı, eserlerin ortalama cümle sayısı, eserlerdeki ortalama kelime sayısı, cümledeki ortalama kelime sayısı ve noktalama işaretlerinin (nokta ve virgül) kullanım oranında yayınevleri arasında ayrışma görülmektedir. Tüm eserler birlikte değerlendirildiğinde cümledeki ortalama kelime sayısı 6.45, kelimedeki ortalama harf sayısı 5.97 ve kelimenin ortalama hece sayısı 2.55’tir. Eserlerde en fazla kullanılan harfler A, E ve İ; en az kullanılanlar J, F ve P’dir. Kelimeler en çok B, K ve D; en az J, I ve L harfleriyle başlamakta ve en çok N, E ve A; en az C, B ve J harfleriyle bitmektedir. En çok kullanılan hece tipi sessiz-sesli, en az kullanılan hece tipi sesli-sessiz-sessizdir. Kelimelerin çoğunluğu ünlü ve ünsüz uyumuna uymaktadır. Ayrıca kelimelerin yaklaşık yarısı isim türünde ve ek almadan kullanılmıştır. Çekim eklerinin toplam kullanım sayısı yapım eklerinin toplam kullanım sayısından fazladır. 17 noktalama işaretinden 12 tanesi eserlerde yer almaktadır. Bununla birlikte farklı yayınevleri tarafından hazırlanıp yayımlanan aynı isimli eser içeriklerinin kısmen veya bütünüyle farklılaşabildiği görülmektedir.
Alternatif Dilde Özet: There are various reading books published by many publishers for the students’ utilization. Publishers prepare these literary works separately for the stages of primary, secondary and high schools by considering the characteristics of the groups. Literary works prepared for the secondary school students were used in this study. 5 literary works from Turkish and 5 from world literature having the same title out of 5 publishers were analysed by means of NLP (Natural Language Processing) techniques within the setting of Turkish grammar rules. With this study, it is aimed to determine the differences and similarities among publishers in terms of composing literary works and Turkish use in them, at the same time, it is also aimed to reveal the distinctive characteristics of the Turkish use. Developed software and Zemberek, Turkish NLP Library, were used in the analysis processes. Results which were obtained via analyses of literary works were found out as similar in terms of proportion and the differences were at the low level in general among 5 publishers. Differences were only found out in terms of unanalysable word number, average sentence number of literary works, average word number in literary works, average word number in a sentence and the ratio of the use of punctuation marks (dot and comma). Despite the fact that the titles of the literary works are the same among publishers, these distinctions occurred as a result of the difference in terms of the contents.

PDF Formatında İndir

Download PDF