Bülent Özkan Derlem Bilbilim Kitap Bölümü

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 58

D LB L M

Teorik ve Uygulamalı Alanlar


"Kitaptaki yazıların her türlü hukuki ve bilimsel
sorumlulu u ilgili bölüm yazarlarına aittir."
D LB L M
Teorik ve Uygulamalı Alanlar

Editör
Prof. Dr. Erdo an BOZ

Derlemdilbilim Prof. Dr. Bülent ÖZKAN


Edimbilim Prof. Dr. Engin YILMAZ
Metindilbilim Prof. Dr. Ahmet AKÇATA
Toplumdilbilim Doç. Dr. Gülcan ÇOLAK
Anlambilim Doç. Dr. Talat D NAR
Sesbilim Dr. Gönül ERDEM NAS
Biçimbilim Dr. Duygu KAMACI GENCER
Sözdizimi Dr. Bayram ÇET NKAYA
Sözcükbilim Dr. Yasemin ÇÜRÜK
Sözlükbilim Dr. Ferdi BOZKURT
Terminoloji Dr. Nilay G R EN
D LB L M
Teorik ve Uygulamalı Alanlar

Editör
Prof. Dr. Erdo an BOZ
“En yi
Akademi, Bir © Gazi Kitabevi Tic. Ltd. ti.
Kitaplıktır.” Bu kitabın Türkiye’deki her türlü yayın hakkı Gazi Kitabevi Tic. Ltd. ti’ne aittir,
tüm hakları saklıdır. Kitabın tamamı veya bir kısmı 5846 sayılı yasanın
hükümlerine göre, kitabı yayınlayan firmanın ve yazarlarının önceden izni
olmadan elektronik, mekanik, fotokopi ya da herhangi bir kayıt sistemiyle
ço altılamaz, yayınlanamaz, depolanamaz.

ISBN 978-975-
Baskı Ekim, Ankara, 2020

Dizgi/Mizanpaj Gazi Kitabevi


Kapak Tasarım Gazi Kitabevi

Gazi Kitabevi Tic. Ltd. ti.


Yayıncı Sertifika No: 44884

Bahçelievler Mah. 53. Sok. No: 29 Çankaya/ANKARA


0.312 223 77 73 - 0.312 223 77 17
Merkez

0.312 215 14 50
www.gazikitabevi.com.tr
info@gazikitabevi.com.tr

Dögol Cad. No: 49/B Be evler/ANKARA


Ma aza

0.312 213 32 82 - 0.312 213 56 37


0.312 213 91 83

gazikitabevi
Sosyal Medya

gazikitabevi

gazikitabevi

Vadi Grafik Tasarım Reklam Ltd. ti.


Matbaa Sertifika No: 47479

vedik Organize Sanayi Bölgesi 1420. Cadde


Matbaa

No: 58/1 Yenimahalle / ANKARA


0.312 395 85 71
ÖNSÖZ
Disiplinler arası çalı maların giderek arttı ı ve dilbilgisi
ara tırmalarında dilbilim alanının çok önemsendi i bir zamanda
böyle bir kitabın hazırlanmasına cidden ihtiyaç vardı. Biz bu
gayeyle yola çıktık ve yakla ık bir yıl kadar süren bir hazırlık
döneminden sonra kitabı tamamlayabildik.
Kitap, dilbilimin temel alanları olarak kabul edebilece imiz
toplam on bir bölümden olu uyor. Bu bölümler; derlemdilbilim,
edimbilim, metindilbilim, toplumdilbilim, anlambilim, sesbilim,
biçimbilim, sözdizimi, sözcükbilim, sözlükbilim ve terminoloji’dir.
Bölümlerin seçiminde gerek teorik ve gerekse uygulamalı dilbilim
alanlarından kitabın hedef kitlesi için en gerekli olanlar dikkate
alınmı tır. Elbette bu alanların sayısını artırmak mümkündü ancak
zaman ve fiziki ko ullar imdilik bu kadarına müsaade etti. Tabii
ki kitabın sonraki baskılarında okur isteklerine göre yeni bölümler
eklenebilir.
Kitabın hedef kitlesi, ba ta dil ve edebiyat bölümleri olmak
üzere dilbilim ve di er ilgili bölümlerin lisans ve lisansüstü
ö rencileridir. Bununla birlikte bu alanlarda çalı an veya bu
alanlara ilgi duyan akademisyenler ve di er okurlardır. te tam bu
noktada belirtmek gerekiyor ki kitabın yalnızca bölüm
ba lıklarının seçiminde de il bölüm içeriklerinin planlanmasında
da hedef kitlenin ihtiyaçları göz önünde bulundurulmu tur.
Bu kitap alı ık oldu umuz türden bir genel dilbilim kitabı
olarak hazırlanmadı. Dilbilimin tarihçesi ve genel dilbilime giri
gibi bölümler yazdırılmadı. Bu tür bilgilerin elde edilmesi benzer
ba lıktaki di er kitaplara bırakıldı ve bütün a ırlık bölümlere
verildi. Ancak her eye ra men okurların talep etmeleri hâlinde adı
geçen bölümler sonraki baskılarda ilave edilebilir.
Bilindi i üzere konuların tespit edilip yazarların belirlenmesi
a amaları görece kolaydır. Asıl zorluk bölümlerin belli bir zaman
Önsöz

aralı ında ve belli bir düzende hazırlanmasıdır. Editörlük


a amasında yazarların terim, tanım ve tasnif tercihlerine müdahale
edilmemi tir. Yazarlara belli bir sayfa aralı ı önerilmi ancak hem
konuya hem de yazarın anlatım tarzına ba lı geni lemelerde
esneklik gösterilmi tir. Bu nedenle kimi bölümler di erlerine göre
daha uzun olmu tur.
Böylesi geni bir yazar kadrosuyla çalı ırken kimi hataların,
eksikliklerin ve hatta tekrarların olması kaçınılmazdır. Okurlardan
iste imiz yapıcı ele tirilerini yazar ve/veya editöre bildirmeleridir.
Kitabın bilim dünyasına umdu umuz faydayı sa laması en büyük
temennimizdir.
Dilbilim (Teorik ve Uygulamalı Alanlar) kitabının
hazırlanmasında eme i geçen de erli yazarlara çok te ekkür
ediyorum. Özellikle Gazi Kitabevi’nin fedakâr çalı anlarına
te ekkür etmeyi bir borç bilirim.

Erdo an BOZ
Ekim-2020, Eski ehir
Prof. Dr. Bülent ÖZKAN
2000 yılında Lisans e itimini Çukurova Üniversitesi Fen
Edebiyat Fakültesi Türk Dili ve Edebiyatı Bölümünde tamamlayan
Özkan, aynı üniversitenin Sosyal Bilimler Enstitüsü Türk Dili ve
Edebiyatı Yeni Türk Dili Anabilim Dalı’ndan 2003 yılında yüksek
lisans, 2007 yılında doktora derecesi almı tır. 2000-2007 yılları
arasında Milli E itim Bakanlı ı’na ba lı okullarda Türkçe
ö retmeni olarak görev yapan Özkan, 2007-2010 yılları arasında
Çukurova Üniversitesi E itim Fakültesi Türkçe E itimi
Bölümünde Ö retim Görevlisi Doktor olarak görev yapmı , 2010
yılında Mersin Üniversitesi E itim Fakültesi Türkçe E itimi
Bölümünde Yardımcı Doçent Doktor olarak göreve ba lamı tır.
2014 yılında Türkçe E itimi alanında Doçent ve 2020 yılında
Profesör unvanı alan Özkan, halen Mersin Üniversitesi E itim
Fakültesi Türkçe E itimi Bölümünde bu görevini sürdürmektedir.
Özkan’ın ba lıca çalı ma konuları Türkçe ö retimi, derlem dilbilim
ve sözlükbilimdir.
Ç NDEK LER
Derlem Dilbilim............................................................................. 1
Prof. Dr. Bülent ÖZKAN

Edim Bilimi ................................................................................. 51


Prof. Dr. Engin YILMAZ

Metin Dilbilim ............................................................................. 85


Prof. Dr. Ahmet AKÇATA

Toplumdilbilimi ........................................................................ 141


Doç. Dr. Gülcan ÇOLAK

Anlambilim ................................................................................ 199


Doç. Dr. Talat D NAR

Sesbilim ...................................................................................... 231


Dr. Gönül ERDEM NAS

Biçimbilim ................................................................................. 265


Dr. Duygu KAMACI GENCER

Sözdizimi ................................................................................... 295


Dr. Bayram ÇET NKAYA

Sözcükbilim ............................................................................... 353


Dr. Yasemin ÇÜRÜK

Sözlükbilim ................................................................................ 385


Dr. Ferdi BOZKURT

Terminoloji ................................................................................ 417


Dr. Nilay G R EN
DERLEM D LB L M
-Kendi Kendine Derlem Platformu Olu turma
Ba lamında-

Prof. Dr. Bülent ÖZKAN

1. Derlem Nedir?
Derlem, (corpus) dilbilimde bir dili belirgin dilbilimsel
kriterlere göre örneklemek amaçlı olarak o dile ait yazılı ve sözlü
metinlerden seçilerek belirli standartlara göre düzenlemi metin
parçalarının bütünü (McEnery vd., 2006) olarak tanımlanabilir.
Do al Dil leme (DD ) olarak da adlandırılan bilgisayarlı
dilbilim, derlem adı verilen bu dil örnekçeleri temel alarak,
uygulamalı dilbilimin (applied linguistics) paralelinde, ba ta sözlük
bilim olmak üzere dilbilgisi, a ız, çeviri bilim, tarihsel dilbilgisi ve
dilsel de i im, dil ö renimi ve ö retimi, anlambilim,
kullanımbilim, toplum dilbilim, söylem çözümlemesi, biçembilim ve
yazınbilim çalı malarında yo unlukla kullanmaktadır (McEnery
vd. 2006: 80-122; Kennedy 1998: 208-310).
Derlemler farklı amaçlar için olu turulabilir. Alanyazında söz
konusu bu farklı amaçlılıkları kar ılayan derlemlerin varlı ını
görebilmekteyiz. çlemleriyle ve amaçlılıklarıyla ko ut olarak
alanyazında yazılı ve/ya sözlü içeri e sahip ve belirli bir dilde
dilsel çe itlili i yansıtabilen genel derlemler (general corpora);
‘petrokimya derlemi’ ya da ‘bilgisayar bilimleri derlemi’ benzeri

Bu çalı ma, “Türkçe için ‘Kendi Kendine Derlem’ Platformu Olu turma”
ba lıklı ve TÜB TAK - 1005 - Ulusal Yeni Fikirler ve Ürünler Ara tırma
Destek Programı kapsamında desteklenmi olan ulusal ara tırma projesinin
sonuç raporuna dayanmaktadır. Katkıları için TÜB TAK’a te ekkür ederim.
Mersin Üniversitesi, (ozkanbulent@gmail.com), ORCID: 0000-0002-4319-
7582
Derlem Dilbilim

özel alan derlemleri (specialized corpora); belirli bir yazı dilini,


belirli dönem ve örneklem içeren yazılı derlemler (written
corpora); genel derlemlerin içleminde ya da ba ımsız olarak sözlü
dili temsil için tasarımlanan sözlü derlemler (spoken corpora); e
süremli olarak dilsel veriler içeren e süremli derlemler
(synchronic corpora); belirli bir dilin farklı zaman aralıklarıyla
içlemlendi i art süremli derlemler (diachronic veya historical
corpora); yine ana dili ve yabancı dil olarak belirli bir dilin
ö retiminde temel verilerin derlenmesi amaçlı tasarımlanan
ö renici derlemleri (learner corpora) ve di er derlem türlerinden
daha hacimli ve ayrıntılandırılmı , kapsamlı derlemlerden olan
izlem derlemleri (monitor corpora) ile kar ıla ırız (McEnery vd.
2006: 59-70).
Bir derlem için gerekli ölçütlerin ba ında ise olu turuldu u
dili örnekleyebilmesi (sampling) ve o dili temsil gücü
(representativeness) gelir. Bunun yanı sıra belirli bir sınıra (finite
size) sahip olması ya da olmaması (dynamic size), bilgisayarlarca
okunabilir (machine-readable) bir yapıda hedef dili betimlemede
ölçünlü bir ba vuru kayna ı (standart reference) niteli i ta ıması
bir derlemin olu turulmasında önemli ölçütlerdendir (McEnery ve
Wilson 2004).
Bugün dilin do al ortamlarından yazılı ve sözlü olarak
derlenen verilerle kendine özgü kuram ve uygulamalarla ortaya
koyulan derlemler, özellikle sezgisel örnekçelerden ve ikincil
verilerden yalıtılmı ‘gerçek zamanlı’ dilsel verileri içermesi
bakımından alana büyük katkılar sa lamaktadır (Özkan 2010). Bu
anlamda uygulamalı dilbilimin yukarıda bir kısmı sıralanan alt
dallarında ara tırmacıların yürüttükleri derleme dayılı çalı malar
günümüzde oldukça yaygınla mı tır.

Derlem Araçları/Yazılımları ve Derlem Dilbilim


Uygulamaları
Bilindi i üzere Batı dilleri için geli tirilmi olan metin
i leme/derlem yazılımları standart birtakım veri i leme
özellikleriyle alanyazında kullanılmaktadır. Türkçe için de kısmen
Bülent ÖZKAN

kullanılabilen söz konusu yazılımların bir kısmı Türkçe karakter


deste i sunabilmektedir. Ara tırma sorularına ba lı olarak söz
konusu yazılımlar i lenen verilerin, ortaya çıkan raporların
saklanamaması ve amaca uygun olarak düzenlenememesi gibi
dezavantajlarına kar ın küçük çaplı dil/dilbilim ara tırmalarında
etkin olarak kullanılabilmektedir. AntConc, WordSmith Tools,
MonoConc Pro, TextStat, Nooj, Cocordence benzeri sık kullanılan
paket yazılımlar sıklık, ba ımlı dizin, anahtar sözcük gösterimi, n-
gram hesaplama, e dizimlilik hesaplama gibi geli tirildikleri diller
için çıktılar verebilmektedir. Yukarıda sıralanan metin
i leme/derlem yazılımlarının da bulundu u https://www.
lextutor.ca/ adresi bu anlamda ara tırmacılara fikir verebilir.
Derlem olu turma çalı malarının Türkçe için hiç yapılmamı
oldu u söylenemez. Ancak bu çalı malar dilin genel ve/ya özel
niteli ini ortaya koymak adına daha da geni letilmesi ve
geli tirilmesi gereken çalı malardır.
Batıda benzer örnekleriyle sıklıkla kar ıla tı ımız derlem
çalı malarına ko ut olarak Türkçe’ye göz attı ımızda 50 milyon
sözcüklük, 1990-2008 dönemini içeren, %95 yazılı, %5 sözlü dil
verisinden olu an; sözcük türü etiketlemesi yapılmı ; ba lam
içinde anahtar sözcük gösterebilen ve istatistiksel bilgi sunabilen
Türkçe Ulusal Derlemi (http://tudd.org.tr/index.php) ile
kar ıla ırız.
Literatürde Türkçe üzerine yapılmı ba kaca derlem
çalı maları da mevcuttur. “Türkiye Türkçesinde Belirteçlerin
Fiillerle Birliktelik Kullanımları ve E dizimlili i” (Özkan 2007),
“Türkiye Türkçesi Söz Varlı ında Sıfatların E dizimlili i -Derlem
Tabanlı Bir Uygulama-” (Özkan 2009), “Türkiye Türkçesi
Sözvarlı ında Fiillerin Derlem Denetimi ve Derlem Tabanlı
Sözlü ü” (Özkan 2011), “Türkiye Türkçesinin E dizim Sözlü ü”
(Özkan 2012) ba lıklarını ta ıyan ve TÜB TAK tarafından
desteklenip tamamlanan derleme dayalı çalı malar arasında
sayılabilir. Bu çalı malara "Türk Çocuk Yazını Derlemi ve Türk
Çocuk Yazını Üzerine leri Uygulamalar" (Özkan 2015), “Türkiye
Türkçesinde Fiilimsiler” (Özkan 2016) ve “Gerçek Ya am Temelli
Derlem Dilbilim

Okul Sözlü ü Uygulamaları” (Özkan 2020) ba lıklı derlem tabanlı


çalı maları da eklemek mümkün. (http://turkcederlem.mersin.
edu.tr/) (Ayrıca bk. Özkan vd. 2014)
Öte yandan, derlem dilbilim alanında Batı literatüründe
onlarca bilimsel çalı mada özellikle altı çizilen nokta derlemlerin
ara tırma sorularına göre ekillenen ara tırma evrenleri oldukları
yönündedir (Graeme 1998; McEnery T. vd. 2006; Sinclair 1991;
McEnery ve Wilson 1996; Barnbrook 1996).
Alan uzmanları derlem ara tırmalarının ya var olan derlemler
üzerinden ya da amaca uygun olarak bir araya getirilen
metinlerden derlem olu turularak genellikle sözcük sıklı ı
belirleme, ba ımlı dizin olu turma gibi basit-standart derlem
çıktılarına ula ılabilece i konusunda birtakım bilgiler vermekte ve
söz konusu çıktıların alınabilece i paket yazımılar ya da web
uygulamaları önermektedir (Sinclair 1991; Stevens 1995; Todd
2001).
Bugün derlem olu turma çalı malarında açık kaynak kodlu
yazılımlar, metin i leme/derlem olu turma yazılımları ve web
tabanlı uygulamalar yaygın olarak kullanılmaktadır. Söz konusu
yazılımlar php, perl, java, python, C vb. programlama dilleri
kullanılarak olu turulabilmektedir. Ancak söz konusu program
kullanıcı için programlama bilgisi gerektirmektedir.
Bilindi i üzere batı dilleri için geli tirilmi olan metin
i leme/derlem yazılımları o dillere özgü standart birtakım veri
i leme özelliklerine sahiptir. Türkçe için kısmen kullanılabilen söz
konusu yazılımlar, Türkçe karakter deste i sunabilmelerine kar ın
bu yazılımların en büyük eksikli i, olu turuldukları diller de dahil
olmak üzere, ara tırma sorularına ba lı olarak i lenen verilerin,
ortaya çıkan raporların saklanamaması ve amaca uygun olarak
düzenlenememesidir. Bu yazılımların belirli alanlarda özelle mi
olmaları da söz konusu yazılımların eksiklikleri olarak
de erlendirilebilir. Örne in, farklı i letim sistemleri için yazılmı
olsalar da AntConc, WordSmith Tools, MonoConc Pro, TextStat,
Nooj benzeri sık kullanılan paket yazılımlar sıklık, ba ımlı dizin,
anahtar sözcük gösterimi, n-gram hesaplama, e dizimlilik
Bülent ÖZKAN

hesaplama gibi geli tirildikleri diller için çıktılar verebilmektedir.


Kısmen de olsa bu çıktılar metin belgeleri olarak dı a
aktarılabilmektedir. Bu anlamda dı a aktarılan veriler metinlerden
indirgenmi metin yı ınları elde etmenin ötesinde bir fayda
sa lamamaktadır.

Bir Derlem Yazılım Kümesi Olarak “Kendi Kendine


Derlem Platformu” (KKDP)
KKDP, derlem dilbilimin yöntemsel yakla ımlarına ko ut
olarak kullanıcının ihtiyaçlarını en üst seviyede kar ılayabilecek,
do rudan Türkçenin kendine özgü yapısının ara tırma sorularına
göre biçimlendirilebilen bir platformdur. KKDP, Türkçe üzerine
çalı an dil/dilbilim ara tırmacıları için ara tırmacıların ara tırma
sorularına ba lı olarak biçimlendirilebilen, ara tırmacıya özel,
esnek, kolay ula ılabilir, veri tabanı destekli ve bu çerçevede
ara tırma sonuçlarının sa lıklı bir ekilde raporlanabildi i bir
derlem platformudur.
Türkçe, yapısı gere i eklemeli bir dil özelli ine sahiptir ve söz
dizimi kuralları di er dillerden farklıdır. Bu durum söz konusu
paket metin i leme/derlem yazılımlarında Türkçeyi i lemede
zorluklar yaratmaktadır. Özellikle Türkçe için morfolojik
çözümleme araçları söz konusu bu paket yazılımlarda
çalı mamakta ya da kısmen çalı maktadır.
Bu çalı ma söz konusu KKDP üzerinden bir derlemin nasıl
olu turulup ne gibi dil/dilbilimsel ara tırmalar yapılabilece ini
ara tırmacılara göstermeyi amaçlamaktadır. Bu anlamda ba langıç
noktası olarak genelde tüm derlemler için geçerli olan temel
kavramların tanıtımıyla konuya ba lamak yerinde olacaktır.

Temel Kavramlar1
i. Tabaka: Derlemlerde ara tırma sorularına göre
biçimlendirilebilen benzer nitelikli metinlerin dili örneklemek ve
dili temsil gücü gibi niteliklere ba lı kalınarak olu turulan ana

1
Tanımlar, Malmkjaer 2001 ve Baker vd. 2006'dan özetlenerek alınmı tır.
Derlem Dilbilim

metin yı ını. Örne in yazın türleri ayrı bir tabaka olu turabilece i
gibi internet metinleri ya da herhangi bir ana tabakaya girmeyen
çe itli türler (bilimsel yazılar vb.) ba kaca tabakalar olarak
derlemlerde yer alabilir.
ii. Metadata: Derleme alımlanan her bir metin için
“üstveri” olarak da adlandırılan metin adı, yazar adı,
yayın yılı, ilk yayın tarihi, son basım tarihi, yazarın
cinsiyeti, metin cümle sayısı, farklı ve aynı cümle sayısı
vb. metin nitelikleri. (Burnard 2004).
iii. aretleme (annotation): Sözcük türü, cümle ve di er
nitelikler açısından derlemde yer alan her bir birimin
etiketlemesi.
iv. Etiketleme (tagging): Derlemde yer alan birimleri
belirli nitelikleri açısından i aretleme. Örne in, sözcük
türü, tümce yapısı vb. etiketleme gibi.
v. Sözbirimle tirme (lemmatizing/lemmatization):
Derlemde yer alan her bir sözcükbirimi belirleme.
vi. Tekille tirilme (deduplication): Derlemde yer alan her
bir birimi tek bir birime indirgeme.
vii. Biçimbirimsel/özniteliksel çözümleme (morphological
analysis): Derlemde yer alan her bir birimi
biçimbirimsel olarak çözümleme.
viii. Sıklık analizi (frequency analysis): Derlemde yer alan
her bir birimin derlemde geçme sayısını belirleme.
ix. Tümce bölümleme (sentencer/parser/parsing):
Derlemde yer alan metin kayıtlarını tümcelere
ayrı tırma.
x. n-gram hesaplama: Temelde bir dizide yer alan ses,
hece veya sözcü ü önceleyen ya da takip eden/edecek
olan dizi elemanını bulmaya ya da onu kestirmeye
dayanan n-gram modeli söz konusu yapıların
çıkarımında kullanılan yaygın bir yöntemdir. (Jurafsky
2006). n-gramlar [...n-3, n-2, n-1 || n+1, n+2, n+3...
Bülent ÖZKAN

(bigram, trigram...)] e dizimli yapıların çıkarımına


öncülük eden birliktelik kullanımlarının listelenebilmesi
olana ını sunar.
xi. E dizimlilik hesaplama: “Sözcükbirimlerin anlamsal ya
da dilbilimsel birlikteliklerinden kaynaklanan ve
kullanım sıklı ına ba lı olarak sözlükbirimsel özellik
ta ıyabilen söz birlikleri.” (Sterkenburg 2003:119-120)
ve “Sözdizimsel olarak anlamsal sözcük birliktelikleri”
(Malmkjaer 2001; Hartmann 1998:22-23; Baker vd.
2006). Söz konusu anlamsal birliktelikler çe itli
istatistiksel yöntemlerle hesaplanabildi i (mutual
information, t-test, z test, chi-squared test, likelihood
ratio) gibi sözcükbirimsel birliktelikler de derlem
üzerinden çıkarımlanabilmektedir.
xii. Sözlükbilimsel etiketleme: Sözcükbirimlerle ilgili
sözlükbirimsel yapılandırmalar: yazımsallık (spelling),
sesletim (pronunciation), çekimlenme biçimleri
(inflections), sözcük türü (word class), anlam/lar
(senses), tanımlama (definition), tanıklama (examples),
kullanım (usage), di er türetimler (run-ons), köken
bilgisi (etymology) gibi ara tırma sorularına göre
derlemlerde etiketlenebilen yapılandırmalardır (Jackson
2002:26-27; Hanks 2003:56-57).
xiii. Anlambirimsel etiketleme: Anlambilimsel niteliklerin
etiketlenebildi i esnek yazılım arayüzü.
xiv. Sözcükbirimsel etiketleme: Sözcük türleri ve
morfolojilerini etiketleme.
xv. Söz dizimsel etiketleme: Derlem arayüzleriyle tümce
niteliklerini etiketleme.
xvi. Serbest sorgu (query): Derlemlerde standart olarak yer
alan sorgulama arayüzü.
xvii. Çoklu sorgu (multiple query): Sorgu sonuçları
üzerinden de arama yapılabilen arayüz.
Derlem Dilbilim

xviii. Sorgu geçmi i (query history): Önceki derlem


sorgularına kolayca ula ılabilmesini sa layan sorgu
geçmi ini belle i.
xix. Dur listesi (stop list): Sadece seçilmi belirli
sözcükbirimlerin sorgulanmasına olanak veren
sorgulama arayüzü.
xx. Ba ımlı dizin (concordance): Sorgu sonucunda ilgili dil
birimini ba lam içinde gösteren arayüz.
xxi. Raporlama: Derlemde etiketlenmi -i aretlenmi her bir
birimi çe itli rapolama arayüzleriyle (grafik, harita, liste
vb.) çıktı olarak almak.
Yukarıda yapılan tanımları do rultusunda Kendi Kendine
Derlem Platformu amaca uygun ve ara tırma sorularına ba lı
olarak a a ıdaki gibi bir derlem prosedürüne sahiptir:

ekil 1. KKDP Veri leme Algoritması


Bülent ÖZKAN

Tablo 1’de ekil 1’de yer alan i lemlerin açıklamaları yer


almaktadır.
Tablo 1. KKDP i lem tanımları ve açıklamalar
LEM BASAMAKLARI ve TANIMLARI
1. LEM BASAMA I
Derlem olu turacak ara tırmacı derlemde yer alacak tabakaları
belirleyebilmekte ve bunlarla ilgili metadataların giri lerini esnek alan
tanılama arayüzüyle olu turabilmektedir.
2. LEM BASAMA I
Aynı esnek alan tanılama i lemini giri i yapılacak/yapılan metinler
için de benzer ama metinlere özgü faklı esnek bir arayüzle
olu turabilmektedir.
3. LEM BASAMA I
Tüm derlemler için ortak çıktılardan olan birtakım özellikler
(sözbirimle tirme, biçimbirimsel çözümleme, sıklık belirleme, tümce
bölümleme, n-gram belirleme ve e dizimlilik hesaplama gibi) metin
giri lerinin ardından otomatik olarak sistem tarafından yapılabilmekte
ve veri tabanı kayıtları olu turulabilmektedir.
4. LEM BASAMA I
Bu a amada, yine sisteme kayıtlı olan ve 1. ve 2. ve 3. a amada veri
kayıtları tutulan yapılarla ilgili ara tırmacının ara tırma sorularına ba lı
olarak biçimlendirilebilen esnek bir etiketleme-i aretleme arayüzü
kullanılmakta ve derlem üzerinde veri etiketleme-i aretlemeler
ara tırmacının olu turdu u esnek etiketlere ba lı olarak ara tırmacıya
özel bir veri tabanında tutulabilmekte ve raporlanabilmektedir.
MODÜLÜ

STANDART
ET KET
ESNEK

ARA TIRMA RAPORLAR


ESNEK ET KETLER
ALANI DAN
ALINANLAR
Ara tırma sorularına
Sözbirimle tir
göre: yazımsallık,
SÖZLÜK B L M

me
sesletim, çekimlenme
Biçimbirimsel
MODÜLÜ

biçimleri, sözcük türü,


SÖZLÜK Çözümleme
anlam/lar, tanımlama,
BLM Bölümlenmi
tanıklama, kullanım,
Tümceler
di er türetimler, köken
Sıklık bilgisi vb. yapılar
Belirleme etiketlenebilmektedir.
Derlem Dilbilim

Ara tırma sorularına

ANLAM B L M
ba lı olarak Genel
Sözbirimle tir

MODÜLÜ
Anlambilim, Sözcük
ANLAM me
Anlambilimi, Tümce
BLM Bölümlenmi
Anlambilimi'ne ait
Tümceler
etiketler vb.
belirlenebilmektedir
Sözbirimle tir

SÖZCÜK B L M MODÜLÜ
me
Biçimbirim
Çözümlemesi
Bölümlenmi Sözcük türleri, sözcük
SÖZCÜK Tümceler grupları ve türleri,
BLM Sıklık e dizimli yapılar
Belirleme etiketlenebilmektedir.
n-gram
Hesaplama
E dizimlilik
Hesaplama
Ara tırma sorularına
SÖZ D Z M
MODÜLÜ

göre biçimlendirilebilen
Bölümlenmi
SÖZ D Z M söz dizimsel öge
Tümceler
etiketleri
olu turulabilmektedir.
Biçimbirimsel
çözümlemelerde var
olan i aretleyiciler
B Ç MB L M

üzerinden yapılan
Sözbirimle tir
MODÜLÜ

sorgulara ait etiketler


me
B Ç MB L M olu turulabilmektedir.
Biçimbirim
(do rayın |
Çözümlemesi
do ra+Verb+Pos+Imp+
A2pl) yapısından
sorgular
geli tirilebilmektedir.
... ... ...
....

Örne in bir sözlük bilim ara tırmasında olu turulan derlemden alınan
standart raporlardan bölümlenmi tümceler, sözbirimle tirmeler,
biçimbirimsel çözümlemeler ve belirlenmi sıklıklar ara tırma sorularına
uygun olarak ara tırmacı tarafından sistemde tanımlanan yazımsallık,
sesletim, çekimlenme biçimleri, sözcük türü, anlam/lar), tanımlama,
tanıklama, kullanım, di er türetimler, köken bilgisi vb. esnek etiketlerle söz
konusu sözbirimler tanık tümcelerle aracılı ıyla sistem üzerinden
i lenebilecek ve raporlanabilmektedir.
Bülent ÖZKAN

5. LEM BASAMA I
KKDP'de 5. i lem basama ı serbest sorgu olana ı sunabildi i gibi
raporların çıktıları 4. i lem basama ında belirlenen etiketlenmi -
i aretlenmi veriler üzerinden grafik, liste ve XML, word, txt, pdf
benzeri formatlarda dı a aktarılabilmektedir. Dı a aktarılabilen sorgu
sonuçları ara tırma sorularına göre belirlenen ve ara tırmacının
belirledi i veri tabanı kayıtlarıdır. Bu çıktılar bir arayüzle standart
raporlar ve/ya esnek raporlar olarak alınabilmektedir.
6. ve 7. LEM BASAMA I
KKDP'de 6. ve 7. i lem basamakları standart derlem raporlamasına
kar ılık gelmektedir. Kullanıcı (ara tırmacı) veri tabanında tutulan
yapılarla ilgili istedi i raporları rapor listesinden seçerek dı a
aktarabilmekte ya da ekrana yazdırabilmektedir. Bu modül bazlı bir
raporlamadır ve etiketlenen/i aretlenen yapılara göre de i iklik
gösterebilmektedir.
KKDP'nin 7. i lem basama ı esnek raporlama basama ıdır. Burada 4.
basamakta yer alan ve ara tırmacının kendisi tarafından ara tırma
soruları çerçevesinden belirlenen esnek etiketleme-i aretlemeler sorgu
sonuçlarına ba lı olarak çe itli dosya formatlarında veri tabanından
raporlanabilmekte, bu raporlamalarla ilgili grafik ve listeleri elde
edebilmektedir.

KKDP’de MODÜLLER ve UYGULAMALAR


KKDP’de yer alan Giri Paneli, KKPD Ana Paneli, Tanılama
Paneli, Sözlük Bilim Modülü, Anlam Bilim Modülü, Sözcük Bilim
Modülü, Söz Dizimi Modülü ve Biçim Bilim Modülü i lem
basamakları a a ıdaki gibidir:

KKDP G R PANEL
Giri Paneli, http://kkd.mersin.edu.tr adresinden aynı zamanda
proje tanıtım için hazırlanmı bir web sayfası üzerinden
ara tırmacıların kayıtlı kullanıcı adı (e-posta) ve tanımlı ifreleri
aracılı ıyla KKDP’ye eri im sa ladıkları arayüzdür ( ekil 2).
Tanıtım sayfası aynı zamanda Derlem Dilbilim E itim Modülü’yle
sistem kullanımı hakkında e itim dosyalarını da içermektedir.
Sistem üzerinden kayıtlı her ara tırmacı için ara tırmacıya
özel ayrı bir veri tabanı alanı tanımlanmakta ve tüm i lemleri
Derlem Dilbilim

kullanıcılar kendilerine ait veri tabanı üzerinden


yürütebilmektedirler.

ekil 2. KKDP Sistem Giri Sayfası

Sisteme giri yapan kullanıcı için ekil 3’te de görüldü ü gibi


KKDP modüleri aktif ve kullanıma hazır halde kayıtlı kullanıcının
eri imine açılmaktadır.
Bu noktada kullanıcının talebi do rultusunda ya tüm derlem
i leme modülleri ya da iste e ba lı (ara tırmanın amaçları
do rultusunda belirleyebilece i) modüller ara tırmacı için
özelle tirilebilmekte ara tırmacının seçti i modüller ara tırmacının
kullanıcı hesabına tanımlanabilmektedir.

ekil 3. KKDP Ana Paneli


Bülent ÖZKAN

KKDP TANILAMA PANEL


Derlem olu turmanın ilk a aması derlem dilbilim ilke ve
yöntemleri do rultusunda tabakaların belirlenmesi, metin seçimi
ve bunların sayısalla tırılması ba lıkları altında haritalandırılabilir.
Tabakaların belirlenmesi, metin seçimi ve sayısalla tırma
a amasını önceleyen ba ka bir durum ise ara tırma sorularıdır.
Olu turulacak derlem için var olan ara tırma soruları çerçevesinde
neleri metadata (üstveri) olarak belirleyece imiz konusu önem
ta ımaktadır. Bu durum, derlemde metadata olarak neyi
yapılandırırsak onu rapor olarak alabilece imiz temelinde
dü ünülmelidir.
Bu anlamda olu turulacak derlem, ara tırmacının temel
birtakım yapılandırmaların (yazar adı, eser adı, metin türü, yayın
yılı, yazar cinsiyeti vb.) yanı sıra bazı özel yapılandırmaları da
yapabilmesine olanak sa lamaktadır. Ara tırmacı söz konusu temel
yapılandırmalar dı ında ara tırma sorularına ba lı istedi i
geni likte birtakım metadataları (örne in: yazarın yeti ti i çevre,
etkilendi i di er yazarlar, yazarın dünya görü ü vb.) sistemde
giri i yapılan metinlere Metadata Tanılama paneli üzerinden
ekleyebilmektedir. Sistem ara tırmacının ara tırma sorularına ba lı
olarak esnek bir yapıyla bu olana ı sunabilmektedir. ( ekil 4).
Bu panel üzerinde yer alan Tabaka Tanılama sekmesi
derlemde yer alan tabakaların belirlenmesine kar ılık gelmektedir.
Yine, bu tanılama i lemi ara tırma sorularına ba lı olarak
olu turulacak bir derlemin varlı ına i aret etmektedir. Bu
yapılandırma da esnek bir arayüzle ara tırmacının kullanımına
sunulmaktadır.
Derlem Dilbilim

ekil 4. Tanılama Paneli i lem a amaları

Tanılama panelinde Metadaka Tanılama ve Tabaka


Tanılama’nın ardından gelen a ama derleme yer alacak metinlerin
sisteme yüklendi i Metin Giri i a amasıdır. Bu a amada derleme
giri i yapılacak metinlerin belirlenmi metadataları ve tabakaları
do rultusunda metinler sisteme yüklenebilmektedir.
Yüklenen metinlerin özet bir istatistik bilgisi de derlem
olu turulduktan sonra ara tırmacılara statistik Sayfası aracılı ıyla
ayrı bir arayüzle sunulmaktadır. Olu turulan istatistik sayfası
üzerinden ara tırmacının iste i do rultusunda birtakım farklı
hesaplamalar (okunabilirlik vb.) yapılabilmektedir.
Söz konusu a amaların ayrıntısı ise a a ıda sunulmu tur:

KKDP’de Metadata Tanılama


Metadatalar, üstveri olarak da adlandırılan metin adı, yazar
adı, yayın yılı, ilk yayın tarihi, son basım tarihi, yazarın cinsiyeti,
metin cümle sayısı, farklı ve aynı cümle sayısı vb. sistem üzerinden
ara tırma sorularına göre biçimlendirilebilen veri giri lerine
kar ılık gelmektedir. Bu a amada ara tırmacı söz konusu
metadataları ara tırma sorularına göre esnek olarak
yapılandırılabilmektedir ( ekil 5).
Bülent ÖZKAN

ekil 5. Metadata ekleme arayüzü

KKDP’de Tabaka Tanılama


Derlemler ara tırma sorularına ba lı olarak dilin çe itli
kullanım katmanlarını içerebilmektedir. Bir derlemde yer alacak
tabakalar derlemin ne amaçla kullanılaca ına ba lı olarak
belirlenmektedir. Örne in, ekil 6’da görüldü ü gibi Yazın Dili,
Internet Metinleri, Çe itli Türler olarak belirlenen bir tabakalama
yapılabilece i gibi, Türkçede öykü türü özerine inceleme yapacak
bir ara tırmacı, dönemlere göre (1923-1940’lı yıllar, 1941-1960’lı
yıllar gibi) bir tabakalandırma da yapabilir. Burada belirleyici olan
ve sistemin gerçekte ana ruhunu olu turan esnek bir yapının
ara tırmacılara sunulmu olmasıdır.

ekil 6. Tabaka ekleme arayüzü


Derlem Dilbilim

ekil 6’da da görülece i gibi esnek arayüzle söz konusu tüm


i lemler sistem üzerinden yürütülebilmekte ana ve alt tabakalar
eklenip gerekti inde silinebilmekte, yeniden düzenlenebilmektedir.

KKDP’de Metin Giri i


Metin giri i, tanılama panelinde metadata tanılama ve tabaka
tanılama a amasından sonra gelmektedir. Bu arayüzde belirlenen
tabakalara ve alt tabakalara ait metinlerin giri leri
yapılabilmektedir ( ekil 7). Ayrıca söz konusu arayüzde Metin
Ekle sekmesinde ilgili tabakaya ait metin giri leri yapılabildi i
gibi, metin giri i yapıldıktan sonra Metin Göster sekmesiyle giri i
yapılan metinler metadata bilgileriyle görüntülenebilmekte, bu
metadatalar düzenlenebilmektedir.

ekil 7. Tabaka görüntüleme arayüzü

ekil 8’de görüldü ü gibi, giri i yapılacak metinlerin


belirlenmi metadata giri leri metin giri i a amasında
gerçekle tirilebilmektedir. Bu arayüzde UTF-8 biçimli metin
dosyaları sisteme yüklenebilmektedir ( ekil 8).
Metinler yüklendi inde, sistem, metinleri anlık olarak
sözbirimle tirmekte, tümcelere ayırmakta, sözbirimlerin
biçimbirimsel çözümlemeleri yapılmakta ve metadatalarla birlikte
veri tabanı kaydını olu turulmaktadır. Biçimbirimsel çözümleme
Bülent ÖZKAN

için proje danı manı Oflazer’in geli tirdi i biçimbirimel


çözümleme aracı kullanılmaktadır.
ekil 9’da ise metinlerin derlem kaydı
görüntülenebilmektedir. ekil 9’daki arayüzde gerekti inde
metinler kontrol edilebilmekte ve güncellenebilmektedir. Bu
güncellemeler yazım hatalarını düzenleme imkanını kullanıcıya
sunmaktadır.

ekil 8. Metin metadata giri i

ekil 9. Metin düzenleme/güncelleme ekranı

Tüm bu a amaların ardından eklenen metinlerin


görüntülendi i ve ba ka bir arayüzden kullanıcının gerekli
güncelleme ve düzenlemeleri yapabilece i, olu turulan derlemin
Derlem Dilbilim

ayrıntılarının görülebilece i bir arayüz kullanıcıya sunulmaktadır


( ekil 10).

ekil 10. Eklenen metinlerin kayıt/kontrol arayüzü

Bu a amadan sonra basit bir arayüzle (ki iste e ba lı olarak


giri i yapılan metinlerin di er istatistikleri de eklenebilir) giri i
yapılan metinlere ait sayısal verileri ara tırmacıya
sunulabilmektedir.

2.2.4. statistik Sayfası


statistik Sayfası, giri i yapılan metinlere ait toplam metin
sayısı, toplam cümle sayısı, toplam kelime sayısı, toplam tekil
kelime sayısı, toplam hece sayısı gibi bir takım temel/basit sayısal
verileri ara tırmacıya sunabilmektedir ( ekil 11). Bu istatistik
bilgisi kullanıcının iste ine ba lı olarak düzenlenebilmekte,
ekleme ve çıkarmalar yapılabilmektedir.
Bülent ÖZKAN

ekil 11. statistik sayfası

Özetle, Tanılama Paneli, olu turulmasına karar verilen derlem


için metadata tanılamalarını, derlemin tabaka tanılamalarını,
derlemde yer alan metinlerin giri lerinin gerçekle tirilmesinin
ardından olu turulan derlemin temel/basit düzeyde istatistik
bilgilerini sunan ilk a amadır. Bu a amanın ardından olu turulan
derlem üzerinden di er modüllere geçilebilmektedir.
Bu modüllerden ilki Sözlük Bilim Modülü’dür.

2.3. KKDP SÖZLÜK B L M MODÜLÜ


Sözlük Bilim Modülü, Sözbirimle tirme, Madde Ba ı (MB)
Alt Yapılandırmalar ve Veri Giri i a amalarından olu maktadır.
Bu a amada Tanılama Paneli aracılı ıyla olu turulan
derlemden sözbirimle tirilmi yapılar ve buna ba lı olarak
derlemde yer alan tümceler ve bu tümcelere ait metadatalar veri
i leme a amalarına katılmaktadır ( ekil 12).

ekil 12. Sözlük Bilim Modülü i lem a amaları


Derlem Dilbilim

Sözlük bilim modülü üzerinden sözlük bilimsel uygulamalar


u ekildedir:

2.3.1. KKDP’de Sözbirimle tirme


Sözbirimle tirme a amasında sözbirimler “gövdeleme”
i lemine tabi tutuldukları bir arayüzde i lemlenmektedir.
Türkçenin do ası gere i ‘madde ba ılama’ya kar ılık gelen bu
i lem aracılı ıyla listelenen sözlükbirimler esnek olan madde ba ı
alt yapılandırmalar belirlendikten sonra Veri Giri i a amasında
yapılandırılmaktadırlar. Özetle, sözbirimle tirme - madde ba ılama
(gövdeleme) - madde ba ı yapılandırmalarının ardından madde
ba ı olabilecek sözlükbirimler veri giri arayüzünde belirlenen
madde ba ı yapılandırmalar çerçevesinde i lemlenmektedir ( ekil
13).

ekil 13. Sözbirimle tirme-gövdeleme/madde ba ılama arayüzü

Gövdelenmi yapılar alfabetik sırayla ekil 14’te


listelenebilmekte ve gerekti inde güncellenebilmektedir.
Bülent ÖZKAN

ekil 14. Gövdelenmi sözlükbirimler (ayrılan gövdeler)

Gövdelemelerin ardından olu turulması dü ünülen sözlük için


ara tırma sorularına ya da amaçlılı a göre esnek olarak
belirlenebilen (sözcük türü, sesletim, köken, resim dosyası, ses
dosyası vb.) çe itli yapılandırmalar veri i leme a amasında ekil
15’te görülen arayüz kullanılarak yapılandırılabilmektedir.

2.3.2. KKDP’de Madde Ba ı Yapılandırma


Bu arayüzde yukarıda da belirtildi i üzere amaçlılı a ya da
ara tırma sorularına ba lı olarak madde ba larının içlemlerinde yer
alacak yapılandırmalar esnek bir arayüzde kullanıcı tarafından
olu turulabilmektedir.
Sesletim için ayrıca bir ses dosyası ya da resimli sözlükler için
resim ekleme aracı gibi ara tırmacının di er tüm isteklerine cevap
verebilecek esnek bir yapılandırma söz konusudur. ekil 15’te
örnek uygulamada sesletim, köken, birle ik söz ve resim dosyası
tercih edilmi tir. Ba kaca yapılandırmalar burada esnek bir
biçimde yapılandırılabilmektedir.
Derlem Dilbilim

ekil 15. Madde ba ı yapılandırma arayüzü

Bu a amanın ardından temel bir madde ba ı yapılandırma


ablonu olu turulmu olmakta ve ara tırmacı di er bir a ama olan
veri giri lerini yapaca ı a amaya geçebilmektedir.

2.3.3. KKDP’de Sözlük Bilim Modülü Veri Giri i


Veri giri i a amasında gövdelenmi yapıların listesi üzerinden
madde ba ı olarak i lenmek istenen sözlükbirim seçilmekte ve bu
a amadan sonra artık seçilen sözlükbirimle ilgili yapılandırma
a amasına geçilebilmektedir. ekil 16’da görüldü ü gibi madde
ba ı olarak “baba” sözlükbirimi üzerinde yapılacak i lemler
arasında anlamların giri i, tanıkların seçimi, ( ekil 17) anlam ve
tanı a ba lı sözcük türü etiketi, sesletim, köken, birle ik söz ve
resim giri i ( ekil 18) ile e dizimli yapıların belirlenmesi ( ekil
19) a amaları gerçekle tirilebilmektedir.
Bülent ÖZKAN

ekil 16. Örnek madde ba ı veri giri i

ekil 17. Madde ba ı için anlam giri i, tanık seçimi,


serbest arama arayüzü
Derlem Dilbilim

ekil 18. Sözcük türü, madde ba ı yapılandırmalar


(sesletim, köken, birle ik söz, resim) belirleme arayüzü

ekil 19. E dizim belirleme arayüzü (n-4 .... n+4)

Tüm bu a amaların ardından yapılandırılan madde ba ı sistem


üzerine kaydedilmekte ve kaydedilen bu madde ba ı Word belgesi
olarak dı a aktarılabilmektedir ( ekil 20).
Bülent ÖZKAN

ekil 20. Madde ba ı yapılandırılmı sözlük birim: “baba”

Bu modülde özetle yapılabilecekler u ekildedir:


Seçimlik bir liste, olu turulan derlem üzerinden
sorgulanabilece i gibi, olu turulan gövdelemeler üzerinden elde
edilen madde ba ları da sistem üzerinden amaçlılı a uygun olarak
yapılandırabilmekte, madde ba ı olarak biçimlendirilerek tüm bu
unsurlar rapor olarak dı a aktarılabilmektedir. Bu yapılandırmalar
yine ara tırmacının ara tırma sorularına ba lı olarak ortaya
koyulabilmektedir.

KKDP ANLAM B L M MODÜLÜ


Anlam Bilim Modülü yine ara tırmacılara ara tırma soruları
çerçevesinde sözcük ve cümleleri anlam bilimsel olarak
etiketleyebilecekleri/i aretleyebilecekleri esnek bir yapılandırma
ve raporlama olana ı sunabilecek biçimde tasarlanmı tır.
Bu çerçevede anlam bilimi modülünü Sözcük Anlambilimi
Modülü ve Cümle Anlambilimi Modülü olarak ikiye ayırmak
mümkün.
Sözcük Anlam Bilimi Modülü gerek geleneksel gerekse de
modern anlam bilim etiketleme/i aretlemeleri yapılabilecek bir
Derlem Dilbilim

altyapı olana ını ara tırmacılara sunabilmektedir. Aynı durum


Tümce Anlam Bilimi Modülü için de geçerlidir.

Sözcük Anlam Bilimi


Sözcük Anlam Bilimi Modülü’nde öncelikle esnek etiketler
tanılanmaktadır. Bu etiket tanılamanın ardından sözbirimle tirme
a aması gelmektedir. Sözbirimle tirme bir önceki sözlük bilimi
modülünde yer alan arayüzle benzer özelliktedir. Yine bu arayüzde
serbest sorgu ile belirlenen esnek etiketlere ba lı olarak derlemde
i aretlemeler yapılabilmektedir. Veri giri i arayüzünde yapılan
i aretlemeler ise olu turulan raporla dı a aktarılabilmektedir. Tüm
a amalarda sistem üzerinden düzeltme/düzenlemeler
yapılabilmektedir ( ekil 21).

ekil 21. Sözcük Anlam Bilimi Modülü i lem a amaları

A a ıda yer alan ( ekil 22) arayüzde ara tırmacı ara tırma
sorularına ko ut olarak sözcük anlam bilimi ile ilgili etiketler
tanılayabilmektedir. Tanılanan etiketler veri giri arayüzünde
i lemlenebilmektedir.
A a ıda geleneksel anlamda birtakım anlambilim etiketleri
esnek etiket olarak örnek olu turmak amacıyla eklenmi tir. Ancak
sistem üzerinden elbette daha farklı çalı malar için farklı etiketler
tanılanabilmekte ve buna ba lı olarak ara tırma sorularına cevaplar
aranabilmektedir.
Bülent ÖZKAN

ekil 22. Sözcük Anlam Bilimi esnek etiket tanılama arayüzü

Etiketlerin tanılanmasının ardından üzerinde i lem yapılacak


sözcük birimlerin listelerinin olu turulması amacıyla
sözbirimle tirme i lemine geçilmekte ( ekil 23) olu turulan
sözbirimler ba sözcük (madde ba ı) ve çekimlenmi biçimlerinin
de listelendi i ba ka bir arayüzde ( ekil 24) kullanıcıya
sunulmaktadır.

ekil 23. Sözcük Anlam Bilimi modülü sözbirimle tirme arayüzü


Derlem Dilbilim

ekil 24. Sözbirimle tirilmi yapılar arayüzü D madde ba ı

Sözcük Anlam Bilimi modülünde di er bir a ama veri i leme


a amasıdır. Bu a amada olu turulan etiketler aracılı ıyla ba lam
içinde yer alan sözbirimler etiketlenebilmektedir. Etiket tanılama
ekranında belirlenen etiketler i lem yapılacak ba lam için sözcük
gösteriminin yer aldı ı ekranda kullanıcının etiketlemesi için ba ka
bir arayüzde i lemlenmektedir ( ekil 26).
Bu a amada i lemlenecek olan sözbirimle tirilmi yapıların
seçiminin yapıldı ı ya da serbest arama olana ı sunan arayüz
etiketlemelerin ba langıcını olu turmaktadır ( ekil 26).

ekil 25. Sözbirim listesi


Bülent ÖZKAN

ekil 26. Sözcük Anlam Bilimi etiketleme arayüzü

Etiketlenen veriler rapor sayfası aracılı ıyla tanık, kaynak ve


di er metadatalarla raporlanabilmekte ve bu raporlar
düzenlenebilir metin formatı olarak dı a aktarılabilmektedir ( ekil
27).

ekil 27. Sözcük Anlam Bilimi raporlama arayüzü

Cümle Anlam Bilimi


Cümle Anlam Bilimi Modülünde 4 a ama bulunmaktadır.
Bunlardan ilki yine ara tırmacının ara tırma sorularına göre
belirlenebilecek olan esnek etiketler tanımlama a amasındır. Bu
a amanın ardından söz konusu etiketlerle cümleleri etiketleme
a aması gelmektedir. Bu modülde yer alan bir di er a ama serbest
arama yapılabilmesine olanak sa layan arayüzdür. Bu arayüzün
Derlem Dilbilim

varlık nedeni Türkçede belirli yapıların sorgulanarak (ba laçlar


gibi) bu öncüller aracılı ıyla cümleleri etiketleyebilme olana ını
ara tırmacıya sa lamaktır. Son a ama ise yine raporlama
a amasıdır. Bu a amada söz konusu tanılanmı etiketler
aracılı ıyla i aretlenen tümceler raporlanabilmektedir.

ekil 28. Cümle Anlam Bilimi Modülü i lem a amaları

Veri Giri i ekranında eser bazlı olarak tümceler


listelenmektedir. Bu listeleme sırasında yanlı bölümlenmi
cümleler varsa bunlar birle tirilebilmekte ya da yeniden
bölümlenebilmektedir ( ekil 29). Bu a amada cümleler
düzenlendikten sonra tanılanan etiketler aracılı ıyla
etiketleme/i aretleme a amasına geçilmektedir ( ekil 30). Bu
a amada serbest sorgu olana ı da ara tırmacılara sunulmaktadır
( ekil 31).

ekil 29. Cümle Anlam Bilimi Cümle düzenleme arayüzü


Bülent ÖZKAN

ekil 30. Cümle Anlam Bilimi veri etiketleme arayüzü

ekil 31. Cümle Anlam Bilimi serbest arama arayüzü

Ara tırma sorusuna ba lı olarak belirlenen esnek etiketler tüm


veri i leme a amasının ardından ekil 32’de görüldü ü üzere
raporlanabilmekte ve dı a aktarılabilmektedir.
Derlem Dilbilim

ekil 32. Cümle Anlam Bilimi raporlama arayüzü

KKDP SÖZCÜK B L M MODÜLÜ


Sözcük Bilim Modülü sözcük türlerinin (part of speech)
etiketlenmesi temeline dayanmaktadır. Söz konusu modül
üzerinden belirlenen etiketler aracılı ıyla sözcük türleri
etiketlenebilmekte ve raporlanabilmektedir.
Bu modülde yine ilk a ama etiket tanılama a amasıdır. Bu
a amanın ardından di er modüllerle aynı biçimde i lem yapan
sözbirimle tirme a aması gelmektedir ( ekil 33). Sözbirimle tirme
a aması da yine önceki modüllerle benzerdir. Son olarak aynı
arayüzle (veri giri i) etiketlenen veriler raporlanabilmektedir ( ekil
34 ve ekil 35). Bu a amadan önce etiketlenen verilerin kontrolü
için ba ka bir arayüz de geli tirilmi tir. Bu arayüzde yapılan
etiketlemeler listelenebilmekte ve düzenlenebilmektedir ( ekil 37).

ekil 33. Sözcük Bilim Modülü i lem a amaları


Bülent ÖZKAN

ekil 34. Sözlük Bilim Modülü sözbirimle tirilmi yapılar arayüzü

ekil 35. Sözlük Bilim Modülü veri i leme arayüzü


Derlem Dilbilim

ekil 36. Sözcük Bilim Modülü veri düzenleme arayüzü

ekil 37. Sözlük Bilim Modülü raporlama arayüzü

KKDP SÖZ D Z M MODÜLÜ


Söz Dizimi Modülü’nde ana olarak üç a amadan ( ekil 38)
söz etmek mümkün. Bunlar esnek etiket tanılama ( ekil 39), veri
giri i ve rapor olu turma a amalarıdır.
Bülent ÖZKAN

ekil 38. Söz Dizimi Modülü i lem a amaları

ekil 39. Söz Dizimi Modülü etiket tanılama arayüzü

Veri i leme a amasında cümle liste ekranı aracılı ıyla


cümleleri bir sonraki ile birle tirmek ya da hatalı bloklanmı
olanları bölümlemek mümkün olabilmektedir ( ekil 40).
Derlem Dilbilim

ekil 40. Söz Dizimi Modülü cümle düzenleme arayüzü

Veri i leme a amasının di er bir bile eni seçilen cümlenin


etiketlenmesi a amasıdır. Örneklerde bilinen cümle türleri ayrımı
üzerinden i lemleme yapılmı tır. Bu noktada karar verilmesi
gereken i lenecek cümle için birinci a ama cümlenin devrik cümle
mi kurallı cümle mi oldu udur. Ardından “|” imleciyle cümleler
öbeklerine ayrılabilmektedir. Bu a amada ise cümlenin basit mi
yoksa birle ik bir cümle mi oldu u aynı ekranda karar verilmesi
gereken ikinci bir husustur ( ekil 41).

ekil 41. Söz Dizimi Molüdü öbek yapı ayırma cümle yapısı
belirleme arayüzü
Bülent ÖZKAN

Bu a amanın ( ekil 41) ardından di er ekranda ayrılan


öbekleri etiketleme a aması gelmektedir. Burada basitçe öbek
yapıların ne oldu una karar verilmektedir. Aynı ekranda cümlenin
yüklemine göre (isim-fiil cümlesi), anlamına göre (olumlu,
olumsuz, olumlu soru, olumsuz soru, ünlem) ve ö e dizili ine göre
(kurallı, devrik, eksiltili) etiketlenebilmektedir ( ekil 42).

ekil 42. Söz Dizimi Modülü öbek yapı etiketleme arayüzü

Tüm bu i lemlerin ardından raporlama arayüzünde bir önceki


a amada yapılan tüm etiketlemeler listelenerek dı a aktarılabilir bir
yapıda ekrana yazdırılmaktadır. Bu raporlamada ö elerine göre
( ekil 43), anlamına göre ( ekil 44), yüklemin türüne göre ( ekil
45) ve ö e dizili ine göre ( ekil 46) ayrı ayrı raporlamalar yapmak
mümkündür.
Derlem Dilbilim

ekil 43. Ögelerine göre cümle yapısı rapor arayüzü

ekil 44. Anlamına göre cümle raporlama arayüzü

ekil 45. Yüklemin türüne göre cümle raporlama arayüzü


Bülent ÖZKAN

ekil 46. Ö e dizili ine göre cümle raporlama arayüzü

2.7. KKDP B Ç M B L M MODÜLÜ


Biçim Bilim Modülü kullanıcıların yükledikleri ve sistem
tarafından sözbirimle tirilmi yapıları Biçimbirimsel Çözümleme
Aracı (Oflazer, 2003) ile özniteliksel olarak çözümlemekte ve arka
planda çözümlenmi yapıları sorgulama imkanını ara tırmacılara
sunmaktadır. Çözümlemeler için esnek etiketler yine Biçim Bilim
Modülü’nde ara tırmacılara sunalan bir yapılandırmadır. Son
olarak veri giri i arayüzünde ara tırmacı tanıladı ı esnek etiketlerle
sorgu sonuçlarından gelen yapıları i leyebilmektedir. Bu anlamda
Biçim Bilim Modülü: Biçimbirimsel Çözümleme yapma, Etiket
Tanılama ve tanılanan etiketlerle sorgu sonuçlarını i lemleme
a amalarını (Veri leme) içermektedir ( ekil 47).

ekil 47. Biçim Bilim Modülü veri i leme a amaları

Örne in, çıkma durumu ekinin i levleri üzerine bir çalı ma


yürütülmek istendi ine çıkma durum eki içeren yapılar
biçimbirimsel çözümlemesi yapılmı olan sözbiçimler olarak
derlemden filtrelenerek tanılanan etiketlere ba lı olarak
Derlem Dilbilim

i lemlenme a amasına ta ınmaktadır. Bu anlamda çıkma durum


ekinin i levlerini etiketlemek için öncelikle esnek etiket tanılama
arayüzünde i levlerin (etiketlerin) girilmesi gerekmektedir ( ekil
48).

ekil 48. Biçim Bilim Modülü esnek etiket belirleme modülü

Esnek etiket tanılama a amasının ardında ara tırma sorumuz


olan çıkma durum eki içeren yapılar arayüz aracılı ıyla seçilerek
ilgili tanıklar listelenebilmektedir ( ekil 50). Bu anlamda
dilbilgisel olarak tüm ana ve alt kategoriler sistem üzerinden
sorgulanabilmekte ve sorgu sonuçları belirlenen esnek etiket
tanılama arayüzüyle i lemlenebilmektedir ( ekil 49 ve ekil 50).

ekil 49. Biçim Bilim Modülü biçimbirim sorgu arayüzü


Bülent ÖZKAN

ekil 50. Biçim Bilim Modülü veri i leme arayüzü

ekil 51 ve ekil 52 de görüldü ü gibi tanılanan etiketler


aracılı ıyla veriler i lenmekte, yine aynı ekranda ekil 52’de
görüldü ü gibi di er bir sekmede etiketlenen yapılar listelenmekte
ve ayrıca raporlanabilmektedir.

ekil 51. Biçim Bilim Modülü veri i leme etiket arayüzü


Derlem Dilbilim

ekil 52. Biçim Bilim Modülü etiketlenmi veriler rapor arayüzü

Özetle, sistem üzerinden özniteliksel çözümlemesi yapılan


sözbiçimler ara tırma sorularına göre belirlenmi esnek etiketler
aracılı ıyla veri i leme arayüzünde i lemlenmekte ve i lemlenen
veriler raporlama arayüzüyle raporlanabilmektedir.

3. SONUÇ
Bu çalı ma 2007 yılından bu yana derlem dilbilim alanında
yürütülen ve birço u Tübitak tarafından desteklenen projelerde
elde edilen yazılım kümelerinin yeniden düzenlenerek tüm
ara tırmacıların kullanımına sunulması hedefiyle ortaya
koyulmu tur.
Olu turulan derlem platformu dilbilimcilere var olan standart
derlem çıktıları vermenin yanında ara tırmacıların ara tırma
sorularına ba lı olarak biçimlendirilebilen, ara tırmacıya özel,
esnek, kolay ula ılabilir, veri tabanı destekli ve ara tırma
sonuçlarının sa lıklı bir ekilde raporlanabildi i bir derlem
altyapısı sunması nedeniyle yenilikçi bir yöne sahiptir.
Projeyle olu turulan altyapı Türkçe dil/dilbilim ara tırmaları
açısından dü ünüldü ünde ara tırmacılara Türkçenin rekabet
gücünü arttıracak olanakları sunacaktır.
Bülent ÖZKAN

Bu projeyle, Türkçe üzerine çalı an dil/dilbilim ara tırmacıları


için ara tırmacıların ara tırma sorularına ba lı olarak
biçimlendirilebilen, ara tırmacıya özel, esnek, kolay ula ılabilir,
veri tabanı destekli ve bu çerçevede ara tırma sonuçlarının sa lıklı
bir ekilde raporlanabildi i bir derlem platformu geli tirmek
amaçlanmı ve bu amaca da ula ılmı tır.
Projeyle geli tirilen platform, Sözlük Bilim, Anlam Bilim,
Sözcük Bilim, Söz Dizimi ve Biçim Bilim Modülü’nden
olu masının yanında uygulamalı dilbilim çerçevesinde kar ımıza
çıkan dilbilgisi, a ız, çeviri bilim, tarihsel dilbilgisi ve dilsel
de i im, dil ö renimi ve ö retimi, anlambilim, kullanımbilim,
toplum dilbilim, söylem çözümlemesi, biçembilim ve yazınbilim
gibi dilbilimin di er alt dalları için de ara tırmacılara yeni
olanaklar sunma potansiyeline sahiptir.
Bugüne kadar KKDP kullanılarak a a ıdaki proje ve yayınlar
yapılmı tır.
i. Türk Sözlükbilimi Terminolojisi Üzerine Derlem Tabanlı
Bir Ara tırma. ESOGÜ – BAP – Proje No: 2016-019056.
Proje Yürütücüsü: Prof. Dr. Erdo an BOZ.
ii. Yabancı Dil Olarak Türkçe Ö renenlerin B-1 Düzeyinde
Yazma Becerileri Üzerine Bir nceleme. Mersin
Üniversitesi – BAP – Proje No: 2018-1- TP2-2677. Proje
Yürütücüsü: Doç. Dr. Bülent ÖZKAN.
iii. Cengiz Aytmatov'un Birinçi Mugalim Adlı Eserinin
Ba lam – E dizim - Sıklık Sözlükleri. Gazi Kitapevi,
06.07.2020. Yazar: Doç. Dr. Cüneyt AKIN.
iv. Valentin Mo kov Besarabya Gagauzlarının A ızları (Söz
Varlı ı). Efe Akademi Yayınları, 26.12.2019. Yazar: Doç.
Dr. Nadejda ÖZAKDA .
v. ÖZKAN. B. (2016). Türkçe için ‘Kendi Kendine Derlem
Platformu’nun (KKDP) nternet Tabanlı Türkçe Yeterlik
Sınavı ( TS) Yazma Beceresi Modülüne Eklemlenmesi ve
Yazma Hatalarının Belirlenmesi Temelinde Ö renici
Derlemi Altyapısı. II. Uluslararası Yabancı Dil Olarak
Derlem Dilbilim

Türkçenin Ö retimi Sempozyumu. 19- 21/05/2016.


Münih/ALMANYA.
vi. ÖZKAN B. (2016). Türkçe için Kendi Kendine Derlem
Olu turma Platformu ve Sözlük Bilimi Uygulamaları. III.
Uluslararası Sözlükbilim Sempozyumu. 01.11.2016.
Eski ehir Osmangazi Üniversitesi. Davetli Konu macı.
TÜRK YE
vii. ÖZKAN B. (2017). Lexicological Module of Do It
Yourself Corpora for Turkish. 11 th International
Conferences of the Asian Association for Lexicography
(ASIALEX). Guangdong University of Linguistics and
Applied Linguistics of Foreign Studies. 20-12 June 2017.
Guangdong/CHINA.
Çalı mayla hedeflenen ey, derlem dilbilim uygulama
alanında Türkçenin rekabet gücünü arttırmaktır. Bu çerçevede
KKDP ile dilcilere/dilbilimcilere Türkçe üzerine yürüttükleri
çalı maların nitelik ve niceli i arttırıcı önemli bir altyapı olana ı
sunulmu tur.

Kısaltmalar

DD : Do al Dil leme
KKDP : Kendi Kendine Derlem Platformu
TÜB TAK : Türkiye Bilimsel ve Teknolojik Ara tırma Kurumu
XML : Extensible Markup Language (Türkçesiyle
Geni letilebilir aretleme Dili)
UTF : Unicode Transformation Format
Bülent ÖZKAN

Türkçe- ngilizce Terim Dizini

anlam/lar : sense
anlambirimsel : semantic
art süremli derlemler : diachronic / historical corpora
ba ımlı dizin : concordance
biçimbirimsel : morphological
biçimbirimsel/özniteliksel
çözümleme : morphological analysis
çekimlenme biçimi : inflections
çoklu sorgu : multiple query
derlem : corpus
derlem dilbilim : corpus linguistics
di er türetimler : run-ons
dur listesi : stop list
e süremli derlemler : synchronic corpora
e dizimlilik : collocation
etiketleme : tagging
genel derlemler : general corpora
i aretleme : annotation
izlem derlemleri : monitor corpora
köken bilgisi : etymology
kullanım : usage
metadata : üstveri
ö renici derlemleri : learner corpora
örnekleme : sampling
özel alan derlemi : specialized corpora
serbest sorgu : query
Derlem Dilbilim

sesletim : pronunciation
sıklık : frequency
sıklık analizi : frequency analysis
sorgu geçmi i : query history
söz dizimsel : syntactic
sözbirimle tirme : lemmatizing/lemmatization
sözcük türleri : part of speech
sözcük türü : word class
sözcükbirimsel : lexical
sözlü derlemler : spoken corpora
sözlükbilimsel : lexicographic
tanıklama : examples
tanımlama : definition
tekille tirilme : deduplication
temsil gücü : representativeness
tümce bölümleme : sentencer/parser/parsing
uygulamalı dilbilim : applied linguistics
yazılı derlemler : written corpora
yazımsallık : spelling

leri Okuma Önerileri

Baker, Paul, Andrew Hardie ve Tony McEnery 2006. A Glossary of


Corpus Linguistics. Edinburgh University Press.
Özkan B. 2013. Yöntem ve Uygulama Açısından Türkçeyi Türkçesi
Söz Varlı ının Derlem Tabanlı Sözlü ü. bilig. Sayı: 66 Yaz'13.
Özkan B. 2013. Yöntem ve Uygulama Açısından ‘Türkiye Türkçesi
Söz Varlı ının Derlem Tabanlı Sözlü ü’, bilig, Sayı: 66. Yaz
2013. 149-178.
Bülent ÖZKAN

Özkan, B vd. 2014. Türkçe Üzerine Derlem Dilbilim Uygulamaları.


Karahan Kitabevi. Adana.
McEnery, Tony, Richard Xioa, Yukio Tono 2006. Corpus-Based
Language Studies an Advanced Resource Book, Routledge,
New York.
Atkins, Sue ve Jeremy Clear 1992. “Corpus Design Criteria”. Literray
and Linguistics Computing. Vol. 7. No. 1. 1992. Oxford
University Press.

Kaynaklar

Atkins, Sue ve Jeremy Clear 1992. “Corpus Design Criteria”. Literray


and Linguistics Computing. Vol. 7. No. 1. 1992. Oxford
University Press.
Baker, Paul, Andrew Hardie ve Tony McEnery 2006. A Glossary of
Corpus Linguistics. Edinburgh University Press.
Burnard L. 2004. Metadata for Corpus Work. (http://users.ox.ac.uk/
~lou/wip/metadata.html)
Hanks, Patrick. 2003. Lexicography. Computational Linguistics. (Ed.
Ruslan Mitrov), Oxford University Press.
Hartmann, R. R. K., Gregory, James 1998. Dictionary of
Lexicography. London. Routledge.
http://tudd.org.tr/index.php
http://turkcederlem.mersin.edu.tr/
Jackson, Howard. 2002. Lexicography: an Introduction. Routledge.
USA.
Jurafsky Daniel, James H. Martin 2006. Speech and Language
Processing: An Introduction to Speech Recognition,
Computational Linguistics and Natural Language Processing.
(http://web.mit.edu/6.863/www/fall2012/readings/ngrampages.
pdf)
Kennedy, G. 1998. An Introduction to Corpus Linguistics. New York:
Addison Wesley Longman Limited.
Derlem Dilbilim

Malmkjaer, K. 2001. Linguistics Encyclopedia. Florence. KY. USA. s.


341-346.
McEnery, Tony and Adrrew W. 2004. Corpus Linguistics -An
Introduction-. USA: Edinburg Universitiy Press.
McEnery, Tony, Richard Xioa, Yukio Tono 2006. Corpus-Based
Language Studies An Advanced Resource Book. Routledge.
New York.
Özkan, B. 2007. Türkiye "Türkçesinde Belirteçlerin Fiillerle
Birliktelik Kullanımları ve E dizimlili i. (Doktora tezi).
Çukurova Üniversitesi/Sosyal Bilimler Enstitüsü, Ankara.
Özkan, B. 2010. "Türkçenin Ö retiminde Sıfatların E dizim Sözlü ü:
Yöntem ve Uygulama", e-International Journal of Educational
Research. Volume 1. No 2. Autumn 2010: 51-65.
Özkan, B. 2011. Türkiye Türkçesinde Belirteçlerle Fiillerin Birlikte
Kullanılması ve E Dizimlilikleri. Ankara: TDK Yayınları:
1031.
Özkan, B. 2012. Türkiye Türkçesi Söz Varlı ında Sıfatların
E dizimlili i -Derlem Tabanlı Bir Uygulama-. Ulusal
Ara tırma Projesi, TÜB TAK-SOBAG-109K104, Mersin.
Özkan B. 2013. Yöntem ve Uygulama Açısından ‘Türkiye Türkçesi
Söz Varlı ının Derlem Tabanlı Sözlü ü’, bilig, Sayı: 66. Yaz
2013. 149-178.
Özkan, B vd. 2014. Türkçe Üzerine Derlem Dilbilim Uygulamaları.
Karahan Kitabevi. Adana.
Özkan B. 2015. 112K479 - Bir Özel Alan Derlemi Olarak 'Türk
Çocuk Yazını Derlemi' ve Türk Çocuk Yazını Üzerine leri
Uygulamalar Projesi Sonuç Raporu.
Özkan, B. 2020. Gerçek Ya am Temelli Okul Sözlü ü Uygulamaları.
Tübitak – Sobag – 1003 Ulusal Ara tırma Projesi
http://turkcederlem.mersin.edu.tr/okulsozluk/
Sterkenburg, P. 2003. A Practical Guide to Lexicography.
Philadelphia, PA, USA: John Benjamins Publishing.

You might also like