Professional Documents
Culture Documents
Veri Derleme Veri Düzenleme
Veri Derleme Veri Düzenleme
1 2
Veri Derleme
1 Veri derlemede kullanılan teknikleri ifade Veri Düzenleme
edebilme 2 Verileri tablolar ile gösterebilme
Anahtar Sözcükler: • Veri Derleme • Gözlem • Anket • Görüşme • Likert • Tablo • Frekans Serisi
• Gruplandırılmış Frekans Serisi • Mekân Serisi • Zaman Serisi
28
2
İstatistik I
GİRİŞ
Bir araştırmanın gerçekleştirilmesi için öncelikle araştırmacı tarafından problemin belirlenmesi iş-
lemi yürütülür. Genel olarak bilimsel araştırmaların amaçlarının düzenlendiği ana başlıklar; keşif, ta-
nımlama, açıklama, anlama, tahmin ve kontrol olarak ele alınabilir. Bu başlıklara bağlı olarak da farklı
araştırma türleri araştırmacı tarafından düzenlenecektir. Problemin doğru tanımlanması araştırmacının
araştırma türünü de etkileyecektir. Problemin çözümüne ilişkin bilgilerin nasıl derleneceğinin doğru
tanımlanması ile araştırmacı araştırma türünü de seçebilir hale gelecektir. Bu dersimizin kapsamında
araştırma süreci ele alınmamaktadır. Ancak araştırma türü ne olursa olsun araştırmacı çalışmasının çe-
şitli aşamalarında verilere ve bu verilerin tablo ve grafikler ile özetlenerek ileri istatistiksel analizlere hazır
hale getirilmesine ihtiyaç duyacaktır.
Kitabınızın ilk ünitesinde veri ve değişken kavramları ile ölçme düzeyleri ayrıntılı olarak ele alınmıştır.
Peki değişkenlere ait değerleri nasıl elde ederiz? Farklı veri kaynakları nelerdir? Bu veri kaynaklarından veri
elde edilirken ne tür zorluklar ile karşılaşabiliriz. Kitabınızın ikinci ünitesinde veri derleme için kullanılan
kimi teknikler ünitenin ilk kesiminde incelenecektir. Ünitenin ikinci kesiminde ise derlenen verilerin tab-
lolar halinde gösterimi konusu ele alınacaktır.
VERİ DERLEME
Daha önce de bahsettiğimiz gibi araştırmacının araştırma problemini çözme yolunda ihtiyaç duyacağı
temel birimlerden bir tanesi de veri olacaktır. Bu verinin araştırmacının amacına uygun bir biçimde, doğru
veri kaynağından, doğru teknikler yardımıyla eksiksiz ve hatasız olarak derlenmesi beklenir. Araştırmacı-
nın veri derleme aşamasında yapacağı hatalar, araştırmanın ilerleyen aşamalarında elde edilecek sonuçları
üzerinde etkiler yaratabilir. Yapılan hatanın niteliğine göre bu etkiler bazen araştırmacının lehine olabile-
cekken kimi diğer durumlarda aleyhine olabilecektir.
Veri derleme için genel bir tanım yapabiliriz. Araştırmada tanımlanan evreni oluşturan birimlerden
veya bu evreni temsil ettiği düşünülen istatistiksel analizler yardımıyla tespit edilmiş örneklem birimlerden
araştırmacının belirlediği değişkenlerin aldığı değerlerin uygun ölçme araçları yardımıyla tespit edilmesi
ve kayıt altına alınması sürecine veri derleme adı verilir. Tanımdan da görüldüğü gibi veri derlemenin en
önemli bileşenleri araştırmanın evreni veya bu evreni temsil eden örneklemi oluşturan birimler, ölçme
yapılacak olan değişkenler ve bu değişkenlerin ölçülmesinde kullanılan ölçme aracı olmaktadır. Bu bile-
şenlerin herhangi birisinde yapılacak hatalar veri derleme sürecini etkileyecektir.
Araştırmacının çalışmasının tüm paydaşlar tarafından kabul edilebilir olması için doğru kaynaktan,
doğru biçimde ve yeterince veriye ulaşılmış olması gerekir. Kitabınızın birinci ünitesinde sizlere örneklem
kavramı aktarırken örneklemin, örneklemin elde edildiği evrenin tüm özelliklerini temsil edecek biçimde
hazırlanması gerektiği bilgisini paylaşmıştık. Eğer evrenden elde edilen örneklem evrenin mümkün olan
tüm özelliklerini doğru yansıtmıyor ise bu örneklemden derlenen verinin araştırmanın başarılı olma şansı-
nı etkileyeceği aşikârdır. Veri derleme aşamasında veri derleme işlemini gerçekleştiren bireylerin de süreci
doğru anlayarak veri derleme işlemini yürütmesi gerekecektir. Araştırmalarda veri derleme sürecinde araş-
tırmacıların üzerinde durması gereken genel ilke ve kuralları izleyen biçimde sıralamamız mümkündür;
• Araştırmacının veri derleme sürecini neden yürüttüğünü anlatabilmesi adına, araştırmanın ama-
cının tüm paydaşlar tarafından aynı açıklıkta anlaşılabilmesi için araştırmacı amacı yalın bir dil ile
ifade etmelidir
• Araştırma amacının yalın bir ifadesinden sonra araştırmacı bu amaca yönelik hangi bilgiye ihtiyacı
olduğunu tespit etmelidir. İhtiyaç duyulan bilginin hangi değişkenlerin ölçülmesi veya gözlem-
lenmesi ile elde edileceği açıklanmalıdır. Araştırmada yer alan tüm değişkenler ve bunların ölçme
düzeyleri açık bir şekilde ifade edilir.
• Araştırmacının tespit ettiği tüm değişkenlerin araştırma amacının hangi özelliğini göstermek üzere
derlendiği ve araştırma amacı ile değişkenler arasındaki ilişkiler açıklanmalıdır.
29
2
Veri Derleme ve Düzenleme
• Veri derleme sürecine ilişkin atılacak tüm adımlar veya ortaya çıkabilecek zorluklar açıklıkla ifade
edilmelidir. Örneğin veri derlemenin kim veya kimler tarafından yürütüleceği, zaman ve mekân
kısıdının olup olmadığı, veri derleme sürecini etkileyebilecek dışsal koşulların olup olmadığı, veri
derleme aşamasında hedeflenen veriye erişim sağlanamadığında ne tür önlemler alınacağı vb. du-
rum ve sorunlar hakkındaki eylem planlarının araştırmacı tarafından iyi irdelenmesi gerekecektir.
• Veri derleme araçlarının neler olduğu tespit edilmelidir. Ünitenin izleyen kesiminde veri derleme
araçları hakkında size bilgi verilecektir. Veri derleme aracının kullanımı konusunda veriyi derleyen
kişilere mutlaka eğitim verilmiş olması gerekir.
• Ölçme aracının nasıl kullanılacağını veri derleme işlemini yürütenlere açık ve yalın bir biçimde
anlatılmalıdır.
• Araştırmada yer alan tüm paydaşların araştırmanın evreni, varsa örneklemi, kullanılacak değişken-
ler ve bunların ölçme düzeyleri konusunda ayrıntılı bilgileri olmalıdır.
• Verinin derlenmesi aşamasında veri derleme aracının türüne göre farklılıklar olmakla birlikte, der-
lenen verinin nasıl kayıt altına alınacağı tespit edilmelidir. Örneğin nüfus sayımlarında görüşme-
cilere görüşme yapacakları bireylerden alacakları bilgileri içeren bir soru formu verilmektedir. Bu
form görüşmeci tarafından el ile doldurulmaktadır. Görüşme sonunda görüşmecinin bu formu
dikkatli bir biçimde araştırmacıya ulaştırana kadar saklaması gerekecektir.
• Günümüz teknoloji çağında elektronik ortamlarda derlenen verilerin hangi ortamda saklanacakla-
rının ve bu veri ortamlarının güvenliklerinin nasıl sağlanacağının açıkça belirtilmesi gerekir.
• Veri derleme sürecinde eğer kişilerin bireysel bazı özellikleri hakkında bilgiler derleniyor ise bu verilerin
kişisel verileri koruma kanunlarına göre nasıl işleneceği ve saklanacağının da tespit edilmesi gerekir.
• Derlenen verilerin araştırmacıya ulaşması ile (araştırmacının kendisi de veri derleyici olabilir) bu
verinin nasıl düzenleneceği, ne tür tablo ve grafikler ile gösterileceği tespit edilmelidir.
Yukarıda sıralanan ilke ve kurallardan görüldüğü gibi veri derleme, araştırmacı için kolay bir süreç
değildir. Veri derleme sürecinde meydana gelen hata ve yanlışlar araştırmanın güvenilirliğini oldukça
etkileyecektir.
30
2
İstatistik I
kendileri veya kendilerini temsil eden bireyler yardımıyla yürütmeyi tercih edebilecektir. Burada araştır-
macının temel görüşü, amacı en iyi bilen kişinin kendisi veya kendisini temsil eden birey olduğundan en
doğru verinin, en uygun araçlar ile elde edildiğinden emin olunması isteğidir. Aynı amaca yönelik daha
önceki çalışmalarda elde edilen verilerin derlenme süreçlerine dair yeterince bilgi sahibi olunmaması du-
rumunda, araştırmacı bu geçmiş verileri kullanma konusunda çekimser davranabilir. Veri araştırmacının
düşündüğü doğru veri kaynağından derlenmemiş olabilir, kayıt süreçleri araştırmacının istediği özene
sahip olmayabilir. Dolayısıyla var olan verilere güvenemeyen araştırmacılar veriyi doğrudan derleme
yaklaşımına giderler. Kimi durumlarda ise araştırmacının amacına yönelik tespit ettiği değişkenlere dair
önceden derlenmiş bir veri olmayabilir. Böyle bir durumda araştırmacının tek seçeneği veriyi doğrudan
derleme olabilecektir. Verinin veri kaynağından doğrudan derlenmesi işlemine birinci elden veri derle-
me adı verilir.
Birincil veri derleme çalışmalarında veri derleme ilke ve kurallarına sıkı bir şekilde uyulması durumun-
da araştırmacı amacına uygun en doğru bilgiyi elde edebilme şansına sahip olacaktır. Birinci elden veri der-
leme çalışmalarında araştırmacının verinin derlendiği birimin doğru birim olduğu, ölçme aracının doğru
olduğu ve ölçme sonucunun doğru olarak kayıt altına alındığına dair güveni yüksek olacaktır. Ancak yine
de araştırmacının kontrolü altında olmayan bazı hatalar veri derleme sürecinde ortaya çıkabilir. Bu hatalara
rassal hatalar adı verilir. Benzer biçimde birinci elden veri derleme çalışması sırasında ölçme işlemini ger-
çekleştiren ölçme aracının sistematik olarak belirli değerleri yanlış kaydetmesi ile de hatalar ortaya çıkabilir.
Örneğin ölçme işlemi bir birey tarafından yürütülüyor ise bu birey önyargılı veya özensiz bir biçimde veri
kayıt işlemini yürütebilir. Dolayısıyla ilgili kayıtlar sistematik bir yanlılık içerebilecektir. Bazı durumlarda
veri derleme sırasında verinin elde edildiği birimin yaklaşımları farkında olunmadan araştırmacının der-
lediği veriyi etkileyecektir. Örneğin bir araştırmada yaş değişkeni ile çalışıldığını varsayalım. Araştırmada
yer alan birimin yaşını tespit etmek için iki ayrı yaklaşıma gidebilirsiniz. Birinci yaklaşımda katılımcının
doğrudan doğum tarihini öğrenirsiniz. Daha sonra veriyi analiz ederken araştırmacı katılımcının yaşını
hesaplayabilir. Katılımcının doğru doğum tarihini verdiği varsayımı altında araştırmacı yaş değişkeni hak-
kında doğru bilgiyi elde ettiğini düşünecektir. Ancak diğer duruma bakalım, bu durumda ise araştırmacı
doğum tarihi yerine doğrudan yaş bilgisini katılımcıdan istesin. Şöyle bir düşünün doğrudan yaş bilgisi
istendiğinde soruyu yanıtlayan bireyin aslında 41 olan yaşını 40’a yuvarlayıp yuvarlamadığını veya aslında
39 yaşında olan birinin yaşını 40’a veya 35’e yuvarlayıp yuvarlamadığını nasıl bilebilirsiniz. Dolayısıyla
doğrudan birinci elden veri derleme sürecinde en doğru bilgiye ulaştığınızı zannederken aslında gerçek
değerlerden uzaklaşıyor da olabilirsiniz. Her ne kadar birinci elden veri derleme işlemi en doğru bilgiye
gidilen en iyi seçenek gibi gözükse de araştırmacının elinde olmayan birçok nedenden dolayı tam, eksiksiz
ve yüzde yüz doğru bir veri derlenmemiş olabileceği unutulmamalıdır.
Birinci elden veri derlemenin tercih edildiği çalışmalarda farklı yöntemler kullanılabilir. Birinci elden
veri derleme yöntemlerinden bazıları ünitenin izleyen kesiminde ele alınmıştır.
Gözlem
Türk Dil Kurumunun güncel Türkçe sözlüğünde gözlem için “bir nesnenin, olayın veya bir gerçeğin,
niteliklerinin bilinmesi amacıyla, dikkatli ve planlı olarak incelenmesi” tanımlaması yapılmaktadır. İstatis-
tiksel araştırmalarda da yapılan aslında bu işlemdir. İlgili değişkenin aldığı değerleri tespit etmek amacıyla
araştırmada yer alan birimlerden ölçüm sonuçları elde edilmektedir. Yine gözlem için Türk Dil Kurumu
“çeşitli araç ve gereçlerin yardımıyla olayların sebeplerini bilmek için uygulanan bilimsel yöntem” tanımla-
masına yer verilmektedir. Dolayısıyla gözlem hem elde edilen sonuçları hem de bu sonuçlara ulaşmak için
izlenen yöntemi ifade eden geniş bir anlam bütünlüğüne sahiptir.
Gözlem çalışmalarında gözlem işlemini yürüten birime gözlemci adı verilir. Gözlem araştırmaları göz-
lemcinin ölçme sürecine fiziksel olarak yaptığı katkının türüne göre iki başlık altında ele alınmaktadır.
Eğer gözlemci ölçümlenen değişken hakkında bilgi derlenirken ilgili ortamda birebir olarak yer alıyorsa bu
duruma katılımlı gözlem adı verilir. Ancak eğer gözlemci ilgili değişkenden bilgi derlenirken fiziksel olarak
o ortamda yer almıyor ise bu duruma katılımsız gözlem adı verilir.
31
2
Veri Derleme ve Düzenleme
Katılımlı gözlem çalışmalarında gözlemci veri derleme işlemi gerçekleşirken o anda sistem içerisinde
yer alacaktır. İlgili değişken hakkında elde edilen gözlem sonucunu etkileyebileceği düşünülen tüm fizik-
sel etkilerin birebir tanığı olunur. Bu durumda gözlemci ölçüm sürecinin bir parçası haline gelmiş olur.
Eğer ölçüm sürecinde bir hata ortaya çıkıyorsa bu hatanın görülmesi ve değişken sonucunun kayıt altına
alınmadan önce hatanın düzeltilmesi şansı katılımlı gözlem için bir üstünlük yaratmaktadır. Örneğin bir
fabrikada çalışma koşullarının iyileştirilmesi çalışması yürütüldüğünü düşünelim. Muhtemelen böyle bir
çalışmaya ihtiyaç duyulmasının sebebi çalışanlardan gelen şikayetlerin üst yönetim tarafından dikkate alın-
ması olacaktır. Böyle bir çalışmada üst yönetimden bir kişi gözlemci olarak görevlendirilerek belirli bir süre
için, örneğin 2 ay, çalışanların en çok şikayetçi oldukları ortamda yer alabilir. Yönetici önceden kendisine
bir nitel değişkenin aldığı değerler olarak iletilen şikayetleri yerinde gözlemleyerek, hatta sürecin bir çalışa-
nı haline gelerek, şikâyet nitel değişkeni hakkında veri derleyebilir. Böyle bir problemde yönetici sistemin
bir doğal gözlemcisi veya sürecin aktif çalışan katılımcı gözlemcisi haline gelecektir.
Katılımsız gözlem çalışmalarında gözlemci fiziksel olarak üzerinde çalışılan değişkene ait veri derleme
sürecinde birebir yer almaz. Bu tür çalışmalarda ölçümü yapılan olgu hakkında bilgi edinilirken çalışmaya
katılan bireyler gözlemlendikleri ortamda normal hayatlarına devam ederler. Gözlemci sürecin bir parçası
olmaz ama sürecin genel akışını izleyerek kayıt altına alır. Örneğin, teneffüse çıkan öğrencilerin birbirleri
ile olan etkileşimleri kameralar yardımıyla incelenebilir. Katılımsız gözlem çalışmalarında katılımcılar göz-
lem altında olduklarını bilebilir veya bilmeyebilir. Bu tamamen araştırmacının araştırma düzeni ile ilişkili
olacaktır. Ancak her iki durumun özellikle sosyal araştırmalarda katılımcılara açıklanmış olması gerekir.
Örneğin bir işe başvuru görüşmesinde 10 adet başvuru sahibi bir salona alınarak takım çalışması biçiminde
bir problemi çözmeleri istenebilir. Bu gruba bir problem verilir ve belirli bir süre içerisinde bu problemi
çözmeleri için zaman tanınır. Daha sonra grup yalnız bırakılır. Gözlemci bir izleme istasyonundan ilgili
salonu tüm açılardan gören ve seslerin duyulmasına olanak veren bir sistem yardımıyla adayların problem
çözme ve takım çalışmasına ilişkin davranışlarını kayıt altına alır. İlgili gözlemler ve gözlem sonucunda elde
edilen bilgiler yardımıyla bir sonraki iş görüşmesi aşamasına çağrılacak adaylar tespit edilir. Şekil 2.1’de bir
üretim sahasını gözlemleyen ve sürecin doğru işlediğini tespit etmeye çalışan bir gözlemci yer almaktadır.
Görüşme
Görüşme bir konuyla ilgili olarak fikir alışverişinde bulunma işlemidir. Görüşme iki birey arasında
olabileceği gibi grup-birey, birey-grup, grup-grup biçimlerini de alabilir. Görüşme, araştırmacının amacına
32
2
İstatistik I
uygun verilerin derlenmesi için, verinin derleneceği birimler ile yürütülür. Görüşme yöntemini kullanan
araştırmacı görüşme yaptığı birimlerden veri derleme işlemi için görüntü-ses kayıt sistemleri, bilgisayara
kaydetme veya klasik kâğıt kalem ile yazılı olarak kayıt altına alma yöntemlerini kullanabilir.
Görüşme işlemi dikkat ve özen isteyen bir süreçtir. Görüşmecinin görüşme yaptığı birey üzerinde baskı
yaratmaması ve görüşülen bireyin görüşlerini özgür bir ortamda ifade edebildiğini hissedebilmesi gere-
kir. Aksi takdirde görüşmeden beklenen fayda miktarı azalacaktır. Görüşmecinin beden dili görüşmenin
kalitesini dolayısıyla görüşmeden elde edilmesi beklenen bilginin miktar ve kalitesini de etkileyecektir.
Dolayısıyla görüşme için önceden sıkı bir hazırlık sürecine ihtiyaç duyulur bu süreç kapsamında görüşme
sırasında amaca dair bilginin elde edilmesi için nasıl bir yöntem izleneceğine karar verilir. Görüşme fiziki
olarak aynı ortamda olabileceği gibi kitle iletişim araçları yardımıyla da gerçekleştirilebilir. Şekil 2.2’de bir
Internet ortamında bilgisayar aracılığıyla gerçekleşen bir görüşme gösterilmektedir.
Görüşme, görüşme sırasında veri derleme yöntemine göre farklı sınıflarda ele alınabilir. Görüşme için
kullanılan bazı sınıflamaları inceleyelim. Görüşme yapılandırılmış, yarı-yapılandırılmış veya yapılandırıl-
mamış görüşme sınıflarında ele alınabilir.
Yapılandırılmış görüşmelerde, görüşmeci amacına yönelik olarak ölçme yapmak istediği değişkenleri
tespit ederek, bu değişkenlere dair bilgileri çeşitli sorular yardımıyla doğrudan görüşme yapılan birimden
öğrenir. Görüşmeci görüşmenin genel yapısı için bir standart belirler ve tüm görüşme bu standarda uygun
bir biçimde gerçekleştirilir. Daha önceden belirlenen sorular katılımcıya doğrudan görüşmeci tarafından
okunur ve katılımcının cevapları kayıt altına alınır. Her ne kadar birebir görüşme yapıldığı için doğru
bilgi elde etme olasılığı bu tür görüşmelerde yüksek olsa da soruları okuyup kayıt altına alan görüşmecinin
yapacağı hatalara dikkat etmek gerekir. Örneğin görüşmeci katılımcıdan gelen 4.095 T aylık ortalama
gelir bilgisini 4.000 T veya 4.100 T olarak yuvarlayarak yazabilir. Bu tür durumların önlenebilmesi için
görüşmeci eğitimi önemlidir.
Yarı-yapılandırılmış görüşmelerde görüşmecinin katılımcıdan elde etmeye çalıştığı bilgilere dair ana
fikirler veya ana temalar bulunur. Görüşmeci katılımcıya ilgili ana fikirler veya ana temalar hakkında farklı
sorular sorarak bilgi almaya çalışır. İlgili ana temanın değişik boyutlarına dair farklı sorular katılımcılara
33
2
Veri Derleme ve Düzenleme
aktarılarak alınan cevaplar kayıt altına alınır. Yarı-yapılandırılmış çalışmalarda görüşmecinin konu hakkın-
daki bilgisi ve bu bilgiyi katılımcıdan alırken izleyeceği yol hakkında çok hazırlıklı olması gerekir. Görüş-
meci ana temaları ortaya çıkarabileceği bazı soruları önceden hazırlayabilir ancak bu soruların tamamının
sorulup sorulmaması kararı tamamı ile görüşmecinin kontrolü altında olacaktır. Görüşmeci görüşmenin
genel gidişatına bağlı olarak hazır sorular dışında diğer soruları da katılımcıya yönelterek ilgili veri derleme
işlemini yürütür. Araştırmacının amacına uygun tüm verinin derlendiği kararı görüşmeci tarafından tespit
edildiğinde görüşmeye son verilir.
Yapılandırılmamış görüşmeler katılımcının belirli bir konuya dair görüşlerinin açık ve anlaşılır bir bi-
çimde elde edilmesi için gerçekleştirilen görüşmelerdir. Bu görüşmelerde görüşmecinin önceden hazırla-
dığı sorular bulunmaz. Görüşmeci sadece hangi konu hakkında veri derlemesi gerektiği hakkında bilgi
sahibidir. Görüşmecinin bilgi derleme işlemine konu olan olgu hakkındaki bilgi ve deneyimi bu tür ça-
lışmalarda büyük önem arz etmektedir. Görüşmeci görüşmenin akışını katılımcıyı rahatsız etmeyecek bir
tonlama ile ele alarak, istediği bilgiyi elde etmek için uğraşır. Burada özellikle katılımcının karakter yapısı
ve iletişim yetenekleri ile görüşmecinin karakter yapısı ve iletişim özellikleri çok ön plana çıkacaktır. Farklı
katılımcıların aynı konuyu farklı ele alma ve yorumlama yapısında olmasından dolayı görüşmecinin ama-
cına uygun bilgiyi alması için gerekli süre katılımcıdan katılımcıya farklılık gösterebilir.
Araştırmalarda görüşme yoluyla veri derleme işlemleri buraya kadar anlatılanlardan da görüldüğü gibi
zahmetli ve yoğun iş gücü gerektiren bir süreçtir. Bu sürecin tüm aşamalarının dikkatli bir şekilde planlan-
ması ve plana uygun bir biçimde yürütülmesi önem arz eder. Görüşme sırasında görüşmecinin kontrolü
altında olmayan sebeplerden dolayı ortaya çıkabilecek durumlar görüşmenin kalitesini düşürebilir.
Görüşme yöntemi ile veri derlemenin faydalarını kısaca izleyen biçimde sıralayabiliriz. İnsanlar kendi-
leri ile birebir görüşüldüğünde ister yüz yüze ister çevrim içi veya telefon ile, kendilerine yöneltilen soruları
yanıtlamaya daha çok eğilimli olabilmektedir. Burada görüşmecinin genel hal ve hareketleri önemlidir.
Katılımcı ile doğrudan etkileşim sağlandığından yanlış anlaşılmalardan dolayı ortaya çıkabilecek olan ha-
talı yanıt alma olasılığı en aza indirgenecektir. Kendisine yöneltilen soruyu anlamayan bir katılımcıya
görüşmeci tarafından soruya dair ek bilgiler verilerek sorunun anlaşılabilirliği arttırılabilir.
Soru/Anket Formu
Kimi araştırmalarda katılımcılardan elde edilecek bilgiler bir soru formu aracılığıyla elde edilir. Araş-
tırmacının ilgilendiği değişkenleri ölçmek üzere hazırlanan sorular bir soru formunda bir araya getirilerek
katılımcının formu kendisinin doldurması istenir. Bu soru formlarına anket formu, sormaca formu gibi
isimler verilmektedir. Katılımcıların kendilerine yöneltilen soruları bir form üzerinden okuyarak form
üzerine cevaplarını işlemeleri ile gerçekleşen veri derleme yöntemine anket ile veri derleme yöntemi adı
verilir. Bu yöntemde veri derleme aracı anket formu olacaktır. Araştırmacı ile katılımcı arasında bilgi
derleme sürecine katılan görüşmeci gibi bir başka birim olmayacaktır. Ancak anket formundaki soruların
katılımcılar tarafından aynı biçimde algılanabilmesi için soruların son derece dikkatli bir biçimde hazırlan-
ması gerekir. Hazırlanan anket formunda yer alan sorular için oluşturulan seçeneklerin de katılımcıların
genel özellikleri ele alınarak ortaya çıkabilecek tüm durumları içerecek biçimde hazırlanmış olması gerekir.
Anket formlarının doldurulması elektronik ortamda olabileceği gibi katılımcının önüne bırakılan basılı
bir anket formu aracılıyla olabilmektedir. Anket formları hazırlanırken kullanılabilecek farklı soru tipleri
vardır. Bunları kısaca inceleyelim.
Açık uçlu sorular; bu soru tipinde ilgilenilen değişkene dair bilgiler katılımcılar tarafından kendi özgür
ifadeleri kapsamında diledikleri gibi form üzerine yazılır. Soru formunda katılımcının tüm görüşlerini
yansıtabilmesi için yeterince boş alan bırakılması gerekir. Çok kolay bir veri derleme yöntemi olarak görü-
lebilmekle birlikte elde edilen sonuçların değerlendirilmesi ve sınıflandırılması uzun zaman alan bir soru
tipidir. Şekil 2.3’te bir açık uçlu soru örneği yer almaktadır.
34
2
İstatistik I
Seçenekleri sabit sorular; bu soru tipinde araştırmacı tarafından hazırlanan soru için çeşitli cevap se-
çenekleri yer alır. Katılımcının bu seçeneklerden kendisine uygun olanı seçmesi beklenir. Seçeneklerin
sorunun alacağı tüm değerleri içermesi gerekir. Kimi durumlarda verilen seçeneklerden çok daha farklı bir
seçeneğin ortaya çıkması beklentisi var ise seçeneklere açık uçlu bir seçenek te eklenebilir. Şekil 2.4 ve Şekil
2.5’te seçenekleri sabit soru örnekleri yer almaktadır.
Şekil 2.4 incelendiğinde aylık ortalama gelir değişkeni için dört adet seçenek yer almaktadır. Katılımcı
bu seçeneklerden birisini seçmek zorundadır. Eğer katılımcının aylık ortalama geliri verilen aralıklardan
birisinde yer almıyor ise katılımcının bu soruyu boş bırakma tehlikesi oluşmaktadır. Şekil 2.5 incelendiğin-
de ise hafta sonu için yapılacak aktivite listesinin dans, tenis, basketbol, bilardo, vb. diğer birçok seçenek
olmasına rağmen çok az seçenek içerdiğini, verilen üç seçenek dışında kalan fiziksel aktivite seçeneklerini
katılımcının kendisinin yazmasının istendiği görülmektedir.
Seçenekleri sabit sorular kendi içerisinde tek bir seçeneğin cevaplandığı sorular veya birden fazla seçeneğin
cevaplandığı sorular olarak da sınıflandırılabilir. Şekil 2.6 ve Şekil 2.7’de bu durumlara örnekler verilmiştir.
35
2
Veri Derleme ve Düzenleme
Şekil 2.6 Tek seçeneğin işaretlendiği sabit seçenekli soru (TÜİK İşgücü İstatistikleri Anketi Sorusu)
Şekil 2.6 incelendiğinde katılımcının seçmesi için dört ana faaliyet kolu verilmiştir. NACE standartlarına
göre oluşturulan bu faaliyet kolları birbirlerinden kesin özellikler ile ayrılan farklı çalışma kollarını temsil
etmektedir. Görüldüğü gibi bu tür sorularda katılımcı mutlaka verilen seçeneklerden bir tanesini seçecektir.
Şekil 2.7’de temsil edilen soru ise daha farklı bir yapıya sahiptir. Şekil 2.7’de gösterilen soruda katılım-
cıya 12 adet seçenek verilmiş ve bu seçeneklerden kendisine uyan tüm seçenekleri işaretlemesi istenmiştir.
Araştırmalarda değerlendirilmesi zor olarak görülen bir soru tipidir.
Seçeneklerin sıralandığı sorular; bu soru tipinde verilen seçeneklerin seçenek sayısına uygun bir sırala-
maya göre en iyiden en kötüye veya en çok beğenilenden en az beğenilene göre sıralanması beklenir. Örne-
ğin beş seçeneğin yer aldığı bir sıralama sorusunda katılımcının en beğendiği seçeneğe 1, en az beğendiği
seçeneğe ise 5 değerini yazabileceği bir sıralama yapması istenir. Şekil 2.7’de yer alan “hafta sonu aktivite
sorusu” istenirse sıralama sorusu biçimine kolaylıkla dönüştürülebilir. Bu soru tipinde katılımcıdan verilen
aktiviteleri kendileri için tercih ettikleri sıraya göre numaralandırmalarını bekleriz. Şekil 2.8’de seçenekle-
rin sıralandığı soru örneği ünite yazarının kendi tercihlerini de yansıtacak biçimde aktarılmıştır.
36
2
İstatistik I
Katılım veya uygunluk derecelendirmeli sorular; kimi araştırmalarda katılımcılara soruda verilen ifade-
lere veya olaylara katılım düzeyleri sorulur. Bu tür sorular için ilk düzenleme Likert tarafından önerildiği
için literatürde genellikle Likert tipi sorular olarak bilinirler. Likert (1932) 5 dereceli bir uygunluk skalası
önerisi geliştirmiştir. Literatürde 3’lü ve 7’li sınıflandırmalar olsa da en çok karşılaşılan Likert tarafından
önerilen 5’li sınıflandırmadır. 5’li sınıflandırmada sıklıkla kullanılan üç uygunluk derecelendirmesi Tablo
2.1’de özetlenmiştir.
Şekil 2.9’da 5’li Likert ölçeğine göre değerlendirme istenen bir soru örneği verilmiştir.
Şekil 2.9 5’li Likert ölçeğine göre katılım veya uygunluk derecelendirme sorusu
37
2
Veri Derleme ve Düzenleme
Kurumu tarafından yayınlanan raporlar, oda anketleri ve endüstri raporları örnek olarak gösterilebilir. Şekil
2.10’da Türkiye İstatistik Kurumu Karayolu Trafik Kaza İstatistikleri 2021 raporunda yer alan 2010-2021
Trafik Kaza İstatistikleri gösterilmektedir. İlgili veri Türkiye İstatistik Kurumu tarafından derlenmiş ve dü-
zenlenmiştir, araştırmacılar bu verileri kullanarak ileri istatistiksel analizler yürütebilirler.
Şekil 2.10 Trafik Kaza İstatistikleri, TÜİK Karayolu Trafik Kaza İstatistikleri 2021 Bülteni
Öğrenme Çıktısı
1 Veri derlemede kullanılan teknikleri ifade edebilme
VERİ DÜZENLEME
Hangi veri derleme yöntemi kullanılırsa kullanılsın elde edilen verinin amaca uygun istatistiksel tek-
nikler kullanılarak analiz edilebilmesi için düzenlenmiş olması gerekir. Özellikle araştırmacının birinci el-
den veri derlediği çalışmalarda veri derleme süreci tamamlandığında, araştırmada ilgilenilen değişkenlerin
her biri için araştırmada yer alan birim sayısı kadar gözlem değeri olacaktır. Örneğin 10 tane değişkenin
ölçümlendiği bir çalışmada, 150 müşteriden bilgi alınıyor ise her değişken için 150 adet gözlem değeri
olacaktır. Elde edilen değişken sonuçlarının daha veri derlenirken düzgün bir yapıda olmasını beklemek
doğru olmaz. Üzerinde hiçbir işlem yapılmamış ve araştırmacının veriyi derlediği biçimde kayıt altına alı-
nan veriye ham veri adı verilir. Tablo 2.2’de bir bankacının son 30 iş gününde günlük işlem yaptığı müşteri
sayısı değerleri yer almaktadır. Tablo 2.3’te ise bir yemekhanede son 20 günde çalışanlara sunulan meyve
isimleri yer almaktadır. Her iki tabloda gösterilen veriler ham verilerdir.
38
2
İstatistik I
Tablo 2.2 Bir bankacının 30 iş günü için günlük işlem yaptığı müşteri sayısı
İş Günü Müşteri Sayısı İş Günü Müşteri Sayısı İş Günü Müşteri sayısı
1 121 11 95 21 112
2 101 12 86 22 97
3 97 13 101 23 86
4 105 14 101 24 79
5 112 15 101 25 105
6 86 16 99 26 101
7 121 17 97 27 92
8 112 18 95 28 97
9 105 19 92 29 95
10 99 20 105 30 92
Ünite 1’de öğrendiklerinizi hatırlarsanız, Tablo 2.2’de yer alan değişken kesikli bir değişken iken Tablo
2.3’te yer alan değişken nitel bir değişkendir. Her iki tabloda da nispeten birim sayısı çok fazla değildir.
Varsayalım ki Tablo 2.2 ve Tablo 2.3 için bir yıllık veriyi elde edelim. Elimizde çok daha büyük tabloların
bir başka deyişle ham verinin olacağını görmeniz zor olmayacaktır. Ham verilere bakarak basit bazı istatis-
tikleri bulmak veride yer alan birim sayısı az iken kolay iken birim sayısı arttıkça bu basit istatistiklerin tes-
piti de zorlaşacaktır. Örneğin Tablo 2.2’ yer alan en küçük değer yirmi dördüncü iş günü için gözlemlenen
79 değeridir. Ünite yazarı bunu basit bir inceleme ile elde edebilmiştir. Ancak veri sayısı arttıkça en küçük
değerin bile bulunması zorlaşacaktır. Tablo 2.3’e bakalım. Son 20 gün içerisinde en çok servis edilen meyve
hangisidir? Tablo 2.3’e bakarak bir çırpıda bu sorunun cevaplanması oldukça zor olur, hatta veri sayısı bir
yıla arttırılırsa bu zorluk daha da artacaktır. Dolayısıyla ham verinin, verinin genel bazı özelliklerini de an-
layabilecek biçimde özetleyici tablolar halinde düzenlenmesi gereklidir. Ham verilerin zaman, mekân veya
ilgili değişkenin ölçme düzeyine göre sıralanmış olarak gösterilmesi ile elde edilen sayı dizilerine seri adı
verilir. Seriler dağılma serileri, zaman serileri ve mekân serileri olmak üzere üç başlık altında incelenebilir.
Dağılma Serileri
Araştırmacının ilgilendiği maddi değişkenin aldığı değerlerin değişkenin ölçme düzeylerine göre dü-
zenlenmesi ile oluşturulan seri dağılma serisi olacaktır. Dağılma serilerinin genel kabul görmüş bir yapısı
bulunmaktadır. Bu yapıya göre dağılma serilerinin birinci sütununda ilgili değişkenin ölçme düzeylerine
göre ortaya çıkan sınıflar yer alırken ikinci sütunda ilgili sınıfların verideki tekrar sayıları bir başka deyişle
frekanslar yer alır. Yapılan işlem bir çeteleme işlemidir. İlgili değişkenin birbirinden farklı düzeyleri farklı
sınıflarda sıralanarak her sınıfta yer alan birimler ham veri içerisinde sayılır. Hatırlanacağı gibi değişkenler
39
2
Veri Derleme ve Düzenleme
nicel değişkenler ve nitel değişkenler olarak ikiye ayrılmaktadır. Nicel değişkenler için oluşturulan seriler
nicel dağılma serileri olarak adlandırılırken, nitel değişkenler için oluşturulan seriler de nitel dağılma seri-
leri olarak adlandırılırlar.
Nicel değişkenler için elde edilen gözlem değerlerinin küçükten büyüğe sıralanması ile elde edilen
seriye basit seri adı verilir. Basit seriler elde edilen ham verinin araştırmacının belirlediği bir kritere göre
sıralanması ile oluşturulurlar. Nicel değişkenler için örnek olarak küçükten büyüğe sıralamayı belirtmiştik,
nicel seriler için sıralama için de örnek olarak unvan sıralamaları, eğitim düzeyi gibi özellikler kullanılabilir.
Tablo 2.2’de verilen değerleri basit seri olarak Tablo 2.4’te görüldüğü gibi düzenleyebiliriz.
Tablo 2.4 Bankacının günlük işlem yaptığı müşteri sayısı basit serisi
79 86 86 86 92 92 92 95 95 95
97 97 97 97 99 99 101 101 101 101
101 105 105 105 105 112 112 112 121 121
Tablo 2.4 düzenlemesi ile birlikte artık ilgili değişkenin en küçük değeri ve en büyük değeri gibi bazı
basit istatistikleri elde etmek son derece kolay hale gelmiştir. Ancak hâlâ değişkenin aldığı değerlerin tekrar
sayılarını göremiyoruz. Seriyi oluşturan sayıların her birine terim dersek, bu basit seride en çok tekrarlanan
terim nedir sorusu halen tam olarak cevaplanamamıştır. Dolayısıyla tekrar eden gözlemlerin tekrar sayıla-
rını içerecek biçimde basit serinin düzenlenmesi gerekmektedir.
Frekans Serisi
Basit seride yer alan birbirinden farklı değerlere sahip tüm terimleri ve bu terimlerin tekrar sayılarını
içerecek biçimde düzenlenmiş seriye frekans serisi adı verilir. Frekans serisini oluşturabilmek için basit
seride yer alan birbirinden farklı tüm değerler alt alta sıralanırlar. Daha sonra çeteleme yöntemi ile her
değerin tekrar sayısı tespit edilir. Bu tekrar sayıları frekans sütunu olarak tabloya eklenir. Tablo 2.4’te
yer alan veri için frekans serisini oluşturalım. İlgili frekans serisi Tablo 2.5’te yer almaktadır. Tablo 2.5
süreci daha iyi görebilmeniz için ünite yazarının çeteleme sütununu da içermektedir. Normal koşullar
altında frekans serilerinde bu çeteleme sütunu gösterilmez. Tablo 2.5 ilk satırına bakıldığında müşteri
sayısı değişkeninin en küçük değeri olan 79, değişken değeri sütununda yer alırken bu değerin tekrar
sayısı frekans sütununda yer alır. Frekans serilerinin gösteriminde değişken için ve frekans için de f sem-
bolü kullanılır. Frekans serilerinin son satırında toplam birim sayısının ifade edilebilmesi için toplam
satırına yer verilir.
40
2
İstatistik I
Tablo 2.5 Bankacının günlük işlem yaptığı müşteri sayısı için frekans serisi
İşlem Yapılan Müşteri Sayısı (X) Çeteleme Frekans (f)
79 | 1
86 ||| 3
92 ||| 3
95 ||| 3
97 |||| 4
99 || 2
101 |||| 5
105 |||| 4
112 ||| 3
121 || 2
Toplam |||| |||| |||| |||| |||| |||| 30
Tablo 2.5 yardımıyla araştırmacının basit betimsel istatistikleri üretme şansı ortaya çıkmıştır. Verinin
derlendiği bankacıya ait işlem sayıları incelendiğinde en çok işlem sayısının 121 olduğu ve bunun son bir
ayda 2 günde gerçekleştiği, en az işlem sayısının ise 79 işlem olduğu, bu durumun sadece 1 gün ortaya
çıktığı tespit edilebilmektedir. En yüksek frekans değeri olarak 5 değeri görülmektedir ve bu frekans 101
işlem değeri için tespit edilmiştir. Frekans serisi yardımıyla son 30 iş gününde bankacının işlem yaptığı
müşteri sayılarının günlere göre tekrar değerleri tespit edilmiştir.
Örnek 2.1: Bir otomobil yarışmasında katılımcıların a şehrinden b şehrine tüm trafik kurallarına uya-
rak en kısa sürede gitmeleri beklenmektedir. Yarış sonunda 50 katılımcının yarışı tamamlama süreleri
dakika olarak
53 48 50 50 47 54 49 46 50 48 50 51 51 52 46 47 51 53 51 53 49 50 48 48 53 52 50 50 51 51 54 50 51
53 53 51 48 49 49 49 49 51 49 51 54 51 50 52 48 49
biçiminde ham veri olarak kayıt altına alınmıştır. Yarışı bitirme süresi değişkeni için frekans dağılımını
oluşturunuz?
Çözüm:
Bu çalışmada ilgilenilen değişken yarış bitirme süre değişkenidir. Öncelikle elimizdeki değerleri küçük-
ten büyüğe izleyen biçimde sıralayarak basit serimizi elde edelim:
46 46 47 47 48 48 48 48 48 48 49 49 49 49 49 49 49 49 50 50 50 50 50 50 50 50 50 51 51 51 51 51 51
51 51 51 51 51 52 52 52 53 53 53 53 53 53 54 54 54
Basit serinin oluşturulması ile birbirinden bağımsız olarak ortaya çıkan tüm değişken sonuçları/sınıfla-
rı/seviyeleri (46, 49, 50, vb.) kolaylıkla görülebilir hale gelmiştir. Şimdi frekans serimizi Tablo 2.6’da görül-
düğü gibi oluşturabiliriz. Her terimin tekrar sayıları çeteleme ile tespit edilir. Küçükten büyüğe sıralanmış
basit seri bize bu çeteleme işinde yardımcı olmaktadır. Frekans serisini oluştururken basit seride saydığınız
her terimin altına bir çizgi atarak (46, 46, 47, 47, vb.) ilgili terimin değerinin frekans serisi içinde yer aldı-
ğından emin olabilirsiniz. Tablo 2.6’da çeteleme işlemine yer verilmemiştir.
41
2
Veri Derleme ve Düzenleme
42
2
İstatistik I
Tablo 2.7 incelendiğinde her bir satırın bir değer aralığından oluştuğu görülmektedir. Bu değer aralık-
larının her birine sınıf adı verilir. Tablo 2.7’de toplam 5 sınıf ve 75 adette birim bulunmaktadır.
Gruplandırılmış frekans serisinin oluşturulması için kullanılacak birçok teknik bulunmaktadır. Ünite
kapsamında size Sturges kuralı gösterilecektir. Ancak Sturges kuralı ile gruplandırılmış frekans serisi oluş-
turma adımlarına geçmeden önce kesikli değişken ve sürekli değişkenlerin gösterimi için gruplandırılmış
frekans serisine ihtiyaç duyulması durumunda gruplandırılmış frekans serisinin gösterim biçimi hakkında
bilgi vermemiz gereklidir.
Kesikli ve sürekli değişkenlerin gruplandırılmış frekans serilerinin gösteriminde sınıf alt ve üst nok-
talarının temsil ettiği değerler bakımından farklılık bulunmaktadır. Tablo 2.7’de yer alan değişken paket
ağırlığı (gram) değişkenidir. Bu değişken sürekli nicel değişkendir. Sürekli değişkenler için gruplandırılmış
frekans serisi oluşturulurken sınıfların üst sınır değeri izleyen sınıfın alt sınır değeri olarak yazılır. Sınıfla-
rın üst sınır değeri ifade edilen değere karşılık gelen gözlemleri içermez, en yakın değeri kapsar. Örneğin,
Tablo 2.7’de 30 – 40 sınıfının üst sınırı 40 – 50 sınıfının alt sınırı olarak alınmaktadır. 30 – 40 sınıfını ele
alalım. Bu sınıf, bu sınıfın üst sınırı olarak tespit edilen 40 değerine sahip terimleri içermez, bu değere en
yakın değer olan değerine sahip birimi kapsar. Değeri tam olarak 40’a eşit olan terimler bir sonraki sınıf
olan 40 – 50 sınıfı içerisinde sayılırlar. Matematiksel olarak ifade edersek sürekli nicel değişkenlerde tüm
sınıflar için sınıf alt sınırı kapalı aralık iken sınıf üst sınırı açık aralık, dolayısıyla sınıf aralığı yarı açık aralık,
örneğin [20 – 30) olacaktır. Ancak kesikli değişkenler için oluşturulan gruplandırılmış frekans serisinde
durum daha farklıdır. Kesikli değişkenlerde her sınıf aralığı kapalı aralık olarak yazılır. İlgili sınıfın alt ve
üst sınır değerlerine eşit değer alan terimler ilgili sınıfın birimi olarak sayılırlar. Tablo 2.8’de kesikli değiş-
ken için oluşturulan gruplandırılmış frekans serisi gösterilmiştir.
Tablo 2.8’den de görülebileceği gibi kesikli değişkenlerde sınıf alt sınırı bir önceki sınıfın üst sınırından
sonra gelen ilk tamsayı olarak ele alınmaktadır. Örneğin, 6 – 10 sınıfının alt sınırı bir önceki sınıfın üst
sınırından sonra gelen ilk tamsayıdır (5 + 1 = 6). Dolayısıyla kesikli değişkenler için oluşturulmuş grup-
landırılmış frekans serilerinde sınıf aralıkları kapalı aralık olmaktadır. 1, 2, 3, 4 ve 5 kredi işlemleri birinci
sınıf içerisinde yer alır.
Gruplandırılmış frekans serilerinde ikinci sınıf alt sınırı ile birinci sınıf alt sınırı arasındaki fark değeri
sınıf aralığı olarak tanımlanır. Örneğin Tablo 2.7 için sınıf aralığı (20 – 10 =10) iken Tablo 2.8 için sınıf
aralığı (6 – 1 =5) olacaktır. Gruplandırılmış frekans serilerinde tüm sınıfların sınıf aralıklarının eşit olması
tercih edilir. Zorunlu bazı hallerde bazı sınıfların sınıf aralığı diğer sınıf aralıklarından büyük olabilir. Böyle
bir zorunluluğun ortaya çıkması durumunda sınıf aralığı keyfi olarak genişletilmemeli, sınıf aralığı orijinal
sınıf aralığının katları biçiminde arttırılmalıdır. Kimi diğer durumlarda da ilk sınıfın alt sınırı veya son
sınıfın üst sınırı açık olabilir. Örneğin son sınıf “45 ve üzeri” olarak tanımlanabilir.
Şu ana kadar gösterilen gruplandırılmış frekans serileri sizlere ünite yazarı tarafından hazır olarak veril-
miştir. Şimdi araştırmada basit seri yardımıyla gruplandırılmış frekans serisi oluşturma adımlarını incele-
yelim. Ünite kapsamında gruplandırılmış frekans serisi oluşturmak için yaklaşık sınıf aralığını belirlemek
üzere Sturges kuralı kullanılacaktır.
43
2
Veri Derleme ve Düzenleme
• Sturges kuralı ile elde edilen ve kullanılması önerilen sınıf aralığı değeri 2, 5, 10, … gibi algılanması
kolay, araştırmacıya uygun gelen tamsayıya yuvarlanır. Örneğin, sınıf aralığı eşitlikten 8,45 olarak
elde edilir ise sınıf aralığı olarak 10 kullanılabilir.
• İlk sınıf başlangıç değerine karar verilir. Birinci sınıfın başlangıç değeri verinin en küçük değerine
eşit veya bu değerden daha küçük ancak Sturges kuralı ile elde edilen sınıf aralıklarının oluşturul-
masında kolaylık sağlayacak rakam olarak belirlenir. Örneğin Sturges kuralı 10 sınıf aralığı önerdi
ise ve serinin en küçük değeri 13 ise ilk sınıf başlangıç değeri 10 olarak alınabilir. Burada dikkat
edilmesi gereken nokta ilk sınıf içerisinde mutlaka en küçük değerin olması gerekliliğidir. Eğer en
küçük değer ilk sınıfta değilse sınıf başlangıç noktası en küçük değere daha yakın bir değer olarak
tespit edilebilir.
• İlk sınıf alt limiti belirlendikten sonra değişkenin kesikli veya sürekli olması durumu göz önüne
alınarak seride yer alan tüm terimler mutlaka bir sınıfta yer alacak şekilde yeterince sınıf oluştu-
rulur. Serideki en büyük değer gruplandırılmış frekans serisinin son sınıfında yer aldığında sınıf
oluşturma işlemi tamamlanır.
• Değişkenin kesikli veya sürekli olması durumu göz önüne alınarak sınıflardaki gözlem değerleri
sayılarak frekans sütununa eklenir.
Gruplandırılmış frekans serileri verinin anlaşılır bir özet yapısının gösterilmesinde çok faydalı olacağın-
dan, sınıf sınırlarının anlaşılır ve kolay işlem yapmaya elverişli rakamlardan oluşması önem arz etmektedir.
Gruplandırılmış serinin en büyük dezavantajı sınıf içerisinde yer alan terimlerin gerçek değerlerinin gerçek
frekans serisi elimizde olmadığı durumlarda kaybedilmiş olmasıdır. Örneğin bir başka araştırmadan ilgi-
lendiğiniz değişkene dair bir gruplandırılmış frekans serisi verisi alırsanız, o serinin her sınıfında değerlerin
nasıl dağıldığı bilgisine sahip olmazsınız. Mesela, sadece Tablo 2.8’e bakıldığında 21 – 25 sınıfında 21 adet
gözlem olduğunu bilmek ile beraber bu gözlemlerin gerçek değerleri bilgisi kaybedilmiş olur. Bu aralıkta
“kaç tane 21 veya kaç tane 22 var” bilgisi kaybedilmiştir. Bu özelliğinden dolayı zorunlu haller dışında
gruplandırılmış frekans serileri değişken hakkında özet bilgi verme özelliği dışında istatistiksel hesaplama-
larda çok fazla tercih edilmezler.
Örnek 2.2: Sürekli değişken için bir örnek inceleyelim. Bir işveren çalışanlarına servis hizmeti sağ-
layabilmek için 100 çalışanın ikamet adreslerden işyerine olan günlük toplam seyahat mesafelerini kayıt
altına almıştır. İşverenin toplam seyahat mesafesi değişkeni için gruplandırılmış frekans serisi oluşturalım.
İşveren ham veriyi Tablo 2.9’da görülen frekans serisi haline getirmiştir.
Tablo 2.9 İşçilerin ikametleri ile işyeri arasındaki toplam seyahat mesafesi (km.) frekans serisi
X 26 30 31 32 33 34 35 36 38 40 41 42 43 44
f 1 2 1 2 2 1 3 1 2 1 2 5 2 10
X 45 46 47 48 49 51 52 53 54 55 56 57 58 60
f 4 1 2 3 4 4 2 1 6 6 1 3 3 3
X 61 62 63 64 66 67 68 69 73 76
f 1 4 2 1 2 2 1 5 3 1
44
2
İstatistik I
Çözüm: Tablo 2.9’dan görüldüğü gibi frekansı 1 olan çok fazla değer olduğu için frekans serisi büyük
bir yapıya sahiptir. Bu değişken için gruplandırılmış frekans serisini oluşturalım.
• Frekans serisi Tablo 2.9’da yer almaktadır
• Sınıf aralığı
76 – 26 50
Sınıf Aralığı = = = 6,541
1+ 3,322×log10 (100) 7,644
• 6,541 olarak önerilen sınıf aralığı 10’a yuvarlanabilir. Dolayısıyla sınıf aralığını 10 alalım.
• Serinin en küçük değeri 26’dır. Sınıf aralığının 10 olarak önerildiği göz önüne alındığında ilk sınıf
başlangıç değeri olarak 25 alınabilir.
• Değişkenimizin sürekli değişken olduğu unutulmadan son sınıf en yüksek değer olan 76’yı içerecek
biçimde sınıflar belirlenir.
• Sınıflar belirlendikten sonra her sınıfta yer alan birimler çetele sistemi ile sayılır.
Bu aşamada öncelikle gruplandırılmış frekans serisi tablosuna değişkenimizi ve frekans sütunlarını yer-
leştirelim. Daha sonra da Tablo 2.9’da yer alan değerler yardımıyla sayma/çeteleme işlemini gerçekleşti-
rerek, gruplandırılmış frekans serisini tamamlayalım. İlgili gruplandırılmış frekans serisi Tablo 2.10’da
yer almaktadır. İlk sınıfın alt sınırı 25 olarak belirlendikten sonra belirlenen 10 sınıf aralığı değerine göre
en son sınıf en yüksek değer olan 76’yı da içerecek biçimde düzenleme yapıldığında 6 sınıf ile tablonun
tamamlandığı görülmektedir.
Tablo 2.10 İşçi toplam seyahat (km.) değişkeni gruplandırılmış frekans serisi
Seyahat mesafesi (km.) (X) Frekans (f)
25 – 35 1 + 2 + 1 + 2 + 2 + 1= 9
35 – 45 3 + 1 + 2 + 1 + 2 + 5 + 2 + 10= 26
45 – 55 4 + 1 + 2 + 3 + 4 + 4 + 2 + 1 + 6= 27
55 – 65 6 + 1 + 3 + 3 + 3 + 1 + 4 + 2 + 1= 24
65 – 75 2 + 2 + 1 + 5 + 3= 13
75 – 85 1=1
Toplam 100
Örnek 2.3: Kesikli değişken için bir örnek inceleyelim. Bir hastanenin acil servisini son 100 günde
ziyaret eden hasta sayıları Tablo 2.11’de verilmiştir. Hasta sayısı değişkeni için gruplandırılmış frekans
serisini oluşturalım.
Tablo 2.11 Acil servisi ziyaret eden hasta sayısı frekans serisi
X 28 30 32 33 34 35 36 37 38 39 40 41 42 43
f 2 2 2 4 5 7 3 5 3 9 7 9 12 7
X 44 45 46 47 48 49 52 53
f 5 3 3 6 1 3 1 1
Çözüm: Tablo 2.11’den görüldüğü gibi hasta sayısı kesikli değişkeni 28 ile 53 arasında değerler almak-
tadır. Bu değişken için gruplandırılmış frekans serisini oluşturalım.
• Frekans serisi Tablo 2.11’de yer almaktadır
• Sınıf aralığı
45
2
Veri Derleme ve Düzenleme
53 – 28 25
Sınıf Aralığı = = = 3,270
1+ 3,322 ×log10 (100) 7,644
• 3,270 olarak önerilen sınıf aralığı 5’e yuvarlanabilir. Dolayısıyla sınıf aralığı 5 alınabilir.
• Serinin en küçük değeri 28’dir. Sınıf aralığının 5 olarak önerildiği göz önüne alındığında ilk sınıf
başlangıç değeri olarak 25 alınabilir.
• Değişkenimizin kesikli değişken olduğu unutulmadan son sınıf en yüksek değer olan 53’ü içerecek
biçimde sınıflar belirlenir. Sınıf üst sınırları ve alt sınırları belirlenirken kesikli değişken için ifade
edilen kapalı aralık kuralına uyulur.
• Sınıflar belirlendikten sonra her sınıfta yer alan birimler çetele sistemi ile sayılır.
Bu aşamada öncelikle gruplandırılmış frekans serisi tablosuna değişkenimizi ve frekans sütunlarını yer-
leştirelim. Daha sonra da Tablo 2.11’de yer alan değerler yardımıyla sayma/çeteleme işlemini gerçekleşti-
rerek, gruplandırılmış frekans serisini tamamlayalım. İlgili gruplandırılmış frekans serisi Tablo 2.12’da yer
almaktadır. İlk sınıfın alt sınırı 25 olarak belirlendikten sonra belirlenen 5 sınıf aralığı değerine göre en
son sınıf en yüksek değer olan 53’ü içerecek biçimde düzenleme yapıldığında 6 sınıf ile tablonun tamam-
landığı görülmektedir. Hatırlanırsa sınıf aralığı ikinci sınıf alt sınırı ile birinci sınıf alt sınırı arasındaki
farktır. Dolayısıyla önce tüm sınıfların alt sınıfları 25, 30, … gibi yazıldıktan sonra sınıfların üst sınırları
bir sonraki sınıfın alt sınırına bakılarak uygun 29, 34, … gibi tamsayılar yardımıyla oluşturulur ise hata
yapılma olasılığı azalır.
Tablo 2.12 Acil servisi ziyaret eden hasta sayısı gruplandırılmış frekans serisi
Oransal Seri
Frekans serilerinde veya gruplandırılmış frekans serilerinde araştırmacı frekans değerlerine ek olarak
ilgili sınıfın toplam birim sayısı içindeki oranı ile de ilgilenebilir. Frekans değerleri ile birlikte oranlarında
yer aldığı seriler oransal seriler olacaktır. Daha önceden belirtilen teknikler kullanılarak öncelikle serinin
frekans serisi veya gruplandırılmış frekans serisi oluşturulur. Daha sonra frekans sütunu yanına oransal
frekans sütunu açılarak, oranlar hesaplanır. Hesaplanan oranlar yüzdelik olarak yorumlanır. Oransal fre-
kanslar araştırmacının tercihine göre ondalıklı değer olarak gösterilebileceği gibi yüzdelik olarak da göste-
rilebilir. Tablo 2.13 ve Tablo 2.14’de her iki durumda ifade edilecektir.
Ünitenin önceki kesimlerinde incelediğimiz ve Tablo 2.6’da oluşturduğumuz yarış tamamlama frekans
serisini oransal frekans serisine dönüştürelim. Oluşturulan oransal frekans serisi Tablo 2.13’te yer almak-
tadır. Tablo 2.13’ten de görüldüğü gibi Tablo 2.13’te yer alan her frekans değeri toplam birim sayısı olan
50’ye bölünerek oransal frekanslar elde edilmiştir.
46
2
İstatistik I
Tablo 2.13 Yarış tamamlama süresi değişkeni için oransal frekans serisi
Yarış Tamamlama Süresi (X) Frekans (f) Oransal Frekans Yüzde
46 2 2/50=0,04 %4
47 2 2/50=0,04 %4
48 6 6/50=0,12 %12
49 8 8/50=0,16 %16
50 9 9/50=0,18 %18
51 11 11/50=0,22 %22
52 3 3/50=0,06 %6
53 6 6/50=0,12 %12
54 3 3/50=0,06 %6
Toplam 50 1 100
Benzer biçimde oransal frekanslar gruplandırılmış frekans serileri içinde oluşturulabilir. Daha önce
Tablo 2.2’de incelediğimiz paket ağırlığı değişkeni için oluşturulan gruplandırılmış frekans serisi için oran-
sal frekansları hesaplayalım. Bu amaçla her sınıfın frekansı toplam birim sayısı olan 75’e bölünerek işlem-
leri tamamlayabiliriz. İlgili oransal frekans serisi Tablo 2.14’de yer almaktadır.
Tablo 2.14 Paket ağırlığı değişkeni için oransal gruplandırılmış frekans serisi
Paket Ağırlığı (gram) (X) Frekans (f) Oransal Frekans Yüzde
10 – 20 10 10/75 = 0,133 %13,3
20 – 30 15 15/75 = 0,200 %20
30 – 40 20 20/75 = 0,267 %26,7
40 – 50 17 17/75 = 0,227 %22,7
50 – 60 13 13/75 = 0,173 %17,3
Toplam 75 1 100
47
2
Veri Derleme ve Düzenleme
Tablo 2.15 Artan birikimli frekans ve artan birikimli oransal frekans serileri
Yarış Tamamlama Artan Birikimli Oransal
Frekans (f) -den az Oransal Frekans
Süresi (X) Frekans
46 2 2 2/50 = 0,04 0,04
47 2 2+2=4 2/50 = 0,04 0,04 + 0,04 = 0,08
48 6 6 + 4 = 10 6/50 = 0,12 0,12 + 0,08 = 0,20
49 8 8 + 10 = 18 8/50 = 0,16 0,16 + 0,20 = 0,36
50 9 9 + 18 = 27 9/50 = 0,18 0,18 + 0,36 = 0,54
51 11 11 + 27 = 38 11/50 = 0,22 0,22 + 0,54 = 0,76
52 3 3 + 38 = 41 3/50 = 0,06 0,06 + 0,76 = 0,82
53 6 6 + 41 = 47 6/50 = 0,12 0,12 + 0,82 = 0,94
54 3 3 + 47 = 50 3/50 = 0,06 0,94 + 0,06 = 1
Toplam 50 1
Tablo 2.15 kullanılarak üretilebilecek bilgilerden bazılarını izleyen biçimde sıralayabiliriz. Değeri 50
ve 50’den az 27 birim vardır. Yarış tamamlama süresi 48 ve 48 dakikadan az araç oranı 0,20’dir. Araçların
%76’sı yarışı 51 dakika veya daha az sürede tamamlamaktadır.
Serilerde belirli bir değere eşit veya daha büyük değer alan birimlerin sayısını veya oranını göstermek
için azalan birikimli frekanslar veya azalan birikimli oransal frekanslar kullanılır. İstatistiksel çalışmalarda
azalan birikimli frekanslar “-den çok” sütunu ile adlandırılırlar. Azalan frekansları oluşturmak için önce
toplam frekans ilk sınıfın karşılığına yazılır. İkinci sınıfın azalan birikimli frekansı ilk sınıfta yer alan top-
lam frekans değerinden ilk sınıfın frekansının çıkarılması ile bulunur. İşlem bütün sınıfların azalan biri-
kimli frekansları veya azalan oransal frekansları bulununcaya kadar devam eder.
Tablo 2.16 Azalan birikimli frekans ve azalan birikimli oransal frekans serileri
48
2
İstatistik I
Tablo 2.16’da yer alan azalan birikimli frekans ve birikimli oransal frekans değerleri kullanılarak üre-
tilebilecek bilgilerden bazılarını sıralayalım. Değeri 49 ve 49’dan daha büyük birim sayısı 40’tır. Yarışı
tamamlama süresi 50 dakika ve daha üzeri olan araç oranı %64’tür.
Birikimli frekanslar gruplandırılmış frekans serileri içinde oluşturulabilir. Gruplandırılmış frekans se-
rilerinde değişkenin sürekli veya kesikli olması durumuna dikkate edilerek sınıf alt sınır ve üst sınır değer-
lerine göre yorumlamalar yapılabilir. Tablo 2.17’de sürekli bir değişken için oluşturulan birikimli seriler
gösterilmektedir.
Tablo 2.17 Sürekli nicel gruplandırılmış değişken serisi için birikimli seriler
49
2
Veri Derleme ve Düzenleme
Öncelikle Tablo 2.18’de yer alan meyve değişkeninin ölçme düzeyi sınıflayıcı ölçektir. Bu değişkenin
Tablo 2.18’e göre aldığı farklı değerleri Tablo 2.19’da gösterildiği gibi bir araya getirelim. Her meyve seçe-
neği için frekans ve oransal frekansları hesaplayarak Tablo 2.19’a ekleyelim.
Tablo 2.19 yardımıyla son 20 günde en yüksek oranın %30 ile Armut meyvesine ait olduğu bilgisini
tespit edebiliriz.
Mekân Serisi
Araştırmacının üzerinde çalıştığı değişkene ait değerlerin mekâna göre sınıflandırılması ile ortaya çıkan
serilere mekân serileri adı verilir. Mekân serilerinin ana bileşeni öncelikle üzerinde çalışılan değişkenin iliş-
kilendirildiği mekânsal özelliğin sınıflandırılmasıdır. Örneğin, Türkiye’de üniversitelerde hizmet vermekte
olan profesör sayılarının incelendiği bir çalışmada mekân kısıtlaması için şehir bilgisi kullanılabileceği
gibi, Türkiye’nin yedi coğrafi bölgesi veya Türkiye İstatistik Kurumu tarafından tanımlanmış olan düzey
bilgileri de (Örneğin, Düzey 1-12 alt bölge, Düzey 2-26 alt bölge) kullanılabilir. Önemli olan ilgilenilen
değişkenin aldığı değerin sadece bir mekânsal bölgede sayılıyor olması gerekliliğidir. Aynı birimi birden
fazla mekânsal ayrım için kullanmamız doğru olmaz. Mekân serileri hem frekansları hem de oransal fre-
kansları içerecek biçimde hazırlanabilir.
Mekân serisine örnek olarak Türkiye’de 2021 yılında gerçekleşen ve İstatistiki bölge birimleri sınıfla-
masına göre düzenlenmiş boşanma sayıları gösterilebilir. İlgili mekân serisi Tablo 2.20’de yer almaktadır.
50
2
İstatistik I
Tablo 2.20 İstatistiki Bölge Sınıflamasına göre 2021 yılı boşanma sayıları (TÜİK),
Bölge Boşanma Sayısı Oransal Frekans
TR1 İstanbul 34.631 0,198
TR2 Batı Marmara 8.620 0,049
TR3 Ege 28.782 0,165
TR4 Doğu Marmara 18.931 0,108
TR5 Batı Anadolu 20.366 0,117
TR6 Akdeniz 26.319 0,151
TR7 Orta Anadolu 9.028 0,052
TR8 Batı Karadeniz 8.645 0,050
TR9 Doğu Karadeniz 3.850 0,022
TRA Kuzeydoğu Anadolu 2.006 0,011
TRB Ortadoğu Anadolu 4.017 0,023
TRC Güneydoğu Anadolu 9.430 0,054
Toplam 174.625 1,000
Tablo 2.20’ye göre en çok boşanma TR1 bölgesinde gerçekleşirken, en az boşanma ise Kuzeydoğu Ana-
dolu bölgesinden meydana gelmiştir. Ancak burada verilen değerler doğrudan boşanma sayısı değerleridir.
İlgili bölgelerde bulunan toplam nüfus dikkate alınmamıştır. Bölgelere göre boşanma değişkeni bakımın-
dan farklılık olup olmadığını incelemek için bölge nüfuslarının da değerlendirilmesi daha doğru olacaktır.
Zaman Serisi
Kimi problemlerde araştırmacının ilgilendiği değişken olan zaman değişkeni uygun ölçme düzeyleri ile
eşleştirilebilir. Örneğin aylara göre doğum sayısı, haftalara göre ziyaret edilen okul sayısı, bir web sayfasının
saatlik ziyaretçi sayısı gibi durumlar zaman serisine örnek teşkil edecektir. Dikkat edilirse tüm örneklerde
ölçümlenen değişken zaman değişkeninin hafta, ay, gün, saat vb. uygun bir ölçme düzeyi ile eşleşmektedir.
Zaman serileri gösterilirken ilk sütunda zaman değişkeninin aldığı değerler kronolojik olarak sıralanır.
Örneğin aylara göre satış değerleri ile ilgileniliyor ise ocak ayından aralık ayına kadar tüm aylar alt alta sı-
ralanır. Daha sonra ikinci sütunda zaman değişkeni ile eşleştirilmiş ve araştırmacının ilgilendiği değişkenin
aldığı değerler yer alır. Zaman değişkeni ile bağlantılı çalışılan araştırmacının üzerinde durduğu değişke-
nin uzun dönemli hareketlerinde zamana göre bir değişiklik olup olmadığının gözlemlenmesinde zaman
serisi önem arz etmektedir. Uzun dönemde bir zaman serisinde ilgilenilen değişkene ait gözlem değerleri
yardımıyla değişkenin değerlerinde bir artış ya da azalış olup olmadığı gözlemlenebilir. Ek olarak zaman
serisi ilgili değişkenin mevsimsel bir dalgalanma veya konjoktürel bir dalgalanma yaşayıp yaşamadığının
tespitine de yarar. Örneğin kış aylarında dondurma satışı düşüyor ve yaz aylarında artıyor ise dondurma
satış değişkeninin mevsimsel bir dalgalanma etkisi altında olduğu söylenebilir. Zaman serilerinde uzun dö-
nemli hareketlerin daha iyi görülebilmesi için ilgili zaman serisinin grafiğinin çizilmesi yöntemine sıklıkla
başvurulur. Grafik çizimi ile ilgili bilgiler sizlere izleyen ünitede aktarılmıştır.
51
2
Veri Derleme ve Düzenleme
Tablo 2.21’de 2021 yılında aylara göre Türkiye tüketici fiyat endeksi değerleri sunulmaktadır.
Tablo 2.21 incelediğinde Ekim 2021 tarihinden itibaren TÜFE aylık değişim oranlarının artışa geçtiği
görülmektedir.
Öğrenme Çıktısı
2 Verileri tablolar ile gösterebilme
52
2
İstatistik I
Araştırmada tanımlanan evreni oluşturan birimlerden veya bu evreni temsil ettiği düşünülen istatistiksel
analizler yardımıyla tespit edilmiş örneklem birimlerden araştırmacının belirlediği değişkenlerin aldığı de-
ğerlerin uygun ölçme araçları yardımıyla tespit edilmesi ve kayıt altına alınması sürecine veri derleme adı
verilir. Verinin veri kaynağından doğrudan derlenmesi işlemine birinci elden veri derleme adı verilir. Birincil
veri derleme çalışmalarında veri derleme ilke ve kurallarına sıkı bir şekilde uyulması durumunda araştırmacı
amacına uygun en doğru bilgiyi elde edebilme şansına sahip olacaktır. Birinci elden veri derleme çalışma-
larında araştırmacının verinin derlendiği birimin doğru birim olduğu, ölçme aracının doğru olduğu ve
ölçme sonucunun doğru olarak kayıt altına alındığına dair güveni yüksek olacaktır. Türk Dil Kurumunun
güncel Türkçe sözlüğünde gözlem “bir nesnenin, olayın veya bir gerçeğin, niteliklerinin bilinmesi amacıyla,
dikkatli ve planlı olarak incelenmesi” olarak tanımlanabilir. İstatistiksel araştırmalarda da yapılan aslında
bu işlemdir. Görüşme bir konuyla ilgili olarak fikir alışverişinde bulunma işlemidir. Görüşme iki birey
arasında olabileceği gibi grup-birey, birey-grup, grup-grup biçimlerini de alabilir. Görüşme araştırmacının
amacına uygun verilerin derlenmesi için verinin derleneceği birimler ile yürütülür. Araştırmacının ilgilendi-
ği değişkenleri ölçmek üzere hazırlanan sorular bir soru formunda bir araya getirilerek katılımcının formu
kendisinin doldurması istenir. Bu soru formlarına anket formu, sormaca formu gibi isimler verilmektedir.
Araştırmacı literatür taraması yardımıyla bu verilere ulaşabilir. Böyle bir durumda ilgili değişken için kul-
lanılacak veriler araştırmacı tarafından derlenmediği ve düzenlenmediği için araştırmacının ikinci elden
veri ile çalıştığı ifade edilir. İkinci elden veri ile çalışılırken araştırmacı daha önceki çalışmaların sonuçlarına
kütüphane taraması veya internet kaynakları üzerinden basılı ve görsel materyalleri kullanarak ulaşabilir.
53
2
Veri Derleme ve Düzenleme
Veri Düzenleme
Üzerinde hiçbir işlem yapılmamış ve araştırmacının veriyi derlediği biçimde kayıt altına alınan veriye ham
veri adı verilir. Dolayısıyla ham verinin, verinin genel bazı özelliklerini de anlayabilecek biçimde özetleyici
tablolar halinde düzenlenmesi gereklidir. Ham verilerin zaman, mekân veya ilgili değişkenin ölçme düzeyi-
ne göre sıralanmış olarak gösterilmesi ile elde edilen sayı dizilerine seri adı verilir. Araştırmacının ilgilendiği
maddi değişkenin aldığı değerlerin değişkenin ölçme düzeylerine göre düzenlenmesi ile oluşturulan seri
dağılma serisi olacaktır. Nicel bir değişkene ait ölçüm sonuçlarının değişkenin ölçme düzeyine göre dağılı-
mını gösteren serilere nicel dağılma serileri adı verilir. Basit seride yer alan birbirinden farklı değerlere sahip
tüm terimleri ve bu terimlerin tekrar sayılarını içerecek biçimde düzenlenmiş seriye frekans serisi adı verilir.
Frekans serisini oluşturabilmek için basit seride yer alan birbirinden farklı tüm değerler alt alta sıralanırlar.
Daha sonra çeteleme yöntemi ile her değerin tekrar sayısı tespit edilir. Bu tekrar sayıları frekans sütunu ola-
rak tabloya eklenir. Frekans serilerinde birbirinden farklı olarak ortaya çıkan değer sayısı arttığında frekans
serilerinin sınıflandırma yoluyla basitleştirilmesi yoluna gidilebilir. Frekans serisinde her bir satır, değişkenin
birbirinden farklı her bir değerini temsil ederken gruplandırılmış frekans serilerinde her bir satırda bir aralık
ya da grup oluşturulur. Sınıf aralığı, birim sayısı olmak üzere izleyen Sturges kuralı ile hesaplanır
Frekans serilerinde veya gruplandırılmış frekans serilerinde araştırmacı frekans değerlerine ek olarak ilgili
sınıfın toplam birim sayısı içindeki oranı ile de ilgilenebilir. Frekans değerleri ile birlikte oranların da yer
aldığı seriler oransal seriler olacaktır. Serilerde belirli bir değere eşit veya daha küçük değer alan birimlerin
sayısını veya oranını göstermek için artan birikimli frekanslar veya artan birikimli oransal frekanslar kulla-
nılır. Nitel değişken için frekans tablosu ve oransal frekanslar oluşturulurken üzerinde çalışılan birimlerin
ilgili değişken bakımından gözlemlenen sonuçları kayıt altına alınır ve çeteleme/sayma usulü ile her sonuç/
kategori için gözlem sayıları frekans sütununda yer alır. Araştırmacının üzerinde çalıştığı değişkene ait
değerlerin mekâna göre sınıflandırılması ile ortaya çıkan serilere mekân serileri adı verilir. Mekân serilerinin
ana bileşeni öncelikle üzerinde çalışılan değişkenin ilişkilendirildiği mekânsal özelliğin sınıflandırılmasıdır.
Kimi problemlerde araştırmacının ilgilendiği değişken zaman değişkeninin uygun ölçme düzeyleri ile eş-
leştirilebilir. Örneğin aylara göre doğum sayısı, haftalara göre ziyaret edilen okul sayısı, bir web sayfasının
saatlik ziyaretçi sayısı gibi durumlar zaman serisine örnek teşkil edecektir. Dikkat edilirse tüm örneklerde
ölçümlenen değişken zaman değişkeninin hafta, ay, gün, saat vb. uygun bir ölçme düzeyi ile eşleşmektedir.
Zaman serileri gösterilirken ilk sütunda zaman değişkeninin aldığı değerler kronolojik olarak sıralanır
54
2
İstatistik I
1 Veri derleme için kaç tane ana başlık yer 6 Üzerinde hiçbir işlem yapılmamış ve araştır-
almaktadır? macının veriyi derlediği biçimde kayıt altına alı-
neler öğrendik?
A. Bir nan veri nasıl adlandırılır?
B. İki A. Frekans dağılımı
C. Üç B. Nicel değişken
D. Dört C. Ham veri
E. Beş D. Ortalama verisi
E. Dağılım
2 İkinci elden veri derleme dışında hangi veri
derleme yöntemi vardır? 7 Verilen frekans serisinde uzunluk değişkeni-
A. Ortalama nin en yüksek frekansa sahip değeri nedir?
B. Sürekli değişken
Uzunluk Frekans
C. Birinci elden
120 5
D. Kesikli değişken
E. Değişken veri derleme 130 8
140 15
A. Gözlem A. 15
B. Veri analizi B. 10
C. İstatistik C. 20
D. Parametre D. 30
E. Görüşme E. 60
55
2
Veri Derleme ve Düzenleme
9 Verilen gruplandırılmış frekans serisi oluştu- 10 Frekans değerleri ile birlikte oranların da yer
rulduktan sonra araştırmacı bir gözlem değerini aldığı serilere ne ad verilir?
daha elde etmiştir. Eklenecek gözlem değeri 15 ise
neler öğrendik?
A. Birinci
B. İkinci
C. Üçüncü
D. Dördüncü
E. Beşinci
56
2
İstatistik I
1. B Yanıtınız yanlış ise “Veri Derleme Yöntemle- 6. C Yanıtınız yanlış ise “Verinin Düzenlenmesi”
ri” konusunu yeniden gözden geçiriniz. konusunu yeniden gözden geçiriniz.
3. D Yanıtınız yanlış ise “Gözlem” konusunu ye- 8. D Yanıtınız yanlış ise “Gruplandırılmış Frekans
niden gözden geçiriniz. Serisi” konusunu yeniden gözden geçiriniz.
4. B Yanıtınız yanlış ise “Gözlem” konusunu ye- 9. C Yanıtınız yanlış ise “Gruplandırılmış Frekans
niden gözden geçiriniz. Serisi” konusunu yeniden gözden geçiriniz.
5. E Yanıtınız yanlış ise “Görüşme” konusunu ye- 10. E Yanıtınız yanlış ise “Oransal Seri” konusunu
niden gözden geçiriniz. yeniden gözden geçiriniz.
57
2
Veri Derleme ve Düzenleme
Araştır Yanıt
2 Anahtarı
Araştır 1
Araştır 2
Türkiye istatistik Kurumu “İstatistik Veri Portalı” aracılığıyla istenen veri Microsoft Excel formatında indiri-
lebilmektedir. Veride yer alan bilgilerden bir bölümü izleyen biçimde aktarılabilir.
Sera gazı emisyonları
(CO2 eşdeğeri ) Karbon dioksit Diazot monoksit
Greenhouse gas Carbon dioxide Nitrous oxide
NACE Rev. 2 Kısım - Section
emissions (CO2) (N2O)
(CO2 equivalent)
2018 2019 2018 2019 2018 2019
516 809 499 838 419 436 399 344 131 134
Toplam Emisyon
234 455 905 914 837 998
58
2
İstatistik I
Kaynakça
Arıcı, H. (2001). İstatistik Yöntemler ve Uygulamalar (13. Baskı). Ankara: Meteksan A.Ş.
Burgess, T. F. (2001). Guide to the Design of Questionnaires. A general introduction to the design of
questionnaires for survey research. Open Journal of Leadership, 30(4), 411-432.
Carlson, K. A. ve Winquist, J. R. (2017). An introduction to statistics: An active learning approach. Sage
Publications.
Er, F. (2003). Açıklayıcı Veri Analizi. Kaan Kitabevi.
Freund, J. E. ve Perles, B. M. (2007). Modern elementary statistics. Prentice Hall.
Freund, J. E. ve Williams F. J. (1966). Dictionary/Outline of Basic Statistics. Dover.
Gürsakal, N. (2001). Sosyal Bilimlerde Araştırma Yöntemleri. Uludağ Üniversitesi Basımevi
Kazmier, L. J. (1996). Schaum’s outline of theory and problems of business statistics. Schaum’s Outline Series.
Likert, R. (1932). A Technique for the Measurement of Attitudes. Archives of Psychology, 140: 1–55.
Myatt, G. J. (2007). Making Sense of Data A Practical Guide to Exploratory Data Analysis and Data Mining.
Wiley.
Serper, Ö. (2004). Uygulamalı İstatistik 1 (5. Baskı). Bursa: Ezgi Kitabevi.
Stevens, S. (1946). On the Theory of Scales of Measurement. Science, 103.
Sullivan, M. (2005). Fundamentals of Statistics. Pearson Prentice Hall.
Yıldırım, İ. E. (2017). İstatistiksel Araştırma Yöntemleri (3. Baskı). Seçkin Yayıncılık.
Yüzer, A. F. (Ed.). (2011). İstatistik (8. Baskı). Eskişehir: Anadolu Üniversitesi Yayını.
İnternet Kaynakları
TÜİK, Karayolu Trafik Kaza İstatistikleri, 2021, Erişim Tarihi: Nisan 2022,
https://data.tuik.gov.tr/Bulten/Index?p=Karayolu-Trafik-Kaza-Istatistikleri-2021-45658&dil=1
TÜİK, Çevre ve Enerji İstatistikleri, 2021, Erişim Tarihi: Nisan 2022,
https://data.tuik.gov.tr/Kategori/GetKategori?p=Cevre-ve-Enerji-103
59