Temel Istatiksel Kavramlar

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 34

TEMEL İSTATİSTİKSEL KAVRAMLAR

Bu bölümde değişken nedir, değişkenlerin aldığı değerler incelendiğinde ya da aldığı değer


sayısına bakıldığında nasıl farklı sınıflandırılabileceği gibi temel konular ile birlikte istatistikte
önemli olan, olmazsa olmaz dediğimiz analiz yapmak isteyen herkesin bilmesi gereken temel
kavramlar (ortalama, beklenen değer, korelasyon katsayısı gibi) anlatılacaktır.

DEĞİŞKENLER
Değişken en güzel sabit olmayan, durumdan duruma, zamandan zamana değişen ve belki de
farklılaşan bir istatistiki terim olarak ifade edilebilir. Analiz yaparken başlıca kaynak, kullanılan
değişkenler olarak da tanımlanır. Her gözleme göre farklı değer alabilen objelere, özelliklere,
durumlar da değişken olarak adlandırılır. İstatistiki olarak değişkenleri farklı farklı
gruplandırıp, tanımlamamız mümkündür. Bir açıdan Nicel ve Nitel, bir diğer açıdan Sürekli ve
Süreksiz (Kesikli) değişkenler olarak farklı kategorilerde incelenebilir.

Nicel ve Nitel Değişkenler


Sayılarla ifade edilen değişkenler Nicel Değişken olarak adlandırılır. Kişilerin cinsiyeti,
doğduğu bölge, eğitim düzeyi gibi genelde anket çalışmalarının demografik bölümünü içeren
soruların cevaplarını oluşturan değişkenler Nitel Değişkenlerdir. Kelimelerle, sözcüklerle ya
da sembollerle ifade edilen
değişkenler Nitel, sayılarla ifade
edilen değişkenler ise Nicel değişken
olarak adlandırılır. Yaş ağırlık,
sıcaklık, ücretler gibi değişkenler
bunlara örnektir.
Örneğin, bir sınıftaki öğrencilerin
kan grupları, saç rengi nitel değişken
olarak değerlendirilirken, dersten
aldıkları notlar, boy ve kiloları nicel
değişken olarak değerlendirilir.
Özetle, nicel verilere fiyatlar, gelir ve
para arzı gibi sayısal veriler örnek verilirken, nitel verilere de erkek-kadın, çalışan-çalışmayan,
üniversite mezunu-üniversite mezunu olmayan vb. veriler, aynı zamanda gölge (kukla)
değişken olarak da adlandırılan veriler örnek gösterilebilir.

Bağımlı ve Bağımsız Değişkenler


Bazı değişkenler başka hiçbir değişkene bağlı olmadan değişebilirken, bazıları başka bir veya
birkaç değişkene bağlı değerler alabilirler. Başka bir değişkene bağlı olmadan değerler alabilen
değişkenlere bağımsız, başka bir değişkene veya değişkenlere bağlı olarak değerler alabilen
değişkenlere de bağımlı değişken denir (Baykul, 2000:11). Örneğin herhangi bir dersten
aldığınız not, o derse çalışma sürenize bağlıdır. Bu durumda dersten aldığınız not bağımlı
değişken, ders çalışma süresi ise bağımsız değişken olarak tanımlanır. Hayatın içinde bağımlı
değişkeni etkileyen birden fazla bağımsız değişken mevcuttur. Örneğin; bir evin fiyatı, o evin
konumuna, ulaşım kolaylığını, döviz fiyatlarına, faiz oranlarına ve bunun gibi birçok bağımsız
değişkene bağlıdır.
Öğrencilerin zekâ seviyelerinin akademik başarılarında önemli bir etken olduğu varsayımında
“zekâ seviyeleri” bağımsız değişken, “akademik başarı” ise bağımlı değişken olarak tanımlanır.
Çünkü öğrencilerin akademik başarıları, zekâ seviyesine göre değişkenlik göstermektedir
(Uysal, Verilerin Analizi ve Yorumlanması).

Sürekli ve Süreksiz (Kesikli) Değişkenler


Bir rassal değişken, eğer belli bir aralıkta ya da aralıklarda herhangi bir değer alabiliyorsa
sürekli rassal değişkendir. Sürekli rassal değişkenler genellikle boy uzunluğu, ağırlık, uzaklık
ve zaman periyotları verilerini temsil eder.
Zaman Serisi, Kesit ve Panel Veri
Bir zaman serisi, bir serinin zaman içindeki hareketini gözlemler. Zaman serisinin her değeri
belirli bir zaman farkı (hep aynı olma koşulu ile) ile arka arkaya gelen sayısal verilerden oluşur.
Değişkenlerle ilişkili değerler günlük, haftalık, aylık, üç aylık, altı aylık, yıllık olabilir.
Örneğin; X ülkesinin son 40 yıl için işsizlik oranı bir zaman serisidir. Bir kişinin son on yıl her
ay ölçtüğü kilosu yine bir zaman serisi oluşturur. Her gün bahçede belli bir zaman aralığında
bahçede otururken, geçen kedileri not edip sayan bir kişinin üç ay sonunda oluşturduğu veri de
zaman serisidir.
Örneğin; gelire göre harcamalar aylık, ithalat ve
ihracat miktarları, dış ticaret açığı, cari açık, işsizlik
oranları yıllık olarak açıklanır. Bunlara ek olarak,
günlük verilere örnek hisse senedi fiyatları, haftalık
verilere örnek ise Merkez Bankasının yayınladığı
para arzı verilebilir. Bazı veriler, GSYİH ve tüketici
harcamaları hem üç aylık hem de yıllık olarak
oluşturulabilir.
Zaman serilerini oluşturan veriler de nicel (kantitatif)
ya da nitel (kalitatif) verilerden oluşur.
Kesit veri ise bir ülkenin veya bir şirketin değil, birden fazla ülkenin veya birden fazla şirketin
tek bir parametresinin aynı zamandaki değerlerinden oluşur. Örneğin, G-20 ülkelerinin 2016
yılında işsizlik yüzdeleri bir kesit veridir. Bir başka örnek ise, 2015 yılı için BİST30’da yer alan
şirketlerin net satışlarıdır. Kesit veri birçok birim için sadece bir dönem hakkında bilgi verirken,
zaman serisi verisi sadece bir birimin dönemlere göre bilgisini vermektedir. Hem dönemlere
hem de birimlere göre bilgiler isteniyorsa, panel veri kullanılmalıdır (Baltagi, 1995).
Panel veriyi en basit anlamda düşünürsek bir zaman serisi ile bir kesit verinin birleşmesinden
oluşur. Örneğin Avrupa Birliğine üye olan ülkelerin 2000-2017 yılları için işsizlik oranı panel
veridir.
Zaman Serisi, Kesit Veri ve Panel Veriye Örnek

ZAMAN SERİSİ KESİT VERİ PANEL VERİ


Türkiye Cari Açık Cari Açık (2015) Cari Açık
2010 Türkiye Türkiye 2010
2011 Almanya Türkiye 2011
2012 İngiltere Almanya 2010
2013 Rusya Almanya 2011
… … İngiltere 2010
… … …
… … …
2017 Fransa Fransa 2011

Ekonomide yer alan makro değişkenler çoğunlukla zaman serisi olduğundan zaman serisi
analizi ya da panel veri analizi uygulanır. Pazar araştırmalarında ise çoğunlukla anlık durum
incelenip karar vermeyi kolaylaştıracak analizler yapılmak istenildiğinden anlık durumu
gösteren kesit verilerle çalışılır.
Birincil Veri, İkinci Veri
Araştırmalar için toplanan veriler bir açıdan da birincil veya ikincil veri türleri olarak ikiye
ayrılır. Belirli bir amaca yönelik olarak yapılan çalışmalarda ilk elden toplanan veriye “Birincil
veri” denir. Birincil veriye örnek olarak yüksek lisans tezi için deney yapan ya da anket yolu
ile bilgi toplayan öğrenciler örnek gösterilebilir. İkincil veri kaynakları ise yapılacak olan
araştırmalarda araştırmacının ya da kurumun ilk elden elde edemediği çeşitli kitaplar,
dergilerdeki makaleler, çeşitli istatistiksel tablolar, tezler, raporlar, broşürler, kataloglardan elde
ettiği verilerdir. Örneğin Merkez Bankasının, Türkiye İstatistik Kurumu’nun yayınladığı veriler
ikincil veridir.
Nitel veriler istatistiki analizlerde kullanılırken iki farklı türde karşımıza çıkabilir. Örneğin bir
anket çalışmasında cinsiyet sorusunun kadın ve erkek olarak verilen cevabı bir açıdan Nominal
Veri türü olarak adlandırılır. Nominal veri sadece iki kategorili durumlar için değil, ikiden fazla
kategorili durumlar için de kullanılır. Örneğin medeni durum, saç rengi gibi…
Nominal=Kodlama (Kadın=1 ve Erkek =0 vb. değişkenler için kullanılır) Bir başka ifade ile
aralarında hiyerarşi olmayan değişkenler için kullanılır.
Aralarında sıralı ilişkinin (hiyerarşinin) bulunduğu veri türleri ise Ordinal Veri olarak
adlandırılır.
Ordinal=Sıralama (1=Hiç Katılmıyorum, 2=Katılmıyorum, 3=Kararsızım, 4=Katılıyorum,
5= Kesinlikle Katılıyorum)

NOT: Bu kavram LİKERT ölçeği olarak da adlandırılır. Bu kavram Anket Analizi kısmında
detaylı anlatılacaktır.
Scale = Ölçüm (Boy, Kilo, Yaş, Hacim vb. değişkenler için kullanılır)
ÖNEMLİ KAVRAMLAR

Popülasyon & Örneklem

İstatistiksel analizlerde bir konuya veya bir birime ait bütün durumları gözlemlemek bazen çok
zor bazen ise imkânsızdır. Bu nedenle birimi temsil ettiği düşünülen alt kümeler seçilerek en
uygun olan (olduğuna inanılan) alt kümede analiz ya da çalışma yapılır. Bir ülkenin genel seçim
sonuçlarını önceden tahmin etmek istediğimizde, seçim tercihlerini bireylere önceden sorup
cevaplarını not alıp, sonucu tahmin etmemiz neredeyse imkânsızdır. Çünkü seçimde oy
kullanacak kişilerin sayısı yani popülasyonumuz, ülkenin vatandaşı olup, oy kullanma hakkı
olan herkestir. Öncelikle bu grubun tamamına ulaşmak için zamana ve paraya ihtiyacımız olur.
Diyelim ki bunlar elimizde, bu durumda bile kişilerin verdiği cevabın doğruluğundan emin
olamayız. Bu açıdan istatistikte örneklem diye ifade edilen tüm grubu yani popülasyonu temsil
ettiğini düşündüğümüz alt kümeler üzerinde çalışılır. Ancak bu alt kümenin doğru belirlenmesi
çok önemlidir. Örneğimiz üzerinden alt kümeleri inceleyelim. Çalışmayı ülkenin sadece bir
şehrinde gerçekleştirmek bir alt kümede yani bir örneklemde çalışmakla aynı şeydir. Fakat bu
örneklemde çalışmak bizi doğru sonuca ulaştırmaz. Aynı şehirde birbirine benzer yapıda
yaşayan insanların olması oldukça doğaldır. Bizim bu örnek için çalışılması gereken örneklem
ise oy kullanabilen her yaş grubundan, her eğitim düzeyinden gibi dikkat edilmesi gereken
parametreler düşünülüp ele alınmalıdır. Daha detaylı düşünürsek, ülkenin %60’ı kadınlardan
oluşuyorsa, seçilen örneklemin de yaklaşık yüzde %60’ı kadınlardan oluşması hedeflememiz
gerekir. Bu açıdan örneklemi oluşturmak bir arabanın prototipini oluşturabilmek ile aynıdır. Bu
yaklaşım rastlantısal örnekleme yöntemi olarak adlandırılır. Basit rastlantısal örneklemeye göre
anakütlede bulunan bütün birimlere örneğe girme açısından eşit şans tanınır (Güler, 2005). Bir
diğer yaklaşım ise sistematik örnekleme (sınırlandırılmış rastlantısal örnekleme), bu
yaklaşımda anakütlede bulunan birimlerden her k. birim örnek olarak alınır. k değeri ise genel
olarak anakütledeki birim sayısının çekilecek örnek sayısına bölünmesiyle elde edilir. Ancak
bu yaklaşımda anakütlede bulunan birimler (değerler) döngüsel bir eğilim gösteriyorsa
uygulanmaz. Literatürde buna benzer başka yaklaşımlarda bulunmaktadır. Bu yaklaşımlar
çalışacağınız anakütlenin yapısına göre değişiklik gösterir.

Özetle;
❖ Popülasyon (Anakütle): Bir veri kümesindeki tüm öğeleri içerir.
❖ Örneklem: Popülasyondan çekilen bir ya da daha fazla gözlemden oluşan ve ait olduğu
popülasyona ait özellikleri taşıdığı düşünülen alt kümedir.
İstatistiki literatürde popülasyonu tanımlamaya çalıştığımız (ortalama, standart sapma, vb.)
özellikler parametre olarak tanımlanır. Benzer şekilde örneklemi tanımlayan özellikler ise
istatistik olarak tanımlanır. Burada bahsedilen “İstatistik” kavramı aslında bir numunenin
ölçülebilir özellikleridir. Örneklemi oluşturma amacımız, örneklemi oluşturarak anakütlede
oluşacakları tahmin etmektir. Bunun içinde öncelikle anakütlenin parametrelerini tahmin
etmeye çalışırız. Anakütle parametrelerinin tahmini; nokta tahmini ve aralık tahmini (güven
sınırlarının hesaplanmasıdır) olarak genellikle iki biçimde gerçekleştirilir. Nokta tahmini
yapmak, değerin gerçekleşecek olan değerden farklı olma olasılığı çok yüksek olduğundan
oldukça risklidir. Aralık tahmini yapmak ise bu nokta tahminini genişletmektir. Bu tahmin
yönteminde güven sınırlarının hesaplanmasında anakütle parametresini belli bir olasılıkla
kapsayacak alt ve üst sınır değerleri bulunur.

Hata Türleri

Veri toplama aşamasında sıklıkla yapılan hatalar dört ana başlık altında incelenebilir
(Orhunbilge, 2014:69-74):
❖ Basit Hatalar: Araştırmayı yapan kişinin yorgunluk ve/veya dikkatsizlik nedeniyle
yaptıkları hatalardır. Bu hataların ortadan kaldırılması için sık kontroller yapılması
önerilir.
❖ Tesadüfi Hatalar: Örnekleme yöntemiyle yapılan hata türleridir. Bir örnek yardımı ile
tesadüfi hatalardan bahsedelim. 4 kişiden oluşan bir topluluk düşünelim. Bu 4 kişinin
aylık harcamaları aşağıdaki gibi olsun.
Kişi Aylık Harcama

1 1200
1600
2
1400
3
2000
4
Bu 4 kişinin aylık ortalama harcamasının hesaplanması gerektiği bir durumda,
anakütlenin tümü gözlendiğinde aylık ortalama harcama:
(1200+1600+1400+2000)/4=6200/4=1550
Şimdi bu anakütleden rassal seçilerek elde edilen örneklemlerin, aylık ortalama
harcamalarını bulalım.
1. Olası Örneklem: İlk 3 kişiden oluşsun: (1200+1600+1400)/3=1400
2. Olası Örneklem: 1.kişi, 2. kişi ve 4. kişiden oluşsun: (1200+1600+2000)/3=1600
3. Olası Örneklem: 2. kişi, 3. kişi ve 4. kişiden oluşsun: (1600+1400+2000)=1666,67
Anakütlenin aylık harcama ortalaması 1550 iken, 1. olası örneklemin 1400, 2. olası
örneklemin 1600, 3. Olası örneklemin ise 1666,67 olduğunu gördük. Örnekleme
yapıldığı sürece ortadan kaldırılması mümkün olmayan bu hataları en aza indirgemek
için örneklem sayısının arttırılması veya en uygun örneklemin tercih edilmesi gerekir.
❖ Sistematik Hatalar: Başta veri toplama sırasında yapılabilecek ya da diğer aşamalarda
yapılan hesaplamalarda gerçekleştirilen hatalardır. Bazen yapıldığı bile fark edilmeyen
hatalardır.
❖ Tahmin Hataları: Çeşitli istatistiki yöntemlerle tahmin edilen değerlerle, gözlenen
değerler arasındaki farka “tahmin hataları” denir. Bu hataların düşük olması
uygulanan yöntemin uygunluğunu gösterir.
TANIMLAYICI İSTATİSTİK
İstatistiksel yöntemler genel olarak tanımlayıcı ve çıkarımsal (yorumsal) olarak ikiye ayrılır.
Tanımlayıcı istatistik, verilerin toplanması, düzenlenmesi ve analiz edilip yorumlanma
çabalarıdır. Bir açıdan eldeki verilerin o anda neler anlattığını bulmaya çalışır. Bunu yaparken
de çeşitli ortalama ve değişkenlik
ölçülerini kullanır. Çıkarımsal istatistik
ise popülasyondan seçilen örneklemler
aracılığı ile analiz yapılarak,
popülasyonun tamamı hakkında
çıkarım yapmaya çalışan yöntemler
topluluğudur. Örneğin, 100 kişilik bir
öğrenci grubunun herhangi bir ders
notunun ortalaması ve dağılımını
bulup hesaplamak ve görsellemek
tanımlayıcı istatistiğin çalışma
alanıdır. Ancak bu 100 kişi bir
popülasyonun örneklem kümesi ise ve incelenmek isteniyorsa, çeşitli hipotez testleri ile
ölçülerek yapılan çalışma çıkarımsal istatistiğin çalışma alanına örnektir.

Merkezi Eğilim (Ortalama) Ölçüleri

Merkezi eğilim ölçüleri, veri setindeki bütün değerlerin çevresinde toplandığı merkezi bir
değeri ifade eder. En sık kullanılan merkezi eğilim ölçüleri ortalama, mod (tepe değer), medyan
(ortanca), çeyreklikler ve geometrik ortalamadır. Ortalama ölçüleri analitik olan yani duyarlı
olan ve analitik olmayan yani duyarlı olmayan ortalamalar olarak da iki farklı grup ya da
başlık altında incelenebilir.

MOD: Bir sayısal veri setinde en çok tekrar eden sayı Mod (Tepe değer) olarak tanımlanır.
Mod analitik olmayan ortalamalardan biridir. Herhangi bir sayının tekrar adedi ise frekans
olarak tanımlanır. Eğer veri setinde hiçbir tekrarlama bulunmuyorsa, veri setinin mod değeri
yoktur.
Örneğin; X: 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4.
X veri seti ya da X rassal değişkeni 1 değerini 2 kere, 2 değerini 4 kere, 3 değerini 2 kere, 4
değerini ise 3 kere aldığı gözlemlenmektedir.
En çok tekrar eden değer 2 olduğundan X rassal değişkeninin mod değeri 2’dir.
Ayrıca X rassal değişkenini aldığı değerler ve bu değerleri alma sıklığı yani frekansları ve
frekanslarından elde edilen olasılık değerleri aşağıdaki tabloda özetlenmiştir.
X Frekans Olasılık Yüzde
1 2 2/11 0,181
2 4 4/11 0,363
3 2 2/11 0,181
4 3 3/11 0,272
Toplam 11 11/11 %100
Örneğin; bir grup kişiye hangi takımı tuttuğunu sorsak ve verdikleri cevaplar doğrultusunda
aşağıdaki tabloyu elde etsek!!!
Takım Kişi Sayısı
A Takımı 5
B Takımı 7 En çok desteklenen
E takımıdır yani
D Takımı 12 Mod: E
E Takımı 15
F Takımı 8

Örnek: Aşağıdaki düzenlenmiş X serisinin ya da değişkeninin mod değerini


hesaplayalım.
X Frekans
10 2
25 4
30 3
35 6
40 2

Çözüm: X rassal değişkeni 10 değerini 2 kere, 25 değerini 4 kere, 30 değerini 3 kere, 35


değerini 6 kere ve 40 değerini de 2 kere almaktadır. En çok 35 değerini aldığından (6 kere), X
rassal değişkeninin mod değeri 6 olarak bulunur.
Örnek: 12 kişilik bir dersin vize sınav notlarına ilişkin veriler (X) aşağıdaki tablodaki
gibidir. Bu sınav sonucu için tepe değeri yani mod değerini hesaplayalım.
X (Alt Sınır- Üst Sınır) Kişi Sayısı
80 – 100 (Frekans)
2
60 – 80 4
40 – 60 3
20 – 40 1
0 – 20 2

Çözüm: Yukarıdaki tabloda X değişkeninin ifade ediliş şekli ya da biçimi gruplandırılmış seri
olarak adlandırılır. Eğer elimizdeki veriler tabloda görüldüğü gibi aralık olarak verildiyse, bizim
tüm aralıklarda kişilerin tam olarak kaç puan aldıklarını bilmemiz mümkün değildir. Bu sebeple
her bir aralık değerlerinin önce ortalaması alınır ((80+100)/2 =90).
X (Alt Sınır- Üst Sınır) Kişi Sayısı Orta Nokta Frekans*Orta
80-100 (Frekans)
2 (80+100)/2= 90 nokta2*90=180
60-80 4 (60+80)/2 = 70 4*70=280
40-60 3 (40+60)/2 = 50 3*50=150
20-40 1 (20+40)/2 = 30 1*30=30
0-20 2 (0+20)/2 = 10 2*10=20
Toplam 12 kişi 660
Bu işlem her bir aralık için tek tek yapılarak Orta Nokta sütünü oluşturulur. Elde edilen
değerler kendisine ait frekans değerleri ile çarpılıp, çarpımdan elde edilen değerlerin toplamı
alınır. Ortalama ise toplam değerin toplam kişi sayısına bölünmesi ile bulunur.

𝟔𝟔𝟎
= 𝟓𝟓
𝟏𝟐
MOD’UN ÖZELLİKLERİ
❖ Denek sayısının ya da gözlenen değerin ya da değişkenin aldığı değerin sayısı az
olduğunda mod güvenilir bir ölçü değildir. Kullanılması uygun değildir!!!
❖ Bazı örneklemlerde bir mod yerine iki ya da daha fazla mod değeri olabilir. Bu durumda
ya mod değeri hesaplamaktan vazgeçilir ya da frekans tablosu tek mod değerli bir
dağılım olacak şekilde yeniden düzenlenir.
❖ Nicel ve nitel verilerin her iki türü için de uygundur.

Örnek: Aşağıdaki gibi bir veri setimizin olduğunu düşünelim

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 10, 10

1 değeri 3 defa, 2 değeri 4 defa 3 değeri 1 defa, 4 değeri 1 defa, 5 değeri 2 defa, 6 değeri 3 defa,
7 değeri 4 defa, 8 değeri 1 defa ve 10 değeri iki defa tekrarlanmıştır. Bu açıdan bakıldığında 2
ve 7 değeri bu serinin mod değeridir. Bu serinin bir mod değeri yoktur iki mod değeri vardır.
Bir açıdan da bu seriyi temsil edebilecek tek bir değer yoktur iki değer mevcuttur.
MEDYAN: Büyükten küçüğe ya da küçükten büyüğe doğru sıralanmış bir veri setinde tam
ortada yer alan değeri Medyan (Ortanca) olarak tanımlanır.
Örneğin; X: 5, 1, 2, 7, 6, 4 veri setinin medyan değerini bulmak istediğimizde, ilk adım olarak
X veri setini küçükten büyüğe (büyükten küçüğe) sıralarız. X: 1, 2, 4, 5, 6, 7. Yeni oluşan veri
setinde ortada yer alan değer tek bir değer olmadığından ortada kalan iki değerin ortalaması
alınır. Bu durumda X veri setinin medyan değeri 4,5 olarak bulunur.
ÖNEMLİ NOT: Değişkenin aldığı değer sayısının tek veya çift olmasına göre medyanın
bulunması değişir.
Tek sayı olduğunda, tam ortada tek bir değer aldığından medyan o değerdir.
Çift sayı olduğunda, yukarıdaki örnekteki gibi ortada kalan iki değerin ortalaması
alınır.
MEDYAN’IN ÖZELLİKLERİ
❖ Değişkenin aldığı değerler çok fazla ise değişkenlerin özetlenmesinde medyan
kullanılabilir.
❖ Medyan, sınıflama ölçme düzeyi ile ölçülen değişkenler için kullanılmaz.
❖ Eşit aralıklı, oran ve sıralama ölçme düzeyinde ölçülen değişkenler için kullanılır.
❖ Aşırı uç değerlerden etkilenmez.
❖ Duyarsız yani analitik olmayan ortalama yöntemlerinden biridir.
ARİTMETİK ORTALAMA: Aritmetik ortalama, en çok kullanılan merkezi eğilim
ölçülerinden biridir. Rassal değişkenlerin ya da birimlerin aldıkları değerlerin toplamının
gözlem sayısına ya da birim sayısına bölümü olarak tanımlanır.
N

 Xi
 i 1

Örneğin 10 kişiye kaç tane ayakkabıya sahip olduklarını sorduk.


Cevaplar: 1, 3, 5, 4, 3, 7, 2, 8, 3, 54.
Bu durumda kişilerin sahip oldukları ayakkabı sayıları ile ifade edilen X değişkeninin aldığı
toplam değer 10 (gözlenen değer ya da örneklem sayısı) ve X değişkeninin ortalaması ise;
Ortalama = (1 + 3 + 5 + 4 + 3 + 7 + 2 + 8 + 3 + 54) / 10 = 9
ARİTMETİK ORTALAMA’NIN AVANTAJLARI: Kolay uygulanabilir ve kolay anlaşılır.
ARİTMETİK ORTALAMA’NIN DEZAVANTAJLARI: Rassal değişkenin aldığı uç
değerler aritmetik ortalamayı uç değere yaklaştırır ve çoğunluktan uzaklaştırarak temsil
yeteneğini kaybettirir.
ARİTMETİK ORTALAMA’NIN ÖZELLİKLERİ
❖ Bir veri setinin ya da bir değişkenin tek bir ortalama değeri vardır.
❖ Nicel verilere uygulanabilir.
❖ Eşit aralıklı ve oran ölçme düzeyinde ölçülen değişkenler için kullanılır.
❖ Aritmetik ortalama hem popülasyon hem de örneklem için hesaplanır. Bu ayırımı
belirtmek için genel yazımda popülasyonun ortalaması 𝜇ile örneklemin ortalaması ise x
ile gösterilir.
❖ Aritmetik ortalama ile değişkenin aldığı değerler arasındaki farkların toplamı sıfırdır.
Aşağıdaki örnekte bu özellik detaylı bir şekilde incelenmiştir.
❖ Aritmetik ortalama duyarlı yani analitik olan bir ortalama türüdür.
X (X – Ortalama)
1 (1 – 9) = -8
3 (3 – 9) = -6
5 (5 – 9) = -4
4 (4 – 9) = -5
3 (3 – 9) = -6
7 (7 – 9) = -2
2 (2 – 9) = -7
8 (8 – 9) = -1
3 (3 – 9) = -6
54 (54 – 9) = 45
Toplam 0
∑(Xi − Ortalama) =(-8 + -6 + -4 + -5 + -6 + -2 + -7 + -1 + -6 + 45) = 0

BEKLENEN DEĞER: X eşit olasılıklarla n tane değer alan bir rassal değişken olsun. X rassal
değişeninin aldığı değerleri x1 , x2 , x3 , . . . , xn−1 , xn ile gösterelim. Herhangi bir i ∈ {1,2, . . . , n}
için xi 'nin gerçekleşme olasılığını da p(xi )ile gösterelim.
X rassal değişkeni değerlerini eşit olasılıklarla gerçekleştirdiğine göre; herhangi bir i, j ∈
{1,2, . . . , n} için, xi 'nin gerçekleşme olasılığı xj 'nin gerçekleşme olasılığına eşittir.
1
Dolayısıyla, her i için, p(xi ) = n eşitliği sağlanacaktır. X rassal değişkeninin değerleri eşit
olasılıklarla gerçekleşmediği durumda, olasılıklarının toplamının bire eşit olması gerektiğini
bilmemize rağmen her bir olasılığın 1/n'e eşit olduğunu söyleyemeyiz. Bir başka ifadeyle,
kesikli olan X rassal değişkeni için, aldığı değerlerin gerçekleşme olasılığı, olasılıklar eşit olsa
da olmasa da aşağıdaki eşitlik her zaman doğrudur.
p(x1 ) + p(x2 ) + p(x3 )+. . . +p(xn ) = 1
X rassal değişkeninin beklenen değeri genelde E(X) ile bazı durumlarda ise Xˉ ya da 𝜇 ile
gösterilmektedir.
Beklenen değer X rassal değişkeninin alabileceği her bir değeri gerçekleşme olasılığı ile çarpıp,
elde ettiğimiz tüm değerleri toplayarak hesaplanır. Matematiksel olarak ifade edersek,
𝐧
𝐄(𝐗) = ∑ 𝐱 𝐢 𝐩(𝐱 𝐢 ).
𝐢=𝟏

Beklenen Değerin Özellikleri


1. Herhangi a sabit sayısı için; E(a)=a.
2. Herhangi a ve b sabit sayıları ve X kesikli rassal değişken için;
𝐄(𝐚𝐗 + 𝐛) = 𝐚𝐄(𝐗) + 𝐛.
3. Herhangi X ve Y kesikli rassal değişken için;
𝐄(𝐗 + 𝐘) = 𝐄(𝐗) + 𝐄(𝐘).
Örnek: X rassal değişkeni 1, 0 ve -1 değerlerinin 0,4; 0,2 ve 0,4 olasılık değerleri ile
almaktadır. X rassal değişkeninin beklenen değerini hesaplayalım.
Çözüm:𝐄(𝐗) = (1×0,4) + (0×0,2) + (−1×0,4) = 𝟎
Sonuç: X rassal değişkeninin beklenen değeri sıfırdır.
ÖNEMLİ NOT: Ortalama kavramı aslında beklenen değer kavramının özel hali olarak
düşünülebilir. Eğer rassal değişken aldığı değerleri eşit olasılık ile gerçekleştiriyorsa beklenen
değer ve ortalama değerleri aynıdır.

Örnek (KPSS 2009 Soru 2): X rassal değişkeninin olasılık fonksiyonu aşağıdaki tabloda
verilmiştir.

X 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8

Bu bilgiler doğrultusunda E(X) değerini bulalım.


1 3 3 1 12 3
Çözüm: E(X) = 0 8 + 1 8 + 2 8 + 3 8 = =2
8
Sonuç: E(X)=3/2.

Örnek: X: 3, 3, 5, 8, 2, 3, 2, 5 veri setinin beklenen değerini hesaplayalım.

Çözüm: Öncelikle X rassal değişkeninin aldığı değerlerin sıklıklarını yani frekans değerlerini
hesaplayalım. Örneğin X rassal değişkeni 2 değerini 2 kere, 3 değerini 3 kere, 5 değerini 2 kere
ve 8 değerini de sadece 1 kere aldığından frekans değerleri aşağıda yer alan tablodaki gibidir.
X Frekans Olasılık
2 2 2/8
3 3 3/8
5 2 2/8
8 1 1/8
Toplam 8 8/8

Bu frekans değerleri yardımıyla X rassal değişkeninin bu değerleri gerçekleştirme (alma)


olasılıklarını hesaplayabiliriz. X rassal değişkeni 4 farklı değer alsa da, gözlenen değeri 8’dir.
Bu durumda 2 kez 2 değeri aldığından, 2 olma olasılığı 2/8’dir. Bu bilgiler de yukarıdaki tabloda
yer almaktadır. Bu bilgiler doğrultusunda X rassal değişkeninin beklenen değeri aşağıdaki gibi
hesaplanır.

2 3 2 1 31
E(X) = 2 + 3 + 5 + 8 = = 3,875
8 8 8 8 8
Sonuç: E(X) = 3,875

Örnek: X rassal değişkeni bir zarın rassal atılmasıyla elde edilen sonuçlardan oluşsun. X
rassal değişkeninin beklenen değerini hesaplayalım.
Çözüm: Zarı salladığımız zaman gelebilecek sonuçlar (değerler) {1, 2, 3, 4, 5, 6} ile tanımlanan
kümeden herhangi bir sayıdır. Zarı salladığımız zaman herhangi bir sayı gelme olasılığı hep eşit
olduğundan 1/6'dır. Diğer bir ifadeyle zardan gelen sonucun 4 olma olasılığı da, 6 olma
1
olasılığı da 1 olma olasılığı da hep eşit ve bu olasılıklar da 6 ′ya eşittir. O halde, beklenen değer
aşağıdaki gibi hesaplanır.
1 1 1 1 1 1
E(X) = 1× + 2× + 3× + 4× + 5× + 6×
6 6 6 6 6 6
1
(1
= 6 + 2 + 3 + 4 + 5 + 6)
= 3,5.
Sonuç: E(X)=3,5.

Örnek: X rassal değişkeni iki zarın rassal atılmasıyla elde edilen sonuçların
toplanmasından oluşsun. X rassal değişkeninin beklenen değerini hesaplayalım.
Çözüm: Her iki zarı da salladığımız zaman gelebilecek değerler; {1, 2, 3, 4, 5, 6} ile tanımlanan
kümeden herhangi bir sayıdır. Örneğin, zarlardan her ikisinin de 1 gelmesi durumunda rassal
değişkenimiz 2 olacaktır, zarlardan biri 4, diğeri 5 geldiği zaman ise X rassal değişkenimiz iki
zarın toplamını gösterdiğinden rassal değişkenimiz 9 değerini alacaktır.
X rassal değişkenimizin alabileceği değerler kümesi {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}'dir. Bu
değerlerin gerçekleşme olasılıkları da birbirinden farklıdır. Aşağıdaki tablodan anlaşılacağı
gibi, 2 değeri sadece zarların ikisinin de bir geldiği durumda gerçekleşmektedir.
Gerçekleşebilecek 36 durum olduğundan, X rassal değişkeninin 2 olma olasılığı 1/36'dır.

Tablo: X Rassal Değişkeninin Aldığı Değer ve Olasılıkları

X Durum Olasılık
2 (1,1) 1/36
3 (2,1), (1,2) 2/36
4 (1,3), (3,1), (2,2) 3/36
5 (2,3), (3,2), (1,4), (4,1) 4/36
6 (3,3), (4,2), (2,4), (1,5), (5,1) 5/36
7 (3,4), (4,3), (1,6), (6,1), (2,5), (5,2) 6/36
8 (4,4), (3,5), (5,3), (2,6),(6,2) 5/36
9 (3,6), (6,3), (4,5), (5,4) 4/36
10 (5,5), (4,6), (6,4) 3/36
11 (5,6), (6,5) 2/36
12 (6,6) 1/36

Yukarıdaki tablo yardımıyla X rassal değişkeninin beklenen değeri aşağıdaki gibi bulunur.
1 2 3 4 5 6 5 4
𝐄(𝐗) = 2× + 3× + 4× + 5× + 6× + 7× + 8× + 9×
36 36 36 36 36 36 36 36
3 2 1
+10× + 11× + 12×
36 36 36
Sonuç: E(X)=7,064

Örnek (2014 SPK I. Dönem S-403-B Soru 22): Beklenen getirisi %24 olan (X) pay senedi
ile beklenen getirisi %12 olan (Y) pay senedinden bir portföy oluşturulacaktır. (X) pay
senedinin portföydeki ağırlığı %25, (Y) pay senedinin portföydeki ağırlığı %75 olduğuna
göre, söz konusu portföyün getirisini hesaplayalım.
Çözüm: Öncelikle soruda verilen bilgileri matematiksel olarak ifade edelim.
• Beklenen getirisi %24 olan (X) pay senedi: E(X) = 0,24
• Beklenen getirisi %12 olan (Y) pay senedi: E(Y) = 0,12
• (X) pay senedinin portföydeki ağırlığı %25:wX = 0,25
• (Y) pay senedinin portföydeki ağırlığı %75:wY = 0,75
Bu bilgileri kullanarak X ve Y rassal değişkenlerinden oluşan bir portföy oluşturalım ve
oluşturduğumuz portföyü P ile gösterelim. P = 0,25X + 0,75Y
Portföyün beklenen getirisi, E(P):
𝐄(𝐏) = E(0,25X + 0,75Y)= 0,25E(X) + 0,75E(Y)= 0,25×0,24 + 0,75×0,12 = 𝟎, 𝟏𝟓
Sonuç: Portföyün beklenen getirisi %15'dir.
Değişkenlik Ölçüleri

Ortalamalar, değişkenlerin karşılaştırılmasında her zaman yeterli ölçü olmayabilir. Aynı


ortalamaya sahip olan değişkenler farklı dağılım gösterebilir. Bu nedenle değişkenlerin
karşılaştırılmasında, değişkenlik ölçülerine mutlaka bakılması gerekir. Değişkenleri ve/veya
dağılımları birbirinden ayırt etmede kullanılan ve genellikle ortalama etrafındaki değişimi
dikkate alarak hesaplanan istatistikler değişkenlik (dağılım ya da yayılım) ölçüleri olarak
adlandırılır. Özetle, değişkenlerin gözlemlerinin birbirine benzeyip benzemediğini, uzak ya da
yakın olup olmadıklarını, homojen mi heterojen mi olduklarını gösteren ölçülere değişkenlik
ölçüleri denir.

ÖNEMLİ NOT: iki farklı birimi birbirinden ayırt etmek için sadece ortalamalara bakmak
yeterli olmaz. Aynı ortalamalara sahip yapılar birbirinden farklı değişim gösterebilirler.
DEĞİŞİM GENİŞLİĞİ (ARALIĞI): Bir veri grubunda en büyük değer ile en küçük değer
arasındaki farka değişim genişliği denir. Değişim genişliği, değişim aralığını gösteren bir
dağılım ölçüsüdür. Değişim genişliğinin hesaplanmasında sadece iki uç değer işleme
alındığından, diğer değerlerin hiçbir etkisi yoktur. Bu nedenle değişim genişliği yaygın olarak
kullanılan bir dağılım ölçüsü değildir.
NOT: Tüm veri setinin sadece iki değerinden hesaplandığı için, veride sadece iki değer bile uç
değerdeyse değişim genişliği bundan etkilenecektir. Bu yüzden de açıklama yapmakta yetersiz
kalan bir ölçüdür.
ÖNEMLİ NOT: X rassal değişken sürekli ise Xmax-Xmin, kesikli ise Xmax-Xmin +1 formülü
yardımıyla hesaplanır.
Örnek: X ve Y serilerinin değişim genişliğini hesaplayalım.
X: 300 320 360 375 355
Y: 200 250 180 500 200
Çözüm: X Serisinin Değişim Genişliği = Xmax-Xmin = 375-300 =75
Y Serisinin Değişim Genişliği = Ymax-Ymin = 500-180 = 320
NOT: Değişim genişliği farklı sayıda gözlem değeri içeren ve farklı ölçü birimlerine göre
oluşturulmuş serilerin karşılaştırılmasında kullanılamaz.

ORTALAMA MUTLAK SAPMA: Veri setindeki her bir gözlem değerinin aritmetik
ortalamadan farklarının mutlak değerlerinin toplamının örnek hacmine bölünmesiyle elde
edilen değerdir. Ortalama Mutlak Sapma değeri küçük ise dağılımın çok sıkışık olduğu anlaşılır.

Örnek: X dersini alan 10 öğrencinin final notları aşağıdaki gibi sıralanmıştır.


Kişi 1 2 3 4 5 6 7 8 9 10
Sayısı
Not 70 80 45 55 65 72 87 90 100 12
Bu bilgiler doğrultusunda final notları için ortalama mutlak sapma değerini
hesaplayalım.
Çözüm: Ortalama mutlak sapma değeri hesaplayabilmek için öncelikle ortalamayı
hesaplamamız gerekir.
70+80+45+55+65+72+87+90+100+12
Ortalama = = 67,6
10
Ortalama hesaplandıktan sonra, değişkenin aldığı her bir değerin ortalamadan ne kadar uzakta
olduğunu hesaplamamız gerekir. Aşağıdaki tabloda bu değer “Ortalama Fark” olarak
adlandırılmıştır. Mutlak Fark ise “Ortalama Fark” değerinin mutlak değeridir.

Kişi Alınan not Ortalama Fark Mutlak Fark

1 70 (70-67,6) = 2,4 2,4


2 80 (80-67,6) = 12,4 12,4
3 45 (45-67,6) = -22,6 22,6
4 55 (55-67,6) = -12,6 12,6
5 65 (65-67,6) = -2,6 2,6
6 72 (72-67,6) = 4,4 4,4
7 87 (87-67,6) = 19,4 19,4
8 90 (90-67,6) = 22,4 22,4
9 100 (100-67,6) = 32,4 32,4
10 12 (12-67,6) = -55,6 55,6
Toplam 186,6

Mutlak farkların toplamını kişi sayısına böldüğümüzde, ortalama mutlak sapma değerini
186,6/10= 18,6 olarak buluruz. Buna göre rassal değişkeni oluşturan değerler, aritmetik
ortalamadan ortalama olarak 18,6 birim uzağa düşmektedir.

ÖNEMLİ NOT: Uygulamada ortalama mutlak sapma yaygın olarak kullanılmaz, bu ölçü
yerine standart sapma kullanılır.
VARYANS: Varyans bir dağılımın kendi ortalamasından sapmalarının karesinin beklenen
değeri olarak tanımlanır. Varyans kavramı dağılıma ait her bir değerin dağılımın
ortalamasından ne kadar uzak olduğuyla ilgilidir yani, varyans söz konusu sapmaların ortalama
değerini ölçmektedir. Herhangi bir rassal değişkenin varyansı Var(X) ile gösterilir ve aşağıdaki
gibi hesaplanır.

𝐕𝐚𝐫(𝐗) = 𝐄((𝐗 − 𝐄(𝐗))𝟐 )

X rassal değişkeninin beklenen değeri olan E(X)'i 𝜇 ile gösterelim.


O halde,
Var(X) = E((X − 𝜇)2 )
= E(X 2 − 2X𝜇 + 𝜇 2 )
= E(X 2 ) − E(2X𝜇) + E(𝜇2 )
= E(X 2 ) − 2𝜇E(X) + 𝜇 2
= E(X 2 ) − 2𝜇𝜇 + 𝜇 2
= E(X 2 ) − 𝜇 2
= E(X 2 ) − E(X)2
eşitlikleri sırasıyla gerçekleşir.

Bu durumda, herhangi bir rassal değişkenin varyansını hesaplamak istediğimiz zaman,


aşağıdaki iki eşitlikten herhangi birini kullanabiliriz.

𝐕𝐚𝐫(𝐗) = 𝐄((𝐗 − 𝐄(𝐗))𝟐 )


𝐕𝐚𝐫(𝐗) = 𝐄(𝐗 𝟐 ) − 𝐄(𝐗)𝟐

VARYANSIN ÖZELLİKLERİ

1. Herhangi a sabit sayısı için, 𝐕𝐚𝐫(𝐚) = 𝟎


Var(a) = E(a2 ) − E(a)2
= a2 − a2
=0
NOT: Sabit bir değişken, yüzde yüz tek değer aldığından aslında değişkenlik göstermez. Bu
nedenden dolayı varyansının sıfır olması şaşırtıcı değildir.

2. Herhangi a sabit sayısı için,𝐕𝐚𝐫(𝐚𝐗) = 𝐚𝟐 𝐕𝐚𝐫(𝐗).


Bir başka ifade ile bir rassal değişkeni herhangi bir sabit sayı ile çarparak oluşturduğumuz
yeni rassal değişkenin varyansı, orijinal rassal değişkenin varyansının sabit sayının karesi
ile çarpımına eşittir.
Var(aX) = E((aX)2 ) − E(aX)2
= E(a2 X 2 ) − (aE(X))2
= a2 E(X 2 ) − a2 E(X)2
= a2 [E(X 2 ) − E(X)2 ]
= a2 Var(X)
NOT: Varyans hareketliliği yani değişkenliği gösterdiğinden dolayı bir anlamda finansal
değişkenler için riski ifade etmektedir. Bu açıdan değişkeni a kadar büyütmek, riski 𝑎2 kadar
çoğaltır.

3. Herhangi b sabit sayısı için,𝐕𝐚𝐫(𝐗 + 𝐛) = 𝐕𝐚𝐫(𝐗).


Bir başka ifade ile bir rassal değişken ile o rassal değişkene herhangi bir sabit sayının
eklenmesi veya çıkarılmasıyla oluşan yeni rassal değişkenin varyansı aynıdır.
Var(X + b) = E((X + b)2 ) − (E(X + b))2
= E(X 2 + 2Xb + b2 ) − (E(X) + E(b))2
= E(X 2 ) + E(2Xb) + E(b2 ) − (E(X) + b)2
= E(X 2 ) + 2bE(X) + b2 − E(X)2 − 2E(X)b − b2
= E(X 2 ) − E(X)2
= Var(X)
4. 𝐕𝐚𝐫(𝐚𝐗 + 𝐛) = 𝐚𝟐 𝐕𝐚𝐫(𝐗)
Var(aX + b) = E((aX + b)2 ) − (E(aX + b))2
= E((a2 X 2 + 2aXb + b2 )) − (E(aX) + E(b))2
= E(a2 X 2 ) + E(2aXb) + E(b2 ) − (aE(X) + b)2
= a2 E(X 2 ) + 2abE(X) + b2 − (a2 E(X)2 + 2aE(X)b + b2 )
= a2 E(X 2 ) + 2abE(X) + b2 − a2 E(X)2 − 2aE(X)b − b2
= a2 E(X 2 ) − a2 E(X)2
= a2 (E(X 2 ) − E(X)2 )
= a2 Var(X)
Örnek: X rassal değişkeni 1, 2, 3, 4
değerlerini sırasıyla 0,4, 0,3, 0,2, 0,1
olasılıklarıyla aldığında X rassal
değişkeninin varyansını hesaplayalım.
Çözüm: Öncelikle X rassal değişkeninin
beklenen değerini hesaplayalım. Herhangi bir
kesikli rassal değişkenin beklenen değeri aldığı
değer çarpı olasılıklarının toplamıdır. Bu
durumda X rassal değişkeninin beklenen değeri
aşağıdaki gibi hesaplanır.
𝐄(𝐗) = 1×0,4 + 2×0,3 + 3×0,2 + 4×0,1 = 𝟐
Bir başka ifade ile X rassal değişkeninin beklenen değeri ikidir.
Var(X) = E(X 2 ) − E(X)2 eşitliğinden X rassal değişkeninin varyansını hesaplamak istersek,
öncelikleX 2 rassal değişkeninin beklenen değerini hesaplamamız gerekir.
E(X 2 ) = 12 ×0,4 + 22 ×0,3 + 32 ×0,2 + 42 ×0,1 =0,4 + 1,2 + 1,8 + 1,6 = 5
Yukarıdaki eşitlikten,X 2 rassal değişkeninin beklenen değerinin beş olduğu anlaşılır.
Var(X) = E(X 2 ) − E(X)2 = 5 − 22 = 1
Sonuç: X rassal değişkeninin varyansı birdir.

Örnek: X rassal değişkeni herhangi iki zar atıldığında elde edilen sonuçların çarpımı
olsun. X rassal değişkeninin varyansını hesaplayalım.
Çözüm: Öncelikle X rassal değişkeninin alabileceği sonuçları düşünelim. Zardan gelen
sonuçlar (1,1) olduğu zaman, X rassal değişkeni en küçük alabileceği değere yani 1'e; sonuçlar
(6,6) olduğu zaman X rassal değişkeni alabileceği en büyük değere yani 36'ya eşit olur.
Aşağıdaki tabloda X rassal değişkeninin alabileceği değerler, bu değerlerin gerçekleşme
durumları, olasılıkları ve beklenen değeri hesaplamak için gerekli olan bilgiler detaylı bir
şekilde anlatılmaktadır. Bu deneyde olasılıklar eşit olmayacaktır. (rassal değişken 2 değerini
sadece (1,1) sonucu geldiğinde ama buna karşılık 3 değerini (1,2) ve (2,1) sonuçlarından birisi
geldiğinde alır).
Tablo: X Rassal Değişkeninin Varyansının Hesaplanması

Durum X Olasılık 𝐱 𝐢 ×𝐏(𝐱 𝐢 ) 𝐗𝟐 𝐱 𝐢𝟐 ×𝐏(𝐱 𝐢 )


(1,1) 1 1/36 1×(1/36) 1 1×(1⁄36)
(2,1), (1,2) 2 2/36 2×(2⁄36) 4 4×(2⁄36)
(1,3), (3,1) 3 2/36 3×(2⁄36) 9 9×(2/36)
(2,2), (1,4), (4,1) 4 3/36 4×(3/36) 16 16×(3/36)
(1,5), (5,1) 5 2/36 5×(2/36) 25 25×(2/36)
(2,3), (3,2), (1,6), (6,1) 6 4/36 6×(4/36) 36 36×(4/36)
(4,2), (2,4) 8 2/36 8×(2/36) 64 64×(2/36)
(3,3) 9 1/36 9×(1/36) 81 81×(1/36)
(2,5), (5,2) 10 2/36 10×(2/36) 100 100×(2/36)
(2,6), (6,2), (3,4), (4,3) 12 4/36 12×(4/36) 144 144×(4⁄36)
(3,5), (5,3) 15 2/36 15×(2/36) 225 225×(2⁄36)
(4,4) 16 1/36 9×(1/36) 256 256×(1⁄36)
(3,6), (6,3) 18 2/36 18×(2/36) 324 324×(2/36)
(4,5), (5,4) 20 2/36 20×(2/36) 400 400×(2/36)
(4,6), (6,4) 24 2/36 24×(2/36) 576 576×(2/36)
(5,5) 25 1/36 25×(1/36) 625 625×(1/36)
(5,6), (6,5) 30 2/36 30×(2/36) 900 900×(2/36)
(6,6) 36 1/36 36×(1/36) 1296 1296×(1/36)
𝐓𝐨𝐩𝐥𝐚𝐦 = 𝐄(𝐗) 12,5 𝐄(𝐗 𝟐 ) 230,0278

Yukarıdaki tablo yardımıyla X rassal değişkeninin varyansı aşağıdaki gibi hesaplanır.


𝐕𝐚𝐫(𝐗) = 230,0278 − 12,52 = 𝟕𝟑, 𝟕𝟖
Sonuç: Var(X) = 73,78
Örnek (KPSS 2011 Soru 6): Beklenen değeri 1 varyansı 5 olan bir rassal değişkeni X
olarak adlandıralım ve (𝟐 + 𝐗)𝟐 rassal değişkeninin beklenen değerini hesaplayalım.
Çözüm: Öncelikle örnekte verilen bilgileri matematiksel olarak ifade edelim.
E(X) = 1 ve Var(X) = 5 olduğunu biliyoruz. Örnekte bizden istenen değer ise: E((2 + X)2 ).
𝐄((𝟐 + 𝐗)𝟐 ) = E(4 + 4X + X 2 )
= E(4) + E(4X) + E(X 2 )
= 4 + 4E(X) + E(X 2 )
= 4 + 4×1 + E(X 2 )
ŞimdiE(X 2 ) değerini, X rassal değişkeninin varyansının 5 olduğu bilgisini kullanarak
hesaplayalım.
Var(X) = E(X 2 ) − E(X)2 eşitliği ile 5 = E(X 2 ) − 12 eşitliği ile aynıdır.
Son eşitlikten X 2 ’nin beklenen değeri 6 olarak bulunur.
Dolayısıyla, E((2 + X)2 )değeri 4+4+6'dan 14'dir.
Sonuç: 𝐄((𝟐 + 𝐗)𝟐 ) = 𝟏𝟒

Örnek: Aşağıdaki tabloda X rassal değişkeninin aldığı değerler ve bu değerlerin aldığı


olasılıklar yer almaktadır. 𝐘 = (𝟐𝐗 + 𝟏)𝟐 olduğu durum için Var(Y) değerini
hesaplayalım.

X -3 6 9 12
P(X=x) 1/10 1/2 1/5 1/5

Çözüm: 𝐕𝐚𝐫(𝐘) = Var((2X + 1)2 )


= Var(4X 2 + 4X + 1)
= Var(4X 2 + 4X)
= 16Var(X 2 ) + 16Var(X)
Y rassal değişkenin varyansını hesaplayabilmemiz için, X ve X 2 rassal değişkenlerinin
varyansını hesaplayıp, yukarıda hesapladığımız eşitlikte değerleri yerine yazmamız gerekir.
Örneğin başka bir yöntem ile çözmek istersek eğer, ilk basamak olarak Y rassal değişkenini
oluştururuz, ikinci basamak olarak ise oluşturduğumuz Y rassal değişkeninin varyansını
hesaplarız. Örneği bu yöntem ile çözümleyip, başlangıçta anlattığımız yöntemin detaylı
çözümünü okuyucuya bırakıyoruz.

X -3 6 9 12
𝐘 = (𝟐𝐗 + 𝟏) 𝟐 25 169 361 625
𝐘𝟐 625 28561 130321 390625
P(X=x) 1/10 1/2 1/5 1/5

Yukarıdaki tabloda Y veY 2 rassal değişkenlerinin aldığı değerler yer almaktadır. Bu bilgiler
doğrultusunda, Y rassal değişkeninin beklenen değeri:
1 1 1 1
𝐄(𝐘) = 25× + 169× + 361× + 625× = 𝟐𝟖𝟒, 𝟐𝟎
10 2 5 5
Y 2 rassal değişkeninin beklenen değeri:
1 1 1 1
𝐄(𝐘 𝟐 ) = 252 × + 1692 × + 3612 × + 6252 × = 𝟏𝟏𝟖𝟓𝟑𝟐, 𝟐𝟎
10 2 5 5
Var(Y) = E(Y 2 ) − E(Y)2 eşitliğinden Y rassal değişkeninin varyansı aşağıdaki gibi hesaplanır.
𝐕𝐚𝐫(𝐘) = 118532,20 − 284,202 = 𝟑𝟕𝟕𝟔𝟐, 𝟓𝟔𝟓
Sonuç: Var(Y)=37762,565.

Örnek: X rassal değişkeni eşit olasılıklarla 2, 4, 6 ve 8 değerlerini aldığını varsayalım. X


rassal değişkeninin beklenen değerini, varyansını hesaplayalım.
Çözüm: Beklenen değeri hesaplayabilmemiz için X rassal değişkeninin aldığı değerleri
olasılıklarıyla çarpıp toplamamız gerekir. X rassal değişkeninin aldığı değerlerin olasılıkları eşit
olduğundan, beklenen değer ile ortalaması aynıdır. Öyleyse,
1 1 1 1 1 20
𝐄(𝐗) = 4 2 + 4 4 + 4 6 + 4 8 = 4 (2 + 4 + 6 + 8) = = 𝟓, yani beklenen değeri beştir.
4
Şimdi X rassal değişkeninin varyansını hesaplayalım. Varyans değerini hesaplayabilmek için
ortalamadan ne kadar saptığını bulmamız gerekir. Aşağıdaki (1) numaralı formülü kullanarak
X rassal değişkeninin varyansını hesaplayalım.
∑(𝐗 − 𝐗 ˉ)𝟐
𝐕𝐚𝐫(𝐗) = 𝐄((𝐗 − 𝐗 ˉ) = 𝟐) (1)
𝐧−𝟏
(1). eşitlikte toplamın (n-1)'e bölünmesi X rassal değişkenin örneklem olmasından
kaynaklanmaktadır. Eğer popülasyon olsaydı gözlem sayısına yani n'ye bölerek varyansı
hesaplamamız gerekirdi. (1). eşitlikten varyans değerini hesaplayabilmek için aşağıdaki
tablodan yardım alalım. Aşağıdaki tablonun ilk sütunun da X rassal değişkeninin aldığı
değerler, ikinci sütunda X'in beklenen değerden uzaklığı ve son sütunda ise X'in beklenen
değerden uzaklığının karesi yer almaktadır. Son sütunda yer alan değerleri toplayıp,
bulduğumuz değeri X rassal değişkeni toplamda dört değer aldığından (4-1), yani 3'e bölmemiz
gerekir.

Tablo: X Rassal Değişkeninin Varyansının Hesaplanması

X 𝐗 − 𝐗ˉ (𝐗 − 𝐗ˉ)𝟐
2 2 - 5 = -3 9
4 4 - 5 = -1 1
6 6-5=1 1
8 8-5=3 9
Toplam 20
∑(X−Xˉ)2 20 𝟐𝟎
Öyleyse,𝐕𝐚𝐫(𝐗) = = 4−1 =
n−1 𝟑
𝟐𝟎
Sonuç: 𝐕𝐚𝐫(𝐗) = 𝟑
STANDART SAPMA: Herhangi bir rassal
değişkenin varyansının karekök değeri standart
sapma değerini verir. Standart sapma, olasılık
dağılımının yayılmasının bir ölçütüdür. Standart
sapma değerinin büyük (küçük) olması, X rassal
değişkeninin değerlerinin ortalamanın geniş (dar)
aralığında yer aldığını gösterir. X rassal
değişkeninin standart sapması genellikle 𝜎X ile
gösterilir ve aşağıdaki formül yardımıyla
hesaplanır.

𝝈𝐗 = √𝐕𝐚𝐫(𝐗)=√𝐄((𝐗 − 𝐄(𝐗))𝟐 )=√𝐄(𝐗 𝟐 ) − 𝐄(𝐗)𝟐

ÖNEMLİ NOT: Bu ölçü “Acaba gözlemler ortalamadan ortalama olarak ne kadar uzağa
düşer? sorusuna cevap olur.

Örnek: ABC hisse senedi beş yıl boyunca sırasıyla %5, -%3, -%4, %2 ve %6 getiri
sağlamıştır. Bu hisse senedinin standart sapmasını hesaplayalım.
Çözüm: Hisse senedinin getirilerini rassal değişken gibi düşünürsek ve bu değişkeni X ile
gösterirsek; X rassal değişkeninin alacağı değerler sırasıyla %5, -%3, -%4, %2 ve %6'dır.
X rassal değişkeninin standart sapmasını hesaplayabilmemiz için öncelikle X ve X 2 rassal
değişkenlerinin beklenen değerlerini hesaplamamız gerekir Bu değerlerle birlikte X rassal
değişkeninin varyansını buluruz. Varyansın karekök değeri standart sapmayı verdiğinden bu
işlemlerle birlikte örnekte bizden istenilen değer hesaplanmış olur.
𝐄(𝐗) = (0,2×0,05) + (0,2×−0,03) + (0,2×−0,04) + (0,2×0,02) + (0,2×0,06)
= 0,01 − 0,006 − 0,008 + 0,004 + 0,012
= 𝟎, 𝟎𝟏𝟐
𝐄(𝐗 ) = (0,2×0,052 ) + (0,2×−0,032 ) + (0,2×−0,042 ) + (0,2×0,022 ) + (0,2×0,062 )
𝟐

= 0,0005 + 0,00018 + 0,00032 + 0,00008 + 0,00072


= 𝟎, 𝟎𝟎𝟏𝟖
Var(X) = E(X 2 ) − E(X)2 eşitliğinden Var(X) aşağıdaki gibi hesaplanır.
𝐕𝐚𝐫(𝐗) = E(X 2 ) − E(X)2 = 0,0018 − 0,0122 = 𝟎, 𝟎𝟎𝟏𝟔𝟓𝟔
Sonuç: 𝐕𝐚𝐫(𝐗) = 𝟎, 𝟎𝟎𝟏𝟔𝟓𝟔

Örnek: A, B ve C veri setleri aşağıdaki gibi olsun.

A 4 5 6 2 8
B 5 5 5 5 5
C 1 1 5 9 9

a) A, B ve C veri setlerinin ortalamalarını hesaplayalım.


b) A, B ve C veri setlerinin standart sapmalarını hesaplayalım.
4+5+6+2+8 25
Çözüm a) 𝐄(𝐀) = = =𝟓
5 5
5 + 5 + 5 + 5 + 5 25
𝐄(𝐁) = = =𝟓
5 5
1 + 1 + 5 + 9 + 9 25
𝐄(𝐂) = = =𝟓
5 5
Üç veri setinin de ortalama değeri beştir.
√(4−5)2 +(5−5)2 +(6−5)2 +(2−5)2 +(8−5)2
b) 𝛔𝐀 = =2
5
√(5 − 5)2 + (5 − 5)2 + (5 − 5)2 + (5 − 5)2 + (5 − 5)2
𝛔𝐁 = =𝟎
5
√(1 − 5)2 + (1 − 5)2 + (5 − 5)2 + (9 − 5)2 + (9 − 5)2
𝛔𝐂 = = 𝟑, 𝟓𝟖
5
Standart sapması en yüksek veri seti C, en düşük veri seti ise B'dir.
NOT: B veri seti hep aynı değeri aldığı için standart sapma değerini hesaplamadan sıfır
olduğunu söyleyebilirdik.
Örnek: Aşağıdaki tabloda gösterilen gruplandırılmış serinin standart sapmasını
hesaplayalım.

Gruplar Frekans
100-150 5
150-200 10
200-250 8
250-300 6
300-350 12
350-400 4
Çözüm: İlk adım olarak gruplandırılmış değerlerin ortalama değerini hesaplayıp, rassal
değişkenin alabileceği ortalama değeri ve frekans değeri yardımı ile bu değerlerin gerçekleşme
olasılıklarını hesaplayalım. Aşağıdaki tabloda bu hesaplamalar gösterilmiştir.

Gruplar Değer Frekans Olasılık


100-150 (100+150)/2 = 125 5 = 5/45=0,1111
150-200 (150+200)/2 = 175 10 =10/45=0,2222
200-250 (200+250)/2 = 225 8 =8/45=0,1778
250-300 (250+300)/2 =275 6 =6/45=0,1333
300-350 (300+350)/2 =325 12 =12/45=0,2667
350-400 (350+400)/2 =375 4 =4/45=0,0889

Yukarıdaki tablodan elde ettiğimiz bilgileri, gruplandırılmış seriden elde edilen X rassal
değişkeni olarak adlandırırsak. X rassal değişkeninin aldığı değerler ikinci sütunda, bu
değerlerin gerçekleştirme olasılıkları 4. sütunda yer alır.

Standart sapma, varyansın karekök değeri olduğundan X rassal değişkeninin standart sapmasını
hesaplamak için öncelikle X ve X2 rassal değişkenlerinin beklenen değerlerini hesaplamamız
gerekir.
• X rassal değişkeninin beklenen değeri: E(X)
E(X) = 125×0,11 + 175×0,22 + 225×0,18 + 275×0,13 + 325×0,27 + 375×0,09
E(X) = 249,4444
• X2 rassal değişkeninin beklenen değeri:
E(X 2 ) = 1252 ×0,11 + 1752 ×0,22 + 2252 ×0,18 + 2752 ×0,13 + 3252 ×0,27 + 3752 ×0,09
E(X 2 ) = 68291,67
Bu bilgiler doğrultusunda X rassal değişkeninin varyansı:
Var(X) = E(X 2 ) − E(X)2 = 68291,27 − 249,442 = 6069,136
Standart Sapması: 77,9047 olarak bulunur.
DEĞİŞİM KATSAYISI: Standart sapma ölçü biriminin etkisinde olan bir kavramdır.
Dolayısıyla bir değişkenin homojen ya da heterojen olduğunu göstermez. İfade edemez.
Değişim katsayısı iki veya daha fazla serinin dağılımlarını karşılaştırarak hangi gözlem
kümesindeki birimlerin daha homojen olduklarını belirlemek amacıyla kullanılan bir ölçüdür
(Güler, 2005:84).

ÖNEMLİ NOT: Karşılaştırılan gözlem kümelerinin ayrı ölçüm birimi olduğu durumlarda veya
aynı ölçüm birimi ancak gözlem kümesinin rakamları arasında çok büyük farklar bulunduğunda
kullanılır. Aynı ölçüm birimi ve rakamlar arasında büyük farklar yoksa standart sapma
kullanılır. Ancak Güler’e göre hangi durum söz konusu olursa olsun değişim katsayılarının
hesaplanması ve karşılaştırmanın bu ölçüye dayanarak yapılması daha faydalıdır (2005:85).

Örnek: Aşağıdaki tabloda ortalama ve standart sapma değerleri verilen X, Y ve Z rassal


değişkenlerini karşılaştırınız.
Değişken Ortalama Standart Sapma
X 30 5
Y 40 4
Z 10 3

Çözüm: Değişkenlikleri karşılaştırmak için üç değişken içinde varyasyon katsayısını


hesaplamamız gerekir.

5
• X Değişkeninin Varyasyon Katsayısı: 30 ×100 = 16,67

4
• Y Değişkeninin Varyasyon Katsayısı: 40 ×100 =10

3
• Z Değişkeninin Varyasyon Katsayısı: ×100 = 30
10

En küçük standart sapma değeri Z değişkenin de olmasına rağmen en büyük varyasyon katsayısı
Z değişkeninindir. Bu durumda en fazla değişkenlik Z rassal değişkenindedir.
Örnek: Ülkelerin gelir dağılımını gösteren tablo aşağıdaki gibidir. Hangi ülkenin gelir
dağılımında daha çok değişkenlik olduğunu hesaplayalım.
Değişken Ortalama Standart Sapma
A 25 5
B 50 7
C 40 6
D 60 4

Çözüm: Değişkenlikleri karşılaştırmak için 4 ülkenin varyasyon katsayısını hesaplamamız


gerekir.
5
• A Ülkesinin Varyasyon Katsayısı: 25 ×100 = 20
7
• B Ülkesinin Varyasyon Katsayısı: 50 ×100 = 14
6
• C Ülkesinin Varyasyon Katsayısı: ×100 = 15
40
4
• D Ülkesinin Varyasyon Katsayısı: ×100 = 6,67
60

En büyük varyasyon katsayısı A ülkesine ait olduğundan, en fazla değişkenliği A ülkesi


göstermektedir.
KOVARYANS: İki rassal değişken arasındaki ilişki Kov(X,Y) olarak gösterilir ve aşağıdaki
gibi hesaplanır.
𝐊𝐨𝐯(𝐗, 𝐘) = 𝐄((𝐗 − 𝐄(𝐗))(𝐘 − 𝐄(𝐘)))
Yukarıdaki eşitliği yani kovaryansın matematiksel tanımını kullanarak, başka bir formül elde
edelim. Eşitliğin sağ tarafındaki çarpma işlemini yaparak aşağıdaki eşitliği yazalım.
Kov(X, Y) = E((X − E(X))(Y − E(Y)))
= E(XY − XE(Y) − E(X)Y + E(X)E(Y))
Şimdi beklenen değerin özelliklerini kullanalım.
= E(XY) − E(XE(Y)) − E(E(X)Y) + E(E(X)E(Y))
= E(XY) − E(Y)E(X) + E(X)E(Y) + E(X)E(Y)
Dolayısıyla, 𝐊𝐨𝐯(𝐗, 𝐘) = 𝐄(𝐗𝐘) − 𝐄(𝐘)𝐄(𝐗) eşitliği sağlanmaktadır.

KOVARYANSIN ÖZELLİKLERİ

1. Herhangi X rassal değişkeni için, 𝐊𝐨𝐯(𝐗, 𝐗) = 𝐕𝐚𝐫(𝐗)eşitliği sağlanır.


Kov(X, X) = E(X×X) − E(X)E(X)
= E(X 2 ) − E(X)2
=Var(X)
NOT: Kovaryans tanımsal olarak iki değişkenin arasındaki ilişkiyi, ilişkinin gücünü ifade
etmeden belirtir. Kendi ile ilişkisi ise varyansı yani değişimini ifade eder.
2. Herhangi X ve Y rassal değişkenleri için, 𝐊𝐨𝐯(𝐗, 𝐘) = 𝐊𝐨𝐯(𝐘, 𝐗)eşitliği sağlanır.
3. Eğer V ve W iki rassal değişken ve 𝐘 = 𝐕 + 𝐖ise aşağıdaki eşitlik sağlanır.
𝐊𝐨𝐯(𝐗, 𝐘) = 𝐊𝐨𝐯(𝐗, 𝐕) + 𝐊𝐨𝐯(𝐗, 𝐖)
Kov(X, Y) = Kov(X, V + W)
= E(X(V + W)) − E(X)E(V + W)
= E(XV + XW) − E(X)(E(V) + E(W))
= E(XV) + E(XW) − E(X)E(V) − E(X)E(W)
= Kov(X, V) + Kov(X, W)
4. Eğer b sabit bir sayı, Z rassal değişken ve𝐘 = 𝐛𝐙 ise,𝐊𝐨𝐯(𝐗, 𝐘) = 𝐛𝐊𝐨𝐯(𝐗, 𝐙)eşitliği
sağlanır.
Kov(X, Y) = Kov(X, bZ)
= E(XbZ) − E(X)E(bZ) = bE(XZ) − E(X)bE(Z)
= b(E(XZ) − E(X)E(Z))
= b Kov(X, Z)
5. Eğer b sabit sayı ve 𝐘 = 𝐛 ise,𝐊𝐨𝐯(𝐗, 𝐘) = 𝟎eşitliği sağlanır.
Kov(X, Y) = Kov(X, b)
= E(Xb) − E(X)E(b)
= bE(X) − E(X)b
=0
NOT: Sabit bir sayı ile rassal değişken arasında bir ilişki oluşturulamaz. Biri artarken (ki bu
mutlaka rassal değişken olmalı diğeri sabit), diğeri artar mı? Sorusunun cevabı sabit
olduğundan aralarında ilişki olmadığını söyler.
Örnek: 𝐕𝐚𝐫(𝐗 + 𝐘) = 𝐕𝐚𝐫(𝐗) + 𝐕𝐚𝐫(𝐘) + 𝟐𝐊𝐨𝐯(𝐗, 𝐘) eşitliğini gösterelim.
Çözüm: Var(X + Y) = E((X + Y)2 ) − (E(X + Y))2 eşitliğini daha önce göstermiştik. Şimdi
kare açılımlarını yaparak sırasıyla aşağıdaki eşitliklere ulaşalım.
Var(X + Y) = E((X + Y)2 ) − (E(X + Y))2
= E(X 2 + 2XY + Y 2 ) − (E(X) + E(Y))2
Beklenen değerinin doğrusal olma özelliğini ve tekrar kare açılımını kullanarak sırasıyla
aşağıdaki eşitliklere ulaşalım.
𝐕𝐚𝐫(𝐗 + 𝐘) = E(X 2 ) + E(Y 2 ) + E(2XY) − (E(X)2 + E(Y)2 + 2E(X)E(Y))
= E(X 2 ) + E(Y 2 ) + 2E(XY) − E(X)2 − E(Y)2 − 2E(X)E(Y)
= [E(X 2 ) − E(X)2 ] + [E(Y 2 ) − E(Y)2 ] + 2[E(XY) − E(X)E(Y)]
= 𝐕𝐚𝐫(𝐗) + 𝐕𝐚𝐫(𝐘) + 𝟐𝐊𝐨𝐯(𝐗, 𝐘)
Sonuç: 𝐕𝐚𝐫(𝐗 + 𝐘)=𝐕𝐚𝐫(𝐗) + 𝐕𝐚𝐫(𝐘) + 𝟐𝐊𝐨𝐯(𝐗, 𝐘) eşitliği sağlanır.

ÖNEMLİ NOT:

Var(X+Y+Z)= Var(X)+Var(Y)+Var(Z)+2Kov(X,Y)+Kov(X,Z)+Kov(Y,Z)

Örnek: X rassal değişkeni 1, 2, 3, 4 değerlerini sırasıyla 0,1, 0,2, 0,3, 04 olasılıklarıyla


alıyor. Y rassal değişkeni ise aynı değerleri sırasıyla 0,4, 0,3, 0,2 ve 0,1 olasılıklarıyla alıyor.
X ve Y rassal değişkeninin kovaryansını hesaplayalım.
Çözüm: X ve Y rassal değişkenlerinin kovaryansını hesaplayabilmek için, öncelikle X ve Y
rassal değişkenlerinin beklenen değerlerini hesaplamamız gerekir. Daha sonra bu değerlerin
yardımıyla
(X − E(X))(Y − E(Y)) rassal değişkenini oluştururuz.
Bulduğumuz rassal değişkenin beklenen değeri kovaryans değerini verir. Aşağıdaki tabloda
rassal değişkenlerin beklenen değerlerini ve kovaryansını hesaplamak için gerekli işlemler
yapılmıştır.
Tablo: Kov(X,Y) Hesaplanması

X ve Y P(X) P(Y) XP(Y) YP(Y) X-E(X) Y-E(Y)


1 0,1 0,4 0,1 0,4 1-3 = -2 1-2 = -1
2 0,2 0,3 0,4 0,6 2-3 = -1 2-2 = 0
3 0,3 0,2 0,9 0,6 3-3 = 0 3-2 = 1
4 0,4 0,1 1,6 0,4 4-3 = 1 4-2 = 2
Beklenen Değer 3 2
𝐄(𝐗) = 1×0,1 + 2×0,2 + 3×0,3 + 4×0,4 = 𝟑
𝐄(𝐘) = 1×0,4 + 2×0,3 + 3×0,2 + 4×0,1 = 𝟐
Kov(X, Y), [(X − E(X))(Y − E(Y)) rassal değişkeninin beklenen değerine eşit olacağından,
aşağıdaki tabloda [(X − E(X))(Y − E(Y))]rassal değişkeninin aldığı değerler ve bu değerleri
alma olasılıklarını hesaplayalım.
Tablo: Kov (X,Y)'nin Hesaplanması

X- P(X- Y- P(Y- [X-E(X)][Y- P([X-E(X)][Y- [X-E(X)][Y-E(Y)]


E(X) E(X)) E(Y) E(Y)) E(Y)] E(Y)]) P([X-E(X)][Y-
E(Y)])
-2 0,1 -1 0,4 2 0,1×0,4 = 0,04 0,08
-2 0,1 0 0,3 0 0,1×0,3 = 0,03 0
-2 0,1 1 0,2 -2 0,1×0,2 = 0,02 -0,04
-2 0,1 2 0,1 -4 0,1×0,1 = 0,01 -0,04
-1 0,2 -1 0,4 1 0,2×0,4 = 0,08 0,08
-1 0,2 0 0,3 0 0,2×0,3 = 0,06 0
-1 0,2 1 0,2 -1 0,2×0,2 = 0,04 -0,04
-1 0,2 2 0,1 -2 0,2×0,1 = 0,02 -0,04
0 0,3 -1 0,4 0 0,3×0,4 = 0,12 0
0 0,3 0 0,3 0 0,3×0,3 = 0,09 0
0 0,3 1 0,2 0 0,3×0,2 = 0,06 0
0 0,3 2 0,1 0 0,3×0,1 = 0,03 0
1 0,4 -1 0,4 -1 0,4×0,4 = 0,16 -0,16
1 0,4 0 0,3 0 0,4×0,3 = 0,12 0
1 0,4 1 0,2 1 0,4×0,2 = 0,08 0,08
1 0,4 2 0,1 2 0,4×0,1 = 0,04 0,08
Toplam 0
Yukarıdaki tablonun son sütunundaki değerlerinin toplamı Kov(X, Y)′yi, yani 0'ı vermektedir.
Örnek: a, b sabit sayılar, Y rassal değişken ve 𝐗 = 𝐚 + 𝐛𝐘 ise
𝐊𝐨𝐯(𝐗, 𝐘)′𝐧𝐢𝐧 𝐛𝐕𝐚𝐫(𝐘)′𝐲𝐞eşit olduğunu gösterelim.
Çözüm: 𝐊𝐨𝐯(𝐗, 𝐘) = Kov(a + bY, Y)=E((a + bY)Y) − E(a + bY)E(Y)
= E(aY + bY 2 ) − (E(a) + E(bY))E(Y)
= aE(Y) + bE(Y 2 ) − (a + bE(Y))E(Y)
= aE(Y) + bE(Y 2 ) − aE(Y) − bE(Y)2
= a(E(Y) − E(Y)) + b(E(Y 2 ) − E(Y)2 )
= 𝐛𝐕𝐚𝐫(𝐘)
Sonuç: Kov(X, Y) = bVar(Y)

Örnek: 𝐄(𝐗) = 𝟒, 𝐄(𝐗 𝟐 ) = 𝟐𝟔, 𝟔, 𝐄(𝐘) = 𝟓,𝐄(𝐘 𝟐 ) = 𝟒𝟗, 𝟔 ve Var(X+Y) = 8.


Bu bilgiler doğrultusunda 𝐊𝐨𝐯(𝐗 + 𝐘, 𝐗 + 𝟏, 𝟒𝐘)değerini hesaplayalım.
Çözüm: Kovaryans ve varyans fonksiyonlarının özellikleri kullanılarak sırasıyla aşağıdaki
eşitlikler elde edilir.
𝐊𝐨𝐯(𝐗 + 𝐘, 𝐗 + 𝟏, 𝟒𝐘) = Kov(X + Y, X) + Kov(X + Y, 1,4Y)
= Kov(X, X) + Kov(Y, X) + Kov(X, 1,4Y) + Kov(Y, 1,4Y)
= Var(X) + Kov(Y, X) + 1,4Kov(X, Y) + 1,4Kov(Y, Y)
= Var(X) + 2,4Kov(X, Y) + 1,4Var(Y)
Örnekte bizden istenilen kovaryans değerini bulabilmek için öncelikle Var(X), Kov(X,Y) ve
Var(Y) değerlerini hesaplamamız gerekir.
Var(X) = E(X 2 ) − E(X)2 eşitliğinden 𝐕𝐚𝐫(𝐗) = 26,6 − 16 = 𝟏𝟎, 𝟔ve
𝐕𝐚𝐫(𝐘) = 49,6 − 25 = 𝟐𝟒, 𝟔 değerleri hesaplanır. Şimdi aşağıda yer alan eşitliği kullanarak
kovaryans değerini hesaplayalım.
Var(X + Y) = Var(X) + Var(Y) + 2Kov(X, Y)
8 = 10,6 + 24,6 + 2Kov(X, Y)
8 = 35,2 + 2Kov(X, Y)
8 − 35,2
𝐊𝐨𝐯(𝐗, 𝐘) = = −𝟏𝟑, 𝟔
2
Bu bilgiler doğrultusunda örnekte bizden istenen kovaryans değeri aşağıdaki gibi hesaplanır.
𝐊𝐨𝐯(𝐗 + 𝐘, 𝐗 + 𝟏, 𝟒𝐘) = Var(X) + 2,4 Kov(X, Y) + 1,4Var(Y)
= 10,6 + 2,4(−13,6) + 1,4(24,6)
= 𝟏𝟐, 𝟒𝟎
Sonuç: 𝐊𝐨𝐯(𝐗 + 𝐘, 𝐗 + 𝟏, 𝟒𝐘) = 𝟏𝟐, 𝟒𝟎
KORELASYON KATSAYISI: İki değişken arasında doğrusal bir ilişki olup olmadığını, eğer
değişkenler arasında doğrusal bir ilişki varsa, bu ilişkinin yönünü ve şiddetini belirlemek için
kullanılan katsayıdır. Bu katsayı yardımı ile iki değişken arasında anlamlı bir ilişki var mıdır
sorusunun cevabı aranır.

❖ Korelasyon katsayısı her zaman -1 ile 1 arasında değer alır.


❖ Korelasyon katsayısı 0 ise, değişkenler arasında ilişki yoktur.

Korelasyon katsayısı POZİTİF ise (0 ile 1 arasında ise) "değişkenlerden biri artarken
(azalırken) diğeri de artmaktadır (azalmaktadır)" yorumu yapılır. Kısaca değişkenlerin
arasında pozitif yönlü bir ilişki olduğu
yani değişkenlerin birlikte hareket
ettiği söylenir.

Korelasyon katsayısı NEGATİF ise (-


1 ile 0 arasında ise) “değişkenlerden
biri artarken (azalırken) diğeri
azalmaktadır (artmaktadır)”
yorumu yapılır. Kısaca değişkenlerin
arasında negatif yönlü bir ilişki
olduğu yani değişkenlerin zıt yönlü
hareket ettiği söylenir.

Korelasyon katsayısı +1 ve -1’e yaklaştıkça aralarındaki ilişkinin şiddeti artar, 0’a yaklaştıkça
ise aralarındaki ilişkinin şiddeti azalır.
PEARSON???
KORELASYON ANALİZİNİN AMACI
SPEARMAN???
❖ Değişkenler arası ilişkinin açıklanmasına
KENDALL’S???
yardımcı olmak
❖ Benzer sonuçları önceden tahmin etmek

Değişkenlerin normal dağılıma sahip olması durumunda PEARSON Korelasyon Katsayısı,


değişkenlerin normal dağılmadığı durumda ise SPEARMAN RANK Korelasyon Katsayısı
kullanılır. Değişkenlerden biri nominal biri aralıklı olduğu durumda da KENDALL’S
Korelasyon Katsayısı kullanılır.

Pearson Korelasyon Katsayısı, iki sürekli değişkenin doğrusal ilişkisinin derecesinin


ölçümünde kullanılır. Korelasyon katsayısı hesaplanmadan önce mutlaka serpilme grafiği
yapılarak DOĞRUSAL İLİŞKİ OLUP OLMADIĞI kontrol edilmelidir.

𝐾𝑜𝑣(𝑋, 𝑌)
𝜌𝑋,𝑌 =
√𝑉𝑎𝑟(𝑋)√𝑉𝑎𝑟(𝑌)
Örnek: X: 2, 4, 0, 6 ve Y: 4, 3, 2, 1
a) E(2X+3) b) E(2Y+4X) c) Var(2X+3) d) Kov(2X+3, 3Y+1)
e) 2X ve 4Y+3 arasındaki korelasyon katsayısını hesaplayıp, yorumlayınız.
Çözüm a) E(2X+3) = ?
1. Yöntem E(2X+3)= E(2X)+ E(3)= 2E(X) + 3
E(X) = ? E(X) = (2+4+0+6)/4 =3
2*3 + 3

E(2X+3)=9
2. Yöntem X: 2, 4, 0, 6

2X+3 (Yeni bir rassal değişken oluşturulur)

2X+3: 2*2+3 4*2+3 0*2+3 6*2+3

Yeni oluşturulan rassal değişkenin beklenen değeri hesaplanır.


E(2X+3) (7+11+3+15)/4=36/4=9 E(2X+3)=9
b) E(2Y+4X) = ?
E(2Y+4X) = E(2Y) + E(4X) = 2 E(Y) +4 E(X)

E(X) = (2+4+0+6)/4= 3 = 2*2,5 +4 *3


E(Y) = (4+3+2+1)/4= 5/2=2,5
E(2Y+4X)=17
c) Var(2X+3) = ?
Var(X) = E(X2)-E(X)2
E(X2) = (4+16+0+36)/4=56/4=14
Var(X) = 14-32=5
Var(2X+3) = Var(2X) = 4 Var(X) = 4 *5 = 20
d) Kov(2X+3, 3Y+1) = ?
Kov(2X+3,3Y+1) = Kov(2X+3,3Y) + Kov(2X+3,1)
= Kov(2X,3Y) + Kov(3,3Y) + Kov(2X,1) + Kov(3,1)
= 6 Kov(X,Y)
Bu durumda Kov(2X+3,3Y+1) değerini hesaplayabilmek için öncelikle Kov(X, Y) değerini
hesaplamamız gerekir.
Kov(X,Y) = ?
Kov(X,Y)=E(XY)-E(X)E(Y)
• E(XY) = (2*4 + 4*3 + 0*2 + 6*1)/4 = 26/4 = 13/2
• E(X) = (2+4+0+6)/4=3
• E(Y) = (4+3+2+1)/4 = 10/4=2,5
Bu bilgiler doğrultusunda Kov(X,Y) : Kov(X,Y)=E(XY)-E(X)E(Y)=6,5-3∗2,5=-1
Kov(2X+3, 3Y+1) =6 Kov(X,Y)=6*(-1)=-6

SPEARMAN KORELASYON KATSAYISI: Pearson Korelasyon Katsayısının parametrik


olmayan karşılığıdır. Değişkenlerden birisinin ya da ikisinin birden normal dağılım
sergilemediği durumlarda kullanılır.
Değişkenler sıralı ölçekle elde edilmiş ise bu durumda da Spearman korelasyon analizi
uygulanabilir. Spearman korelasyon katsayısı aşağıdaki formülle hesaplanır ve Pearson
korelasyon katsayısı gibi yorumlanır.

6 ∑𝑛𝑖=1 𝑑𝑖2
𝜌𝑋,𝑌 = 1 −
𝑛(𝑛2 − 1)

n: Gözlem Sayısı 𝑑𝑖 = 𝑆𝚤𝑟𝑎 𝑋 − 𝑆𝚤𝑟𝑎 𝑌


UNUTULMAMASI GEREKENLER!!!
❖ Eğer değişkenler arasında tatmin edici büyüklükte bir ilişki varsa, bilinen değişkenin
değerinden bilinmeyen değişkenin değeri kestirilebilir.
❖ Korelasyon sadece ilişkinin gücü ile alakalıdır.
❖ Korelasyon nedensellik hakkında bir şey ifade etmez. Hangi değişkeninin hangi
değişkeni etkilediğinin bilgisi korelasyon analizi sonucunda ortaya çıkmaz.
Örnek: Aşağıdaki tabloda bilgileri yer alan X ve Y değişkenleri için Spearman korelasyon
katsayısını hesaplayalım.

Gözlem Sayısı X Y
1 40 36
2 70 59
3 38 72
4 26 38
5 38 50

Çözüm: Birinci adım olarak Sıra X ve Sıra Y değerlerini bulalım. Eğer değişkenlerin tekrar
eden değerleri yoksa sıralama en büyükten en küçüğe doğru devam eder.
Gözlem Sayısı X Y Sıra X Sıra Y
1 40 36 2 5
2 70 59 1 2
3 38 72 3,5 1
4 26 38 5 4
5 38 50 3,5 3
X değişkeninin sıralaması oluşturulurken, öncelikle aldığı değerleri en büyükten en küçüğe
sıralayın: 70, 40, 38, 38, 26.
En büyük değer 70 olduğundan, 70 değeri ilk sırada olmalıdır. X değişkeninin 70’den sonra
aldığı en büyük değer 40 olduğundan, 40 değeri ikinci sırada yer almalıdır. X değişkeni 40’dan
sonra en büyük değer olarak iki kere 38 değerini almaktadır. Bunlardan birinin 3 diğerinin 4
olması gerekirken, hangisine hangi değeri vereceğimize karar vermenin zorluğu ve yanlışlığı
nedeniyle, 3 ve 4’ün ortalamasını yani 3,5 değeri iki 38 değerinin sırası olur. X değişkeninin
38’den sonra aldığı en büyük değer ise 26 olduğundan, 4. sırayı da kullanmış olduğumuz için
26’nın sıra değeri 5 olmalıdır. Y değişkeninde tekrarlanan değer olmadığından sıralaması en
büyükten en küçüğe yukarıdaki tablodaki gibi oluşturulur.
Sıra X ve Sıra Y değerlerinin farkından formülde yer alan ve sıraların farklarından tanımlanan
d değeri hesaplanır.

Gözlem Sayısı X Y Sıra X Sıra Y


d = Sıra X- Sıra Y 𝐝𝟐
1 40 36 2 5 2-5=-3 9
2 70 59 1 2 1-2=-1 1
3 38 72 3,5 13,5-1=2,5 6,25
4 26 38 5 4 5-4=1 1
5 38 50 3,5 33,5-3=0,5 0,25
TOPLAM 17,5
Spearman korelasyon katsayısını hesaplayabilmemiz için gereken değişkenleri
oluşturduk.

6 ∑𝑛𝑖=1 𝑑𝑖2 6×17,5


𝜌𝑋,𝑌 = 1 − = 1 − = 0,125
𝑛(𝑛2 − 1) 5(52 − 1)
Örnek: X ve Y’nin korelasyon katsayısı 0,4 olduğu bilgisi doğrultusunda 2X ve –Y
değişkenlerinin korelasyon katsayısı nedir?
Kov(2X, −Y) −2Kov(X, Y) −2Kov(X, Y)
ρ2X,−Y = = = = −ρX,Y = −0,4
√Var(2X)√Var(−Y) √4Var(X)√1Var(Y) 2√Var(X)√Var(Y)

You might also like