Professional Documents
Culture Documents
Temel Istatiksel Kavramlar
Temel Istatiksel Kavramlar
Temel Istatiksel Kavramlar
DEĞİŞKENLER
Değişken en güzel sabit olmayan, durumdan duruma, zamandan zamana değişen ve belki de
farklılaşan bir istatistiki terim olarak ifade edilebilir. Analiz yaparken başlıca kaynak, kullanılan
değişkenler olarak da tanımlanır. Her gözleme göre farklı değer alabilen objelere, özelliklere,
durumlar da değişken olarak adlandırılır. İstatistiki olarak değişkenleri farklı farklı
gruplandırıp, tanımlamamız mümkündür. Bir açıdan Nicel ve Nitel, bir diğer açıdan Sürekli ve
Süreksiz (Kesikli) değişkenler olarak farklı kategorilerde incelenebilir.
Ekonomide yer alan makro değişkenler çoğunlukla zaman serisi olduğundan zaman serisi
analizi ya da panel veri analizi uygulanır. Pazar araştırmalarında ise çoğunlukla anlık durum
incelenip karar vermeyi kolaylaştıracak analizler yapılmak istenildiğinden anlık durumu
gösteren kesit verilerle çalışılır.
Birincil Veri, İkinci Veri
Araştırmalar için toplanan veriler bir açıdan da birincil veya ikincil veri türleri olarak ikiye
ayrılır. Belirli bir amaca yönelik olarak yapılan çalışmalarda ilk elden toplanan veriye “Birincil
veri” denir. Birincil veriye örnek olarak yüksek lisans tezi için deney yapan ya da anket yolu
ile bilgi toplayan öğrenciler örnek gösterilebilir. İkincil veri kaynakları ise yapılacak olan
araştırmalarda araştırmacının ya da kurumun ilk elden elde edemediği çeşitli kitaplar,
dergilerdeki makaleler, çeşitli istatistiksel tablolar, tezler, raporlar, broşürler, kataloglardan elde
ettiği verilerdir. Örneğin Merkez Bankasının, Türkiye İstatistik Kurumu’nun yayınladığı veriler
ikincil veridir.
Nitel veriler istatistiki analizlerde kullanılırken iki farklı türde karşımıza çıkabilir. Örneğin bir
anket çalışmasında cinsiyet sorusunun kadın ve erkek olarak verilen cevabı bir açıdan Nominal
Veri türü olarak adlandırılır. Nominal veri sadece iki kategorili durumlar için değil, ikiden fazla
kategorili durumlar için de kullanılır. Örneğin medeni durum, saç rengi gibi…
Nominal=Kodlama (Kadın=1 ve Erkek =0 vb. değişkenler için kullanılır) Bir başka ifade ile
aralarında hiyerarşi olmayan değişkenler için kullanılır.
Aralarında sıralı ilişkinin (hiyerarşinin) bulunduğu veri türleri ise Ordinal Veri olarak
adlandırılır.
Ordinal=Sıralama (1=Hiç Katılmıyorum, 2=Katılmıyorum, 3=Kararsızım, 4=Katılıyorum,
5= Kesinlikle Katılıyorum)
NOT: Bu kavram LİKERT ölçeği olarak da adlandırılır. Bu kavram Anket Analizi kısmında
detaylı anlatılacaktır.
Scale = Ölçüm (Boy, Kilo, Yaş, Hacim vb. değişkenler için kullanılır)
ÖNEMLİ KAVRAMLAR
İstatistiksel analizlerde bir konuya veya bir birime ait bütün durumları gözlemlemek bazen çok
zor bazen ise imkânsızdır. Bu nedenle birimi temsil ettiği düşünülen alt kümeler seçilerek en
uygun olan (olduğuna inanılan) alt kümede analiz ya da çalışma yapılır. Bir ülkenin genel seçim
sonuçlarını önceden tahmin etmek istediğimizde, seçim tercihlerini bireylere önceden sorup
cevaplarını not alıp, sonucu tahmin etmemiz neredeyse imkânsızdır. Çünkü seçimde oy
kullanacak kişilerin sayısı yani popülasyonumuz, ülkenin vatandaşı olup, oy kullanma hakkı
olan herkestir. Öncelikle bu grubun tamamına ulaşmak için zamana ve paraya ihtiyacımız olur.
Diyelim ki bunlar elimizde, bu durumda bile kişilerin verdiği cevabın doğruluğundan emin
olamayız. Bu açıdan istatistikte örneklem diye ifade edilen tüm grubu yani popülasyonu temsil
ettiğini düşündüğümüz alt kümeler üzerinde çalışılır. Ancak bu alt kümenin doğru belirlenmesi
çok önemlidir. Örneğimiz üzerinden alt kümeleri inceleyelim. Çalışmayı ülkenin sadece bir
şehrinde gerçekleştirmek bir alt kümede yani bir örneklemde çalışmakla aynı şeydir. Fakat bu
örneklemde çalışmak bizi doğru sonuca ulaştırmaz. Aynı şehirde birbirine benzer yapıda
yaşayan insanların olması oldukça doğaldır. Bizim bu örnek için çalışılması gereken örneklem
ise oy kullanabilen her yaş grubundan, her eğitim düzeyinden gibi dikkat edilmesi gereken
parametreler düşünülüp ele alınmalıdır. Daha detaylı düşünürsek, ülkenin %60’ı kadınlardan
oluşuyorsa, seçilen örneklemin de yaklaşık yüzde %60’ı kadınlardan oluşması hedeflememiz
gerekir. Bu açıdan örneklemi oluşturmak bir arabanın prototipini oluşturabilmek ile aynıdır. Bu
yaklaşım rastlantısal örnekleme yöntemi olarak adlandırılır. Basit rastlantısal örneklemeye göre
anakütlede bulunan bütün birimlere örneğe girme açısından eşit şans tanınır (Güler, 2005). Bir
diğer yaklaşım ise sistematik örnekleme (sınırlandırılmış rastlantısal örnekleme), bu
yaklaşımda anakütlede bulunan birimlerden her k. birim örnek olarak alınır. k değeri ise genel
olarak anakütledeki birim sayısının çekilecek örnek sayısına bölünmesiyle elde edilir. Ancak
bu yaklaşımda anakütlede bulunan birimler (değerler) döngüsel bir eğilim gösteriyorsa
uygulanmaz. Literatürde buna benzer başka yaklaşımlarda bulunmaktadır. Bu yaklaşımlar
çalışacağınız anakütlenin yapısına göre değişiklik gösterir.
Özetle;
❖ Popülasyon (Anakütle): Bir veri kümesindeki tüm öğeleri içerir.
❖ Örneklem: Popülasyondan çekilen bir ya da daha fazla gözlemden oluşan ve ait olduğu
popülasyona ait özellikleri taşıdığı düşünülen alt kümedir.
İstatistiki literatürde popülasyonu tanımlamaya çalıştığımız (ortalama, standart sapma, vb.)
özellikler parametre olarak tanımlanır. Benzer şekilde örneklemi tanımlayan özellikler ise
istatistik olarak tanımlanır. Burada bahsedilen “İstatistik” kavramı aslında bir numunenin
ölçülebilir özellikleridir. Örneklemi oluşturma amacımız, örneklemi oluşturarak anakütlede
oluşacakları tahmin etmektir. Bunun içinde öncelikle anakütlenin parametrelerini tahmin
etmeye çalışırız. Anakütle parametrelerinin tahmini; nokta tahmini ve aralık tahmini (güven
sınırlarının hesaplanmasıdır) olarak genellikle iki biçimde gerçekleştirilir. Nokta tahmini
yapmak, değerin gerçekleşecek olan değerden farklı olma olasılığı çok yüksek olduğundan
oldukça risklidir. Aralık tahmini yapmak ise bu nokta tahminini genişletmektir. Bu tahmin
yönteminde güven sınırlarının hesaplanmasında anakütle parametresini belli bir olasılıkla
kapsayacak alt ve üst sınır değerleri bulunur.
Hata Türleri
Veri toplama aşamasında sıklıkla yapılan hatalar dört ana başlık altında incelenebilir
(Orhunbilge, 2014:69-74):
❖ Basit Hatalar: Araştırmayı yapan kişinin yorgunluk ve/veya dikkatsizlik nedeniyle
yaptıkları hatalardır. Bu hataların ortadan kaldırılması için sık kontroller yapılması
önerilir.
❖ Tesadüfi Hatalar: Örnekleme yöntemiyle yapılan hata türleridir. Bir örnek yardımı ile
tesadüfi hatalardan bahsedelim. 4 kişiden oluşan bir topluluk düşünelim. Bu 4 kişinin
aylık harcamaları aşağıdaki gibi olsun.
Kişi Aylık Harcama
1 1200
1600
2
1400
3
2000
4
Bu 4 kişinin aylık ortalama harcamasının hesaplanması gerektiği bir durumda,
anakütlenin tümü gözlendiğinde aylık ortalama harcama:
(1200+1600+1400+2000)/4=6200/4=1550
Şimdi bu anakütleden rassal seçilerek elde edilen örneklemlerin, aylık ortalama
harcamalarını bulalım.
1. Olası Örneklem: İlk 3 kişiden oluşsun: (1200+1600+1400)/3=1400
2. Olası Örneklem: 1.kişi, 2. kişi ve 4. kişiden oluşsun: (1200+1600+2000)/3=1600
3. Olası Örneklem: 2. kişi, 3. kişi ve 4. kişiden oluşsun: (1600+1400+2000)=1666,67
Anakütlenin aylık harcama ortalaması 1550 iken, 1. olası örneklemin 1400, 2. olası
örneklemin 1600, 3. Olası örneklemin ise 1666,67 olduğunu gördük. Örnekleme
yapıldığı sürece ortadan kaldırılması mümkün olmayan bu hataları en aza indirgemek
için örneklem sayısının arttırılması veya en uygun örneklemin tercih edilmesi gerekir.
❖ Sistematik Hatalar: Başta veri toplama sırasında yapılabilecek ya da diğer aşamalarda
yapılan hesaplamalarda gerçekleştirilen hatalardır. Bazen yapıldığı bile fark edilmeyen
hatalardır.
❖ Tahmin Hataları: Çeşitli istatistiki yöntemlerle tahmin edilen değerlerle, gözlenen
değerler arasındaki farka “tahmin hataları” denir. Bu hataların düşük olması
uygulanan yöntemin uygunluğunu gösterir.
TANIMLAYICI İSTATİSTİK
İstatistiksel yöntemler genel olarak tanımlayıcı ve çıkarımsal (yorumsal) olarak ikiye ayrılır.
Tanımlayıcı istatistik, verilerin toplanması, düzenlenmesi ve analiz edilip yorumlanma
çabalarıdır. Bir açıdan eldeki verilerin o anda neler anlattığını bulmaya çalışır. Bunu yaparken
de çeşitli ortalama ve değişkenlik
ölçülerini kullanır. Çıkarımsal istatistik
ise popülasyondan seçilen örneklemler
aracılığı ile analiz yapılarak,
popülasyonun tamamı hakkında
çıkarım yapmaya çalışan yöntemler
topluluğudur. Örneğin, 100 kişilik bir
öğrenci grubunun herhangi bir ders
notunun ortalaması ve dağılımını
bulup hesaplamak ve görsellemek
tanımlayıcı istatistiğin çalışma
alanıdır. Ancak bu 100 kişi bir
popülasyonun örneklem kümesi ise ve incelenmek isteniyorsa, çeşitli hipotez testleri ile
ölçülerek yapılan çalışma çıkarımsal istatistiğin çalışma alanına örnektir.
Merkezi eğilim ölçüleri, veri setindeki bütün değerlerin çevresinde toplandığı merkezi bir
değeri ifade eder. En sık kullanılan merkezi eğilim ölçüleri ortalama, mod (tepe değer), medyan
(ortanca), çeyreklikler ve geometrik ortalamadır. Ortalama ölçüleri analitik olan yani duyarlı
olan ve analitik olmayan yani duyarlı olmayan ortalamalar olarak da iki farklı grup ya da
başlık altında incelenebilir.
MOD: Bir sayısal veri setinde en çok tekrar eden sayı Mod (Tepe değer) olarak tanımlanır.
Mod analitik olmayan ortalamalardan biridir. Herhangi bir sayının tekrar adedi ise frekans
olarak tanımlanır. Eğer veri setinde hiçbir tekrarlama bulunmuyorsa, veri setinin mod değeri
yoktur.
Örneğin; X: 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4.
X veri seti ya da X rassal değişkeni 1 değerini 2 kere, 2 değerini 4 kere, 3 değerini 2 kere, 4
değerini ise 3 kere aldığı gözlemlenmektedir.
En çok tekrar eden değer 2 olduğundan X rassal değişkeninin mod değeri 2’dir.
Ayrıca X rassal değişkenini aldığı değerler ve bu değerleri alma sıklığı yani frekansları ve
frekanslarından elde edilen olasılık değerleri aşağıdaki tabloda özetlenmiştir.
X Frekans Olasılık Yüzde
1 2 2/11 0,181
2 4 4/11 0,363
3 2 2/11 0,181
4 3 3/11 0,272
Toplam 11 11/11 %100
Örneğin; bir grup kişiye hangi takımı tuttuğunu sorsak ve verdikleri cevaplar doğrultusunda
aşağıdaki tabloyu elde etsek!!!
Takım Kişi Sayısı
A Takımı 5
B Takımı 7 En çok desteklenen
E takımıdır yani
D Takımı 12 Mod: E
E Takımı 15
F Takımı 8
Çözüm: Yukarıdaki tabloda X değişkeninin ifade ediliş şekli ya da biçimi gruplandırılmış seri
olarak adlandırılır. Eğer elimizdeki veriler tabloda görüldüğü gibi aralık olarak verildiyse, bizim
tüm aralıklarda kişilerin tam olarak kaç puan aldıklarını bilmemiz mümkün değildir. Bu sebeple
her bir aralık değerlerinin önce ortalaması alınır ((80+100)/2 =90).
X (Alt Sınır- Üst Sınır) Kişi Sayısı Orta Nokta Frekans*Orta
80-100 (Frekans)
2 (80+100)/2= 90 nokta2*90=180
60-80 4 (60+80)/2 = 70 4*70=280
40-60 3 (40+60)/2 = 50 3*50=150
20-40 1 (20+40)/2 = 30 1*30=30
0-20 2 (0+20)/2 = 10 2*10=20
Toplam 12 kişi 660
Bu işlem her bir aralık için tek tek yapılarak Orta Nokta sütünü oluşturulur. Elde edilen
değerler kendisine ait frekans değerleri ile çarpılıp, çarpımdan elde edilen değerlerin toplamı
alınır. Ortalama ise toplam değerin toplam kişi sayısına bölünmesi ile bulunur.
𝟔𝟔𝟎
= 𝟓𝟓
𝟏𝟐
MOD’UN ÖZELLİKLERİ
❖ Denek sayısının ya da gözlenen değerin ya da değişkenin aldığı değerin sayısı az
olduğunda mod güvenilir bir ölçü değildir. Kullanılması uygun değildir!!!
❖ Bazı örneklemlerde bir mod yerine iki ya da daha fazla mod değeri olabilir. Bu durumda
ya mod değeri hesaplamaktan vazgeçilir ya da frekans tablosu tek mod değerli bir
dağılım olacak şekilde yeniden düzenlenir.
❖ Nicel ve nitel verilerin her iki türü için de uygundur.
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 10, 10
1 değeri 3 defa, 2 değeri 4 defa 3 değeri 1 defa, 4 değeri 1 defa, 5 değeri 2 defa, 6 değeri 3 defa,
7 değeri 4 defa, 8 değeri 1 defa ve 10 değeri iki defa tekrarlanmıştır. Bu açıdan bakıldığında 2
ve 7 değeri bu serinin mod değeridir. Bu serinin bir mod değeri yoktur iki mod değeri vardır.
Bir açıdan da bu seriyi temsil edebilecek tek bir değer yoktur iki değer mevcuttur.
MEDYAN: Büyükten küçüğe ya da küçükten büyüğe doğru sıralanmış bir veri setinde tam
ortada yer alan değeri Medyan (Ortanca) olarak tanımlanır.
Örneğin; X: 5, 1, 2, 7, 6, 4 veri setinin medyan değerini bulmak istediğimizde, ilk adım olarak
X veri setini küçükten büyüğe (büyükten küçüğe) sıralarız. X: 1, 2, 4, 5, 6, 7. Yeni oluşan veri
setinde ortada yer alan değer tek bir değer olmadığından ortada kalan iki değerin ortalaması
alınır. Bu durumda X veri setinin medyan değeri 4,5 olarak bulunur.
ÖNEMLİ NOT: Değişkenin aldığı değer sayısının tek veya çift olmasına göre medyanın
bulunması değişir.
Tek sayı olduğunda, tam ortada tek bir değer aldığından medyan o değerdir.
Çift sayı olduğunda, yukarıdaki örnekteki gibi ortada kalan iki değerin ortalaması
alınır.
MEDYAN’IN ÖZELLİKLERİ
❖ Değişkenin aldığı değerler çok fazla ise değişkenlerin özetlenmesinde medyan
kullanılabilir.
❖ Medyan, sınıflama ölçme düzeyi ile ölçülen değişkenler için kullanılmaz.
❖ Eşit aralıklı, oran ve sıralama ölçme düzeyinde ölçülen değişkenler için kullanılır.
❖ Aşırı uç değerlerden etkilenmez.
❖ Duyarsız yani analitik olmayan ortalama yöntemlerinden biridir.
ARİTMETİK ORTALAMA: Aritmetik ortalama, en çok kullanılan merkezi eğilim
ölçülerinden biridir. Rassal değişkenlerin ya da birimlerin aldıkları değerlerin toplamının
gözlem sayısına ya da birim sayısına bölümü olarak tanımlanır.
N
Xi
i 1
BEKLENEN DEĞER: X eşit olasılıklarla n tane değer alan bir rassal değişken olsun. X rassal
değişeninin aldığı değerleri x1 , x2 , x3 , . . . , xn−1 , xn ile gösterelim. Herhangi bir i ∈ {1,2, . . . , n}
için xi 'nin gerçekleşme olasılığını da p(xi )ile gösterelim.
X rassal değişkeni değerlerini eşit olasılıklarla gerçekleştirdiğine göre; herhangi bir i, j ∈
{1,2, . . . , n} için, xi 'nin gerçekleşme olasılığı xj 'nin gerçekleşme olasılığına eşittir.
1
Dolayısıyla, her i için, p(xi ) = n eşitliği sağlanacaktır. X rassal değişkeninin değerleri eşit
olasılıklarla gerçekleşmediği durumda, olasılıklarının toplamının bire eşit olması gerektiğini
bilmemize rağmen her bir olasılığın 1/n'e eşit olduğunu söyleyemeyiz. Bir başka ifadeyle,
kesikli olan X rassal değişkeni için, aldığı değerlerin gerçekleşme olasılığı, olasılıklar eşit olsa
da olmasa da aşağıdaki eşitlik her zaman doğrudur.
p(x1 ) + p(x2 ) + p(x3 )+. . . +p(xn ) = 1
X rassal değişkeninin beklenen değeri genelde E(X) ile bazı durumlarda ise Xˉ ya da 𝜇 ile
gösterilmektedir.
Beklenen değer X rassal değişkeninin alabileceği her bir değeri gerçekleşme olasılığı ile çarpıp,
elde ettiğimiz tüm değerleri toplayarak hesaplanır. Matematiksel olarak ifade edersek,
𝐧
𝐄(𝐗) = ∑ 𝐱 𝐢 𝐩(𝐱 𝐢 ).
𝐢=𝟏
Örnek (KPSS 2009 Soru 2): X rassal değişkeninin olasılık fonksiyonu aşağıdaki tabloda
verilmiştir.
X 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8
Çözüm: Öncelikle X rassal değişkeninin aldığı değerlerin sıklıklarını yani frekans değerlerini
hesaplayalım. Örneğin X rassal değişkeni 2 değerini 2 kere, 3 değerini 3 kere, 5 değerini 2 kere
ve 8 değerini de sadece 1 kere aldığından frekans değerleri aşağıda yer alan tablodaki gibidir.
X Frekans Olasılık
2 2 2/8
3 3 3/8
5 2 2/8
8 1 1/8
Toplam 8 8/8
2 3 2 1 31
E(X) = 2 + 3 + 5 + 8 = = 3,875
8 8 8 8 8
Sonuç: E(X) = 3,875
Örnek: X rassal değişkeni bir zarın rassal atılmasıyla elde edilen sonuçlardan oluşsun. X
rassal değişkeninin beklenen değerini hesaplayalım.
Çözüm: Zarı salladığımız zaman gelebilecek sonuçlar (değerler) {1, 2, 3, 4, 5, 6} ile tanımlanan
kümeden herhangi bir sayıdır. Zarı salladığımız zaman herhangi bir sayı gelme olasılığı hep eşit
olduğundan 1/6'dır. Diğer bir ifadeyle zardan gelen sonucun 4 olma olasılığı da, 6 olma
1
olasılığı da 1 olma olasılığı da hep eşit ve bu olasılıklar da 6 ′ya eşittir. O halde, beklenen değer
aşağıdaki gibi hesaplanır.
1 1 1 1 1 1
E(X) = 1× + 2× + 3× + 4× + 5× + 6×
6 6 6 6 6 6
1
(1
= 6 + 2 + 3 + 4 + 5 + 6)
= 3,5.
Sonuç: E(X)=3,5.
Örnek: X rassal değişkeni iki zarın rassal atılmasıyla elde edilen sonuçların
toplanmasından oluşsun. X rassal değişkeninin beklenen değerini hesaplayalım.
Çözüm: Her iki zarı da salladığımız zaman gelebilecek değerler; {1, 2, 3, 4, 5, 6} ile tanımlanan
kümeden herhangi bir sayıdır. Örneğin, zarlardan her ikisinin de 1 gelmesi durumunda rassal
değişkenimiz 2 olacaktır, zarlardan biri 4, diğeri 5 geldiği zaman ise X rassal değişkenimiz iki
zarın toplamını gösterdiğinden rassal değişkenimiz 9 değerini alacaktır.
X rassal değişkenimizin alabileceği değerler kümesi {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}'dir. Bu
değerlerin gerçekleşme olasılıkları da birbirinden farklıdır. Aşağıdaki tablodan anlaşılacağı
gibi, 2 değeri sadece zarların ikisinin de bir geldiği durumda gerçekleşmektedir.
Gerçekleşebilecek 36 durum olduğundan, X rassal değişkeninin 2 olma olasılığı 1/36'dır.
X Durum Olasılık
2 (1,1) 1/36
3 (2,1), (1,2) 2/36
4 (1,3), (3,1), (2,2) 3/36
5 (2,3), (3,2), (1,4), (4,1) 4/36
6 (3,3), (4,2), (2,4), (1,5), (5,1) 5/36
7 (3,4), (4,3), (1,6), (6,1), (2,5), (5,2) 6/36
8 (4,4), (3,5), (5,3), (2,6),(6,2) 5/36
9 (3,6), (6,3), (4,5), (5,4) 4/36
10 (5,5), (4,6), (6,4) 3/36
11 (5,6), (6,5) 2/36
12 (6,6) 1/36
Yukarıdaki tablo yardımıyla X rassal değişkeninin beklenen değeri aşağıdaki gibi bulunur.
1 2 3 4 5 6 5 4
𝐄(𝐗) = 2× + 3× + 4× + 5× + 6× + 7× + 8× + 9×
36 36 36 36 36 36 36 36
3 2 1
+10× + 11× + 12×
36 36 36
Sonuç: E(X)=7,064
Örnek (2014 SPK I. Dönem S-403-B Soru 22): Beklenen getirisi %24 olan (X) pay senedi
ile beklenen getirisi %12 olan (Y) pay senedinden bir portföy oluşturulacaktır. (X) pay
senedinin portföydeki ağırlığı %25, (Y) pay senedinin portföydeki ağırlığı %75 olduğuna
göre, söz konusu portföyün getirisini hesaplayalım.
Çözüm: Öncelikle soruda verilen bilgileri matematiksel olarak ifade edelim.
• Beklenen getirisi %24 olan (X) pay senedi: E(X) = 0,24
• Beklenen getirisi %12 olan (Y) pay senedi: E(Y) = 0,12
• (X) pay senedinin portföydeki ağırlığı %25:wX = 0,25
• (Y) pay senedinin portföydeki ağırlığı %75:wY = 0,75
Bu bilgileri kullanarak X ve Y rassal değişkenlerinden oluşan bir portföy oluşturalım ve
oluşturduğumuz portföyü P ile gösterelim. P = 0,25X + 0,75Y
Portföyün beklenen getirisi, E(P):
𝐄(𝐏) = E(0,25X + 0,75Y)= 0,25E(X) + 0,75E(Y)= 0,25×0,24 + 0,75×0,12 = 𝟎, 𝟏𝟓
Sonuç: Portföyün beklenen getirisi %15'dir.
Değişkenlik Ölçüleri
ÖNEMLİ NOT: iki farklı birimi birbirinden ayırt etmek için sadece ortalamalara bakmak
yeterli olmaz. Aynı ortalamalara sahip yapılar birbirinden farklı değişim gösterebilirler.
DEĞİŞİM GENİŞLİĞİ (ARALIĞI): Bir veri grubunda en büyük değer ile en küçük değer
arasındaki farka değişim genişliği denir. Değişim genişliği, değişim aralığını gösteren bir
dağılım ölçüsüdür. Değişim genişliğinin hesaplanmasında sadece iki uç değer işleme
alındığından, diğer değerlerin hiçbir etkisi yoktur. Bu nedenle değişim genişliği yaygın olarak
kullanılan bir dağılım ölçüsü değildir.
NOT: Tüm veri setinin sadece iki değerinden hesaplandığı için, veride sadece iki değer bile uç
değerdeyse değişim genişliği bundan etkilenecektir. Bu yüzden de açıklama yapmakta yetersiz
kalan bir ölçüdür.
ÖNEMLİ NOT: X rassal değişken sürekli ise Xmax-Xmin, kesikli ise Xmax-Xmin +1 formülü
yardımıyla hesaplanır.
Örnek: X ve Y serilerinin değişim genişliğini hesaplayalım.
X: 300 320 360 375 355
Y: 200 250 180 500 200
Çözüm: X Serisinin Değişim Genişliği = Xmax-Xmin = 375-300 =75
Y Serisinin Değişim Genişliği = Ymax-Ymin = 500-180 = 320
NOT: Değişim genişliği farklı sayıda gözlem değeri içeren ve farklı ölçü birimlerine göre
oluşturulmuş serilerin karşılaştırılmasında kullanılamaz.
ORTALAMA MUTLAK SAPMA: Veri setindeki her bir gözlem değerinin aritmetik
ortalamadan farklarının mutlak değerlerinin toplamının örnek hacmine bölünmesiyle elde
edilen değerdir. Ortalama Mutlak Sapma değeri küçük ise dağılımın çok sıkışık olduğu anlaşılır.
Mutlak farkların toplamını kişi sayısına böldüğümüzde, ortalama mutlak sapma değerini
186,6/10= 18,6 olarak buluruz. Buna göre rassal değişkeni oluşturan değerler, aritmetik
ortalamadan ortalama olarak 18,6 birim uzağa düşmektedir.
ÖNEMLİ NOT: Uygulamada ortalama mutlak sapma yaygın olarak kullanılmaz, bu ölçü
yerine standart sapma kullanılır.
VARYANS: Varyans bir dağılımın kendi ortalamasından sapmalarının karesinin beklenen
değeri olarak tanımlanır. Varyans kavramı dağılıma ait her bir değerin dağılımın
ortalamasından ne kadar uzak olduğuyla ilgilidir yani, varyans söz konusu sapmaların ortalama
değerini ölçmektedir. Herhangi bir rassal değişkenin varyansı Var(X) ile gösterilir ve aşağıdaki
gibi hesaplanır.
VARYANSIN ÖZELLİKLERİ
Örnek: X rassal değişkeni herhangi iki zar atıldığında elde edilen sonuçların çarpımı
olsun. X rassal değişkeninin varyansını hesaplayalım.
Çözüm: Öncelikle X rassal değişkeninin alabileceği sonuçları düşünelim. Zardan gelen
sonuçlar (1,1) olduğu zaman, X rassal değişkeni en küçük alabileceği değere yani 1'e; sonuçlar
(6,6) olduğu zaman X rassal değişkeni alabileceği en büyük değere yani 36'ya eşit olur.
Aşağıdaki tabloda X rassal değişkeninin alabileceği değerler, bu değerlerin gerçekleşme
durumları, olasılıkları ve beklenen değeri hesaplamak için gerekli olan bilgiler detaylı bir
şekilde anlatılmaktadır. Bu deneyde olasılıklar eşit olmayacaktır. (rassal değişken 2 değerini
sadece (1,1) sonucu geldiğinde ama buna karşılık 3 değerini (1,2) ve (2,1) sonuçlarından birisi
geldiğinde alır).
Tablo: X Rassal Değişkeninin Varyansının Hesaplanması
X -3 6 9 12
P(X=x) 1/10 1/2 1/5 1/5
X -3 6 9 12
𝐘 = (𝟐𝐗 + 𝟏) 𝟐 25 169 361 625
𝐘𝟐 625 28561 130321 390625
P(X=x) 1/10 1/2 1/5 1/5
Yukarıdaki tabloda Y veY 2 rassal değişkenlerinin aldığı değerler yer almaktadır. Bu bilgiler
doğrultusunda, Y rassal değişkeninin beklenen değeri:
1 1 1 1
𝐄(𝐘) = 25× + 169× + 361× + 625× = 𝟐𝟖𝟒, 𝟐𝟎
10 2 5 5
Y 2 rassal değişkeninin beklenen değeri:
1 1 1 1
𝐄(𝐘 𝟐 ) = 252 × + 1692 × + 3612 × + 6252 × = 𝟏𝟏𝟖𝟓𝟑𝟐, 𝟐𝟎
10 2 5 5
Var(Y) = E(Y 2 ) − E(Y)2 eşitliğinden Y rassal değişkeninin varyansı aşağıdaki gibi hesaplanır.
𝐕𝐚𝐫(𝐘) = 118532,20 − 284,202 = 𝟑𝟕𝟕𝟔𝟐, 𝟓𝟔𝟓
Sonuç: Var(Y)=37762,565.
X 𝐗 − 𝐗ˉ (𝐗 − 𝐗ˉ)𝟐
2 2 - 5 = -3 9
4 4 - 5 = -1 1
6 6-5=1 1
8 8-5=3 9
Toplam 20
∑(X−Xˉ)2 20 𝟐𝟎
Öyleyse,𝐕𝐚𝐫(𝐗) = = 4−1 =
n−1 𝟑
𝟐𝟎
Sonuç: 𝐕𝐚𝐫(𝐗) = 𝟑
STANDART SAPMA: Herhangi bir rassal
değişkenin varyansının karekök değeri standart
sapma değerini verir. Standart sapma, olasılık
dağılımının yayılmasının bir ölçütüdür. Standart
sapma değerinin büyük (küçük) olması, X rassal
değişkeninin değerlerinin ortalamanın geniş (dar)
aralığında yer aldığını gösterir. X rassal
değişkeninin standart sapması genellikle 𝜎X ile
gösterilir ve aşağıdaki formül yardımıyla
hesaplanır.
ÖNEMLİ NOT: Bu ölçü “Acaba gözlemler ortalamadan ortalama olarak ne kadar uzağa
düşer? sorusuna cevap olur.
Örnek: ABC hisse senedi beş yıl boyunca sırasıyla %5, -%3, -%4, %2 ve %6 getiri
sağlamıştır. Bu hisse senedinin standart sapmasını hesaplayalım.
Çözüm: Hisse senedinin getirilerini rassal değişken gibi düşünürsek ve bu değişkeni X ile
gösterirsek; X rassal değişkeninin alacağı değerler sırasıyla %5, -%3, -%4, %2 ve %6'dır.
X rassal değişkeninin standart sapmasını hesaplayabilmemiz için öncelikle X ve X 2 rassal
değişkenlerinin beklenen değerlerini hesaplamamız gerekir Bu değerlerle birlikte X rassal
değişkeninin varyansını buluruz. Varyansın karekök değeri standart sapmayı verdiğinden bu
işlemlerle birlikte örnekte bizden istenilen değer hesaplanmış olur.
𝐄(𝐗) = (0,2×0,05) + (0,2×−0,03) + (0,2×−0,04) + (0,2×0,02) + (0,2×0,06)
= 0,01 − 0,006 − 0,008 + 0,004 + 0,012
= 𝟎, 𝟎𝟏𝟐
𝐄(𝐗 ) = (0,2×0,052 ) + (0,2×−0,032 ) + (0,2×−0,042 ) + (0,2×0,022 ) + (0,2×0,062 )
𝟐
A 4 5 6 2 8
B 5 5 5 5 5
C 1 1 5 9 9
Gruplar Frekans
100-150 5
150-200 10
200-250 8
250-300 6
300-350 12
350-400 4
Çözüm: İlk adım olarak gruplandırılmış değerlerin ortalama değerini hesaplayıp, rassal
değişkenin alabileceği ortalama değeri ve frekans değeri yardımı ile bu değerlerin gerçekleşme
olasılıklarını hesaplayalım. Aşağıdaki tabloda bu hesaplamalar gösterilmiştir.
Yukarıdaki tablodan elde ettiğimiz bilgileri, gruplandırılmış seriden elde edilen X rassal
değişkeni olarak adlandırırsak. X rassal değişkeninin aldığı değerler ikinci sütunda, bu
değerlerin gerçekleştirme olasılıkları 4. sütunda yer alır.
Standart sapma, varyansın karekök değeri olduğundan X rassal değişkeninin standart sapmasını
hesaplamak için öncelikle X ve X2 rassal değişkenlerinin beklenen değerlerini hesaplamamız
gerekir.
• X rassal değişkeninin beklenen değeri: E(X)
E(X) = 125×0,11 + 175×0,22 + 225×0,18 + 275×0,13 + 325×0,27 + 375×0,09
E(X) = 249,4444
• X2 rassal değişkeninin beklenen değeri:
E(X 2 ) = 1252 ×0,11 + 1752 ×0,22 + 2252 ×0,18 + 2752 ×0,13 + 3252 ×0,27 + 3752 ×0,09
E(X 2 ) = 68291,67
Bu bilgiler doğrultusunda X rassal değişkeninin varyansı:
Var(X) = E(X 2 ) − E(X)2 = 68291,27 − 249,442 = 6069,136
Standart Sapması: 77,9047 olarak bulunur.
DEĞİŞİM KATSAYISI: Standart sapma ölçü biriminin etkisinde olan bir kavramdır.
Dolayısıyla bir değişkenin homojen ya da heterojen olduğunu göstermez. İfade edemez.
Değişim katsayısı iki veya daha fazla serinin dağılımlarını karşılaştırarak hangi gözlem
kümesindeki birimlerin daha homojen olduklarını belirlemek amacıyla kullanılan bir ölçüdür
(Güler, 2005:84).
ÖNEMLİ NOT: Karşılaştırılan gözlem kümelerinin ayrı ölçüm birimi olduğu durumlarda veya
aynı ölçüm birimi ancak gözlem kümesinin rakamları arasında çok büyük farklar bulunduğunda
kullanılır. Aynı ölçüm birimi ve rakamlar arasında büyük farklar yoksa standart sapma
kullanılır. Ancak Güler’e göre hangi durum söz konusu olursa olsun değişim katsayılarının
hesaplanması ve karşılaştırmanın bu ölçüye dayanarak yapılması daha faydalıdır (2005:85).
5
• X Değişkeninin Varyasyon Katsayısı: 30 ×100 = 16,67
4
• Y Değişkeninin Varyasyon Katsayısı: 40 ×100 =10
3
• Z Değişkeninin Varyasyon Katsayısı: ×100 = 30
10
En küçük standart sapma değeri Z değişkenin de olmasına rağmen en büyük varyasyon katsayısı
Z değişkeninindir. Bu durumda en fazla değişkenlik Z rassal değişkenindedir.
Örnek: Ülkelerin gelir dağılımını gösteren tablo aşağıdaki gibidir. Hangi ülkenin gelir
dağılımında daha çok değişkenlik olduğunu hesaplayalım.
Değişken Ortalama Standart Sapma
A 25 5
B 50 7
C 40 6
D 60 4
KOVARYANSIN ÖZELLİKLERİ
ÖNEMLİ NOT:
Var(X+Y+Z)= Var(X)+Var(Y)+Var(Z)+2Kov(X,Y)+Kov(X,Z)+Kov(Y,Z)
Korelasyon katsayısı POZİTİF ise (0 ile 1 arasında ise) "değişkenlerden biri artarken
(azalırken) diğeri de artmaktadır (azalmaktadır)" yorumu yapılır. Kısaca değişkenlerin
arasında pozitif yönlü bir ilişki olduğu
yani değişkenlerin birlikte hareket
ettiği söylenir.
Korelasyon katsayısı +1 ve -1’e yaklaştıkça aralarındaki ilişkinin şiddeti artar, 0’a yaklaştıkça
ise aralarındaki ilişkinin şiddeti azalır.
PEARSON???
KORELASYON ANALİZİNİN AMACI
SPEARMAN???
❖ Değişkenler arası ilişkinin açıklanmasına
KENDALL’S???
yardımcı olmak
❖ Benzer sonuçları önceden tahmin etmek
𝐾𝑜𝑣(𝑋, 𝑌)
𝜌𝑋,𝑌 =
√𝑉𝑎𝑟(𝑋)√𝑉𝑎𝑟(𝑌)
Örnek: X: 2, 4, 0, 6 ve Y: 4, 3, 2, 1
a) E(2X+3) b) E(2Y+4X) c) Var(2X+3) d) Kov(2X+3, 3Y+1)
e) 2X ve 4Y+3 arasındaki korelasyon katsayısını hesaplayıp, yorumlayınız.
Çözüm a) E(2X+3) = ?
1. Yöntem E(2X+3)= E(2X)+ E(3)= 2E(X) + 3
E(X) = ? E(X) = (2+4+0+6)/4 =3
2*3 + 3
E(2X+3)=9
2. Yöntem X: 2, 4, 0, 6
6 ∑𝑛𝑖=1 𝑑𝑖2
𝜌𝑋,𝑌 = 1 −
𝑛(𝑛2 − 1)
Gözlem Sayısı X Y
1 40 36
2 70 59
3 38 72
4 26 38
5 38 50
Çözüm: Birinci adım olarak Sıra X ve Sıra Y değerlerini bulalım. Eğer değişkenlerin tekrar
eden değerleri yoksa sıralama en büyükten en küçüğe doğru devam eder.
Gözlem Sayısı X Y Sıra X Sıra Y
1 40 36 2 5
2 70 59 1 2
3 38 72 3,5 1
4 26 38 5 4
5 38 50 3,5 3
X değişkeninin sıralaması oluşturulurken, öncelikle aldığı değerleri en büyükten en küçüğe
sıralayın: 70, 40, 38, 38, 26.
En büyük değer 70 olduğundan, 70 değeri ilk sırada olmalıdır. X değişkeninin 70’den sonra
aldığı en büyük değer 40 olduğundan, 40 değeri ikinci sırada yer almalıdır. X değişkeni 40’dan
sonra en büyük değer olarak iki kere 38 değerini almaktadır. Bunlardan birinin 3 diğerinin 4
olması gerekirken, hangisine hangi değeri vereceğimize karar vermenin zorluğu ve yanlışlığı
nedeniyle, 3 ve 4’ün ortalamasını yani 3,5 değeri iki 38 değerinin sırası olur. X değişkeninin
38’den sonra aldığı en büyük değer ise 26 olduğundan, 4. sırayı da kullanmış olduğumuz için
26’nın sıra değeri 5 olmalıdır. Y değişkeninde tekrarlanan değer olmadığından sıralaması en
büyükten en küçüğe yukarıdaki tablodaki gibi oluşturulur.
Sıra X ve Sıra Y değerlerinin farkından formülde yer alan ve sıraların farklarından tanımlanan
d değeri hesaplanır.