Download as pdf or txt
Download as pdf or txt
You are on page 1of 10

Prof.Dr.

Kamil ALAKUŞ

V. BÖLÜM: ÖNEMLİ PARAMETRİK DAĞILIMLAR


V.1 Giriş
Sağkalım ya da güvenilirlik analizinde en önemli amaç, başarısızlık durumunun oluşması ya da
sağkalım sürelerinin incelenmesi olduğu için bu iki olgunun duyarlı ve doğru ölçülebilmesi
gerekir. Bunun için,
• Başlangıç zamanı kullanılan birim için net olmalı,
• Ölçülen zaman için bir zaman aralığı belirlenmeli (gün,ay,yıl,yaş,vb.),
• Kullanılan birim için başarısızlığın gerçekleştiği an net olmalıdır (Lee, 1992).
Sağkalım veya güvenilirlik analizinde sansürsüz veri durumunda, her bir birimin ömrü, çalışma
süresi içerisinde son bulmuştur. Çünkü birimlerin ölüm zamanı ya da başarısızlık zamanı net
olarak bellidir. Sansürlü veri durumunda ise; her bir birim hala yaşıyor olabilir, birimler o süreç
içerisinde kayıp gözlem olmuş olabilir, farklı bir sebepten dolayı çalışmadan çıkmış olabilir ya
da çalışma süresi dolduğu halde birimler hala yaşıyor olabilir veya bireyler hakkında bilgiye
sahip olunmayabilir. Eğer bu durumu kısaca toparlamak istersek; sansürsüz örneklem
durumunda bireylerin başarısızlık zamanı kesin belli iken, sansürlü örneklem durumunda
başarısızlık zamanı kesin belli değildir (Nelson, 1982).
Gamma dağılımı, üstel dağılımın bir uzantısı olup, Brown ve Flood (1947) tarafından bir
kafedeki cam bardakların kullanım zamanını ve Birnbaum ve Saunders (1958) tarafından
metaryallerin yaşam uzunluğunu istatistiki model olarak tanımlamak için uzun zaman önce
kullanılmıştır. Bu dağılım, o zamandan sonra sıklıkla endüstriyel güvenilirlik sorunları ve insan
sağkalımı için bir model olarak kullanılmaktadır (Lee ve Wang, 2003).
Üstel dağılım, bir bileşende ilk hata/başarısızlık gerçekleşinceye kadar bekleme süresine ait
dağılım olarak kullanılır. Aynı zamanda bir hatalı bileşenin aynı tipte diğer bileşenle
değiştirilebileceği varsayımı altında, hatalar arasındaki bekleme zamanlarına ait dağılım olarak
da kullanılır (Hanhn ve Shapiro, 1967). Üstel dağılımda sabit hata
oranının, zamana göre değişim gösteren hata oranına uygulamalarda çok az karşılaşılır.
Örneğin, gelen telefon aramalarının oranı günün saatlerine göre farklılık gösterir. Fakat gün
içinde oranın sabit olduğu zaman aralığına odaklanacak olursak bir sonraki telefon araması
gerçekleşinceye kadar gereken zaman için üstel dağılım iyi bir yaklaşım modelidir.
Weibull dağılımı ilk olarak W. Weibull (1951) tarafından malzeme özelliklerinin modellenmesi
amacıyla önerilmiş olup, günümüzde biyoloji, mühendislik, kalite kontrol ve diğer birçok
alanda deneysel verilere iyi uyum sağladığı için yaygın bir şekilde kullanılmaktadır. Uygulama
alanlarına örnek olarak elektron tüpleri, röleler ve bilyalı rulman gösterilebilir (Hahn ve

31
Prof.Dr. Kamil ALAKUŞ

Shapiro, 1967). Aynı zamanda Weibull dağılımı erken ölümlülük, rastgele başarısızlıklar,
yıpranma ve serbest hata periyodu gibi başarısızlık niteliklerinin çeşitliliğini modellemede
kullanılır.
Log-Normal dağılım; çok küçük hataların çarpımlarından kaynaklanan değerlerin bulunduğu
işlemler için model olarak ortaya çıkar. Merkezi limit teoremi kullanılarak genel koşullar
altında, n bağımsız pozitif değerler alan rastgele değişkeninin çarpımına ait dağılımın Log-
Normal dağılıma yaklaştığı gösterilebilir (Hahn ve Shapiro 1967). Log-normal dağılımın çok
geniş bir kullanım alanı olmakla birlikte, gözlenen değerin önceki değerin rastgele oranı olduğu
işlemlerde kullanılır. Bu dağılım mühendislik, ilaç, ekonomi ve diğer alanlarda çeşitli
uygulamalarda sıklıkla kullanılmaktadır (Lawless, 2003).
Bu çalışmanın amacı, sağkalım ve/veya güvenilirlik analizi çalışmalarında uygulama imkânı
bulan önemli sürekli olasılık dağılımlarından parametre tahmini yapmaktır.
Çalışmanın ikinci bölümünde sağkalım analizinde kullanılan parametrik dağılımların olasılık
yoğunluk fonksiyonu, hazard fonksiyonu ve sağkalım ( ya da güvenilirlik) fonksiyonu gibi
bilgiler verilecek olup, üçüncü bölümde bu olasılık dağılımlarının hem sansürlü hem de
sansürsüz örneklemler için parametre tahmini tartışılacaktır. Parametrelerin tahmin edicilerini
bulmada En Çok Olabilirlik Metodu (EÇOK) kullanılmıştır.
Çalışmanın sayısal uygulama bölümünde, yine hem sansürlü hem de sansürsüz örneklemler için
simülasyon yaklaşımı ile söz konusu dağılımlardan sayı üreticileri yazılarak sayı üretilmiş ve
parametrelerin tahmini araştırılmıştır. Çalışmada S-Plus istatistik paket programı, Sürüm 6.1
kullanılmış olup, burada çalışılan tüm dağılımlar simülasyon verileri üzerinden
örneklendirilmiştir. Beşinci bölüm olan gerçek veri uygulamaları bölümünde ise; söz konusu
dağılımlarda farklı alanlarda çalışılan projelerin örneklemleri değerlendirilmiş olup, en uygun
dağılımı belirlemek için AIC ölçütü tercih edilmiştir. Aynı zamanda parametrelerin tahminleri
yanında parametreler için 100(1 − 𝛼)% güven aralıkları da tartışılmış ve tahmin edilmiştir.
V.2 Önemli Parametrik Dağılımlar
Sağkalım analizinde yapılan çalışmanın türüne bağlı olarak farklı yollar izlenmektedir. İlk önce
dağılım varsayımlarının uygunluklarının tespiti yapıldıysa parametrik analiz yöntemleri
kullanılır. Hipotezler oluşturulur ve uygun testlerle birlikte test edilir. Parametrik modellerin
kullanılabilmesi için geçerli varsayımlar sağlanmadığı durumlarda, parametrik olmayan
dağılımları kullanma yoluna gidilir. Bu bölümde sağkalım analizinde kullanılan parametrik
dağılımların olasılık yoğunluk fonksiyonu, hazard fonksiyonu ve sağkalım ( ya da güvenilirlik)
fonksiyonu tanımlanıp, her bir dağılıma ait fonksiyonlar verilecektir.

32
Prof.Dr. Kamil ALAKUŞ

T tesadüfi değişkeninin olasılık yoğunluk fonksiyonu, kısa zamanda (∆𝑡 ) bir bireyin başarısız
olma olasılığının limitidir. Bu fonksiyon;
𝑃{𝑡≤𝑇<(𝑡+∆𝑡)}
𝑓 (𝑡) = lim ,𝑡 >0 (5.1)
∆𝑡→0 ∆𝑡

Biçiminde ifade edilir (Cox ve Oakes,1984).


Sağkalım fonksiyonu 𝑆(𝑡), bireyin sağkalım süresinin ( 𝑇), gerçek sağ kalım süresi olan 𝑡’den
daha uzun ( 𝑇 > 𝑡) sağ kalması olasılığını verir (Kleinbaum ve Klein, 2005) ve bu fonksiyon,

𝑆(𝑡) = 𝑃(𝑇 > 𝑡) = ∫𝑡 𝑓 (𝑢)𝑑𝑢, 𝑡 > 0 (5.2)
ile ifade edilir. Bireyin belli bir T zamanından önce ilgilenilen olayın meydana gelmesi
durumunda birikimli dağılım fonksiyonu söz konusu olmaktadır. Birikimli dağılım fonksiyonu
𝐹(𝑡) = 𝑃(𝑇 < 𝑡) ile ifade edilmektedir. Böylece, 𝑆(𝑡) = 1 − 𝐹(𝑡) eşitliği yazılabilir. Sağkalım
fonksiyonu birikimli dağılım fonksiyonundan dolayı monoton azalan bir fonksiyondur.
Hazard fonksiyonu bir zaman aralığında var olan başarısızlık riskinin tanımıdır. Aynı zamanda
bir birimin T=t zamanına kadar yaşaması koşulu altında ∆𝑡 → 0 iken (t, t+∆𝑡) aralığında
yaşamının sona ermesi olasılığıdır. Bu fonksiyon;
𝑃{𝑡≤𝑇<(𝑡+∆𝑡)|𝑇>𝑡} 𝑓(𝑡)
ℎ(𝑡) = lim = 𝑆(𝑡) (5.3)
∆𝑡→0 ∆𝑡

şeklinde ifade edilir.


V.2.1 Üstel Dağılım
Üstel dağılım özellikle sağkalım ve güvenilirlik analizinde kullanılan önemli bir olasılık
dağılımıdır. Bu dağılım tek parametreye sahiptir. Parametresi ise sabit hazard fonksiyonu β ‘dır.
Yüksek β değerleri yüksek risk ve kısa sağkalım iken; düşük β değerleri düşük risk ve yüksek
sağkalım oranı içerir. İki farklı biçimde yazılabilen üstel dağılımının bu çalışmada verilecek
olasılık yoğunluk fonksiyonu,
𝛽 −1 𝑒 −𝑡/𝛽 , 𝑡 > 0
𝑓 (𝑡 ) = { (5.4)
0, 𝑑. ℎ.
sağkalım (güvenilirlik) fonksiyonu,
𝑆(𝑡) = 𝑒 −𝑡/𝛽 , 𝑡 > 0 (5.5)
ve hazard fonksiyonu,
ℎ(𝑡) = 𝛽 −1 , 𝑡 > 0 (5.6)
ile verilir. Ortalama ve varyansı sırası ile 𝐸 (𝑇) = 𝛽 ve 𝑉 (𝑇) = 𝛽 2 .

33
Prof.Dr. Kamil ALAKUŞ

Üstel Dağılım

0.12
0.10
0.08
f(t)

0.06
0.04
0.02
0.0

0 10 20 30
t

Grafik V.1 β=8 İçin Üstel Olasılık Yoğunluk Fonksiyonu Grafiği.

V.2.2. Weibull Dağılımı


Özellikle güvenilirlik ve sağkalım analizinde kullanılan önemli bir olasılık dağılımıdır
(Weibull, 1951). Dört farklı biçimde yazılabilen iki parametreli Weibull dağılımının bu
çalışmada verilecek olasılık yoğunluk fonksiyonu,
𝜶 𝒕 𝜶−𝟏 𝜶
𝒆−(𝒕/𝜷) , 𝒕 > 𝟎
𝒇(𝒕) = {𝜷 (𝜷) (5.7)
𝟎, 𝒅. 𝒉.
sağkalım (güvenilirlik) fonksiyonu,
𝛼
𝑆(𝑡) = 𝑒 −(𝑡/𝛽) , 𝑡 > 0 (5.8)
hazard fonksiyonu,
𝛼 𝑡 𝛼−1
ℎ (𝑡 ) = 𝛽 ( 𝛽 ) ,𝑡 > 0 (5.9)

ile verilir. Fonksiyonda 𝛼: şekil, 𝛽: yer parametresidir. 𝛼 = 1 olursa üstel dağılıma dönüşür. 𝛼
= 2 olursa Rayleigh dağılımı ve 𝛼 = 4 ve daha büyük olduğunda dağılım normal dağılıma
1
yaklaşır. Weibull dağılımının ortalama ve varyansı sırasıyla; 𝐸 (𝑇) = Γ (1 + 𝛼 ) 𝛽 ve 𝑉 (𝑇) =
2 1
𝛽 2 [Γ (1 + 𝛼 ) − Γ 2 (1 + 𝛼 )] eşitlikleri ile ifade edilir. Her farklı 𝛼 ve 𝛽 değerleri için farklı

olasılık yoğunluk fonksiyonu şekilleri elde edilmektedir. Örneğin; 𝛽 = 8 ve 𝛼 = 1, 𝛼 = 1,5, 𝛼 =


2 ve 𝛼 = 3, değerleri için böylesi bir grafik, Grafik V.2’de verildiği gibidir.

34
Prof.Dr. Kamil ALAKUŞ

Weibull Dağılımı

0.12
0.10

Alfa=1.0

Alfa=1.5
0.08

Alfa=2.0

Alfa=3.0
f(t)

0.06
0.04
0.02
0.0

0 10 20 30
t

Grafik V.2: 𝜷 = 𝟖 iken Çeşitli 𝜶 Değerleri İçin Weibull Olasılık Yoğunluk Fonksiyonu Grafiği.

V.2.3 Gama Dağılımı

Dört farklı biçimde yazılabilen iki parametreli Gamma dağılımının bu çalışmada verilecek
olasılık yoğunluk fonksiyonu,
𝟏 𝒕 𝜶−𝟏
( ) 𝒆−𝒕/𝜷 , 𝒕 > 𝟎
𝒇(𝒕) = {𝚪(𝜶)𝜷 𝜷 (5.10)
𝟎, 𝒅. 𝒉.

ile verilir. Dağılımın parametreleri 𝛼 ve 𝛽 olup Γ(𝛼) gamma fonksiyonudur. Dağılım adını bu
fonksiyondan almaktadır. Her farklı 𝛼 ve 𝛽 değerleri için farklı olasılık yoğunluk fonksiyonu
şekilleri elde edilmektedir. Örneğin; 𝛽 = 8 ve 𝛼 = 1, 𝛼 = 2 ve 𝛼 = 3, değerleri için böylesi bir
grafik, Grafik V.3’de verildiği gibidir.

35
Prof.Dr. Kamil ALAKUŞ

Gama Dağılımı

0.12
0.10

Alfa=1.0
Alfa=2.0
0.08

Alfa=3.0
f(t)

0.06
0.04
0.02
0.0

0 20 40 60 80
t

Grafik V.3: 𝜷 = 𝟖 iken Çeşitli 𝜶 Değerleri İçin Gama Olasılık Yoğunluk Fonksiyonu Grafiği.
Gama fonksiyonu ise

Γ(𝛼 ) = ∫0 𝑥 𝛼−1 𝑒 −𝑥 𝑑𝑥 (5.11)
integrali ile ifade edilir. Pozitif tamsayı 𝛼 için, bu fonksiyonun değeri, Γ(𝛼) = (𝛼 − 1)!
İntegralinin çözümü ile görülebilir. Diğer reel 𝛼 değerleri için hemen hemen bütün paket
programlarında bu fonksiyonun değeri hesaplanabilmektedir.
Gamma dağılımından 𝛼 ve 𝛽 nın bazı değerleri için özel dağılımlar elde edilir. Eğer; 𝛼 = 1 ise
𝑟
üstel dağılım, 𝛼 = 2 ve 𝛽 = 2 ise r-serbestlik dereceli ki-kare dağılımı türetilir.

Gamma dağılımının ortalama ve varyansı sırası ile 𝐸(𝑋) = 𝛼𝛽 ve 𝑉(𝑋) = 𝛼𝛽2 ile verilir.
Gamma dağılımının sağkalım ve hazard foksiyonlarının değerlendirilmesinde
tamamlanmamış gama fonksiyonu olduğundan açık ve net bir eşitliği elde edilemez. Bu nedenle
gama dağılımına ait bu fonksiyonlar burada verilmemiştir. Ancak belli alfa değerleri için
fonksiyonların değeri kolayca hesaplanabilmektedir.
V.2.4 Log-Normal Dağılım
Bu dağılım, bir değişkenin logaritmik değerlerinin normal dağılması anlamına gelir. Weibull
ve Gamma dağılımına alternatif bir dağılım olup sağkalım ve güvenilirlik çalışmalarında

36
Prof.Dr. Kamil ALAKUŞ

uygulama alanı bulabilen önemli dağılımlardan biridir. İki parametreli log-normal dağılımın
olasılık
yoğunluk fonksiyonu,
1 ln 𝑡−𝜇 2
1 − [( ) ]
𝑓 (𝑡) = {√2𝜋 𝜎 𝑡 𝑒 ,𝑡 > 0
2 𝜎
(5.12)
0, 𝑑. ℎ.
sağkalım (güvenilirlik) fonksiyonu ise;
ln 𝑡−𝜇
𝑆 (𝑡 ) = 1 − Φ ( ), 𝑡 > 0 (5.13)
𝜎

hazard fonksiyonu,
ℎ(𝑡) = 𝑓(𝑡)𝑆−1(t) (5.14)
ile verilir. Ne yazık ki Eşitlik (5.14) ile verilen hazard fonksiyonun net bir formülasyonu
yazılamamaktadır.
𝜎2 2
Ortalama ve varyansı sırasıyla, 𝐸(T) =𝑒 𝜇+ 2 ve 𝑉(T) = (𝑒 𝜎 − 1)𝑒𝜎2+2𝜇 ile verilir. Farklı
parametre değerleri için değişik olasılık yoğunluk grafikleri gösterebilir. Örneğin; 𝜇 = ln (8)
ve 𝜎 = ln (2), 𝜎 = ln (2,5) ve 𝜎 = ln (3), değerleri için böylesi bir grafik, Grafik V.4’de
verildiği gibidir.

Log-Normal Dağılım
0.08

Sigma=2.0
0.06

Sigma=2.5

Sigma=3.0
f(t)

0.04
0.02
0.0

0 20 40 60 80 100
t

Grafik V.4: 𝜷 = 𝐥𝐧(𝟓) iken Çeşitli 𝝈 Değerleri İçin Log-Normal Olasılık Yoğunluk Fonksiyonu
Grafiği.

37
Prof.Dr. Kamil ALAKUŞ

V.2.5 Log-Lojistik Dağılım


Sağkalım ve güvenilirlik çalışmalarında uygulama alanı bulabilen önemli dağılımlardan biridir.
Weibull hazard fonksiyonunun kısıtlı olduğu durumlarda log-lojistik dağılım kullanılabilir.
Farklı biçimlerde yazılabilen iki parametreli log-lojistik dağılımın bu çalışmada kullanılan
olasılık yoğunluk fonksiyonu,
𝛼 𝑡 𝛼−1 𝑡 −2
( ) [1 + ( )] , 𝑡>0
𝑓 (𝑡 ) = { 𝛽 𝛽 𝛽 (5.15)
0, 𝑑. ℎ.
sağkalım (güvenilirlik) fonksiyonu ise
𝛽𝛼
𝑆(𝑡) = 𝛽𝛼 +𝑡 𝛼 , 𝑡>0 (5.16)

hazard fonksiyonu,
𝛼 𝑡 𝛼−1
ℎ (𝑡 ) = 𝛽 ( 𝛽 ) [1 + 𝛽𝑡 𝛼 ]−1 , 𝑡 > 0 (5.17)

ile verilir. Eğer 𝛼 ≤ 1 ise hazard fonksiyonu monoton olarak azalır, 𝛼 > 1 ise hazard fonksiyonu
monoton olarak artar (Alakus, 1997). Ortalama ve varyansı orijine göre momentler yardımı ile
bulunabilir. Böylece 𝑘 < 𝛼 olmak üzere log-lojistik dağılımın orijine göre momentleri,
𝑘 𝑘 𝑘𝜋
𝐸 (𝑇 𝑘 ) = 𝛽 𝑘 𝐵 (1 − 𝛼 , 1 + 𝛼 ) = 𝑘𝜋 , 𝑘 = 1,2, ⋯. Burada 𝐵(. , .) beta fonksiyonudur.
𝛼 𝑆𝑖𝑛(
𝛼

Böylece; ortalama
𝜋𝛽 𝛽2 2 𝜋
ve varyansı sırası ile 𝐸 (𝑇) = 𝛼 𝑆𝑖𝑛(𝜋 , 𝛼 > 1 ve 𝑉 (𝑇) = ( 2𝜋 − 𝜋 ) , 𝛼 > 2 ile
𝛼
𝛼 𝑆𝑖𝑛( ) 𝛼𝑆𝑖𝑛 2 ( )
𝛼 𝛼

verilir.
Her farklı 𝛼 ve 𝛽 değerleri için farklı olasılık yoğunluk fonksiyonu şekilleri elde edilmektedir.
Örneğin; 𝛽 = 8 ve 𝛼 = 2, 𝛼 = 2.5 ve 𝛼 = 3, değerleri için böylesi bir şekil, Grafik V.5’de
verildiği gibidir.

38
Prof.Dr. Kamil ALAKUŞ

Log-Lojistik Dağılım

0.04
0.03

Alfa=2.0

Alfa=2.5

Alfa=3.0
f(t)

0.02
0.01
0.0

0 20 40 60 80
t

Şekil 1.5 β=8 iken Çeşitli α Değerleri İçin Log-Lojistik Olasılık Yoğunluk Fonksiyonu Grafiği.

V.2.6 Pareto Dağılımı


Oldukça uzun kuyruğa sahip olan pozitif (sağa) çarpık bir dağılım olup, Pareto dağılımı ilk
olarak Pareto (1987) tarafından ortaya çıkmıştır. Çok farklı türleri mevcuttur. Bu çalışmada
tercih edilen ve en yaygın uygulama imkanı bulan iki parametreli Pareto dağılımının olasılık
yoğunluk fonksiyonu,
𝛼 𝛽 𝛼
( ) ,𝑡 ≥ 𝛽 > 0
𝑓 (𝑡 ) = { 𝑡 𝑡 (5.18)
0, 𝑑. ℎ.
olarak ifade edilir. Sağkalım fonksiyonu ise,
𝛽 𝛼
𝑆 (𝑡 ) = ( 𝑡 ) , 𝑡 ≥ 𝛽 > 0 (5.19)

ile verilir.
hazard fonksiyonu,
𝛼 𝛽𝛼
ℎ(𝑡) = ( 𝑡 ) [𝑡 𝛼 −𝛽𝛼 ], 𝑡 > 0 (5.17)

𝛼𝛽 𝛼𝛽2
Ortalama ve varyansı sırası ile 𝐸 (𝑇) = (𝛼−1) , 𝛼 > 1 ve 𝑉 (𝑇) = (𝛼−1)2(𝛼−2) ,𝛼 > 2 ‘dir.

Örneğin; 𝛽 = 8 ve 𝛼 = 2, 𝛼 = 2.5 ve 𝛼 = 3, değerleri için olasılık yoğunluk fonksiyonu grafiği,


Grafik V.6’da sergilenmektedir.
39
Prof.Dr. Kamil ALAKUŞ

Pareto Dağılımı

0.3

Alfa=2.0

Alfa=2.5
0.2
f(t)

Alfa=3.0
0.1
0.0

0 20 40 60 80
t

Grafik V.6 𝛽 = 8 iken Çeşitli 𝛼 Değerleri İçin Pareto Olasılık Yoğunluk Fonksiyonu Grafiği.

40

You might also like