Download as pdf or txt
Download as pdf or txt
You are on page 1of 21

SOSYAL AĞ ANALİZİ VE VERİ MADENCİLİĞİ

Ajanda 2

1 Ağ Modelleri

2 Gerçek Hayat Ağları

3 Rassal Ağ Modelleri

4 Watts-Strogats Küçük Dünya Ağ Modeli

5 Barabasi-Albert Ölçekten Bağımsız Ağ Modeli

6 Örnek Sorular
Ağ Modelleri 3

• Gerçek hayat ağlarının (biyolojik, kimyasal etkileşim, iletişim vs.)


oluşumundaki temel süreçlerin anlaşılması için bu ağları taklit
etmeye çalışan ağ modelleri geliştirilmeye çalışılmıştır.

• Bu modeler sayesinde;
• Gerçek hayat ağlarında gözlenen olayların somut
matematiksel açıklamalara dayalı olarak anlaşılması ve
açıklanması mümkün olacaktır.

• İstenilen büyüklükte gerçek hayat ağlarını bulmak mümkün


olmaya bilir ya da mümkün olsada ağın yapısal bilgilerini
elde etemek çok zahmetli olabilir.

• Dolasıyla ağ modelleri sayesinde sentetik ağlar


oluşturulabilir ve gerçek hayat ağları üzerinde yapılmak
istenen deney ve analizler rahatlıkla yapılabilir.
Gerçek Hayat Ağları 4

• Gerçek hayat ağları benzer bazı karakteristik özelliklere sahiptir.

• Ağ modelleri geliştirilirken, bu modellere dayalı olarak


oluşturulan sentetik ağların da benzer özellikleri göstermesi
amaçlanmaktadır.

• Fakat şu ana kadar geliştrilen modellerin hiçbiri bu özelliklerin


tümünü aynı anda içermemektedir.

• Gerçek hayat ağlarında ölçümlenen ve ağdan ağa farketmeksizin


tutarlı bir şekilde benzerlik gösteren üç temel karakteristik özellik
mevcuttur. Bu özellikler;

• Derece dağılımı,
• Ortalama yol uzunluğu,
• Kümeleme katsayısı.
Derece Dağılımı 5

• Gerçek hayat ağlarında derece dağılımları incelendiğinde , bu dağılımların Kuvvet Yasası Dağılımı
sergiledikleri görülür.

• Bu dağılıma göre, bir ağda derecesi çok düşük olan çok sayıda düğüm bulunurken, derecesi çok
yüksek olan az sayıda düğüm bulunur.

• Yani, çoğu kişinin yalnızca birkaç arkadaşı varken, binlerce arkadaş sahip çok az sayıda kişi vardır.

• Kuvvet yasası dağılımı gösteren ağlar genellikle ölçekten bağımsız ağlar olarak adlandırılır.

• Sosyal ağlar ölçektrn bağımsız ağlardır ve çoğunlukla kuvvet yasası dağılımına uygunluk
göstermektedir.
Kümelenme Katsayısı 6

• Gerçek hayat ağları, kümeleme etkisi adı verilen özellik sergilemektedir.

• Ağdaki düğümler yüksek geçişlilik özelliğine sahiptir.

• Ağdaki iki düğüm eğer ortak bir komşuya sahiplerse ikisi arasında çok yüksek olasılıkla bir ağ
vardır.

• Ağın global kümalenma katsayısı ve düğümlerin yerel kümelenme katsayılarının yüksek olması
bu özelliğin olduğunu bize gösterir.
Ağ Modelleri 7

• Rassal Ağ Modelleri:
• Derece Dağılımı: Poisson dağılım gösterir. Kuvvet yasası dağılımına
uymaz.

• Ortalama Yol Uzunluğu: Kısa ortalama yol özelliğini oldukça başarılı bir
şekilde modeller.

• Kümelenme Katsayısı: Gerçek hayat ağlarının kümelenme katsayısına


kıyasla son derece düşüktür.

• Sonuç: Gerçek hayat ağlarını tam olarak örnekleyememektedir.


Ağ Modelleri 8

• Watts-Strogatz Küçük Dünya Ağ Modeli:


• Derece Dağılımı: Poisson dağılım gösterir. Kuvvet yasası dağılımına
uymaz.

• Ortalama Yol Uzunluğu: Kısa ortalama yol özelliğini oldukça başarılı bir
şekilde modeller.

• Kümelenme Katsayısı: Gerçek hayat ağlarındaki gibi oldukça yüksek


olmaktadır.

• Sonuç: Deneysel olarak kullanılabilir.


Ağ Modelleri 9

• Barabasi-Albert Ölçekten Bağımsız Ağ Modeli


• Derece Dağılımı: Gerçek hayat ağlarında gözlenen kuvvet yasası
derece dağılımına uygundur.

• Ortalama Yol Uzunluğu: Kısa ortalama yol özelliğini oldukça başarılı bir
şekilde modeller.

• Kümelenme Katsayısı: Gerçek hayat ağlarının yüksek kümelenme


etkisini gösterememektedir.

• Sonuç: Deneysel olarak kullanılabilir.


Topluluk Analizi 10

• Büyük ve karmaşık ağlarda düğümler bir araya gelerek yani belirgin bir
şekilde kümelenerek ağ toplulukları adı verilen gruplaşmalar oluştururlar.

• Dolayısıyla, bu toplulukların analiz edilmesi son derece yararlı bilgiler


sağlar.

• Sosyal ağlardaki gruplaşmalarda bireylerin ortak ilgi alanlarının etkisi


önemlidir.

• Örneğin bir bireyin ilgi duyduğu herhangi bir ürün büyük olasılıkla aynı
gruptaki başka bir bireyin de ilgisini çekecektir.

• Bireylerin davranışları çok hızlı değişiklik gösterebilirken toplulukların


kollektif davranışları genellikle istikrarlıdır, değişime ve dış etkilere karşı
daha dayanıklıdır.
Topluluk Analizi 11

• Sosyal ağlar genellikle iki tür topluluk oluşumu sergilerler.


• Belirgin topluluklar: topluluğun oluşumu için gerekli ortak ilgi alanı
belirgindir. Üyeler bilinçli ve açık bir şekilde topluluğa katılım gösterir.
Topluluk üyeleri arasıdnaki sosyal etkileşim düzeyi topluluk dışındaki
bireylerle olan etkileşime göre çok daha yüksektir.
Örnek: LinkedIn’deki profesyonel gruplar

• Üstü kapalı topluluklar: bu tür gruplar bireylerin aralarındaki


etkileşimleri nedeniyle belirli bir grup oluşturma hedefi olmaksızın
kendiliğinden oluşan topluluklardır.
Örnek: Bir kitap satış sitesinde aynı tür romanları diğer müşterilere
göre daha belirgin bir şekilde daha fazla satin alan müşteriler kendi
aralarında üstü kapalı bir topluluk oluşturabilir. Bir tür bir topluluğun
bilinmesi sayesinde satışları arttırmaya yönelik ortak kitap ilgisine sahip
müşterilere uygun kitap önerilerinde bulunulabilir.
Topluluk Analizi 12

• Zachary’nin karate kulübü ağı. Kulüp yöneticisi (34) ile karate eğitmeni (1)
arasında gelişen anlaşmazlık sonucu ortaya çıkan topluluklar.
Kenar Merkeziliği Tabanlı Topluluk Tespiti 13

• Topluluklar arası iletişim için kritik durumda olan yani merkesi


durumda olan kenarların bulunması yani farklı topluluklarda yer
alan düğümler arasındaki en kısa yollar mutlaka bu az sayıdaki
kenar üzerinden geçmektedir.

• Merkezi konumdaki bu kenarlar ağdan çıkartıldığı takdirde ağdaki


bu topluluklar bağlantılı bileşenler olarak elde edilmiş olur.

• Bu süreç arka arkaya işletilerek istenilen ayrıntıda topluluk tespiti


yapılabilir.
Kenar Merkeziliği Tabanlı Topluluk Tespiti 14

• En çok kullanılan topluluk tespiti algoritmalarından biri Girvan-


Newman algoritmasıdır. Kenar merkezilik ölçütü olarak kenar
arasındalık merkeziliğini kullanmaktadır. Algoritma şu adımlardan
oluşur:

1. Ağdaki tüm kenarların arasındalık merkeziliğini hesapla


2. En yüksek arasındalık değerine sahip kenar ya da kenarları ağdan
çıkart.
3. Kalan kenarlar için yeniden arasındlık merkeziliğini hesapla
4. Ağdaki tüm kenarlar çıkartılana kadar adım 2 ve 3’ü tekrar et.

• Bu algoritma ile ortaya çıkan hiyerarşik kümelenmeler dendrogram


adı verilen bir gösterim şekliyle görselleştirilip sunulabilir.
Kenar Merkeziliği Tabanlı Topluluk Tespiti 15
Modularite Tabanlı Topluluk Tespiti 16

• Topluluk tespitinde en çok kullanılan ve oldukça etkili


yöntemlerden biridir.

• Newman ve Girman tarafından tanımlanmış olan modularite


kavramını kullanan modularite en çoklama yaklaşımıdır.

• Modularite kavramına göre bir ağdaki toplulukların oluşumu


kesinlikle rastgele bir sürecin sonucu değildir.

• Yani bir gerçek hayat ağındaki toplulukların kenar yoğunlukları


aynı dereceli düğümlerin yer aldığı ve düğümler arası kenarların
rastgele bir süreçle oluşturulduğu topluluklara göre çok daha
yüksek olmalıdır.
Modularite Tabanlı Topluluk Tespiti 17

• Bu ikisi arasındaki kenar yoğunluk farkı modulariteyi tanımlar.

• Farkın en yüksek olduğu yerden ağ bölümlenmeleri,


kümelenmeleri yapılır.

• Büyük ağlarda kümelenmelerin tespiti çözünürlülük problemi


nedeniyle zordur.

• Bu problem aşmak için hesaplamalarda çözünürlülük limiti


kullanılır.
Benzerlik Tabanlı Topluluk Tespiti 18

• Veri Madenciliğindeki kümeleme analizinde nesneler içinde


bulundukları geometrik uzaydaki konumlarına bağlı olarak
aralarında hesaplanan bir uzaklık değeri üzerinden ya da böyle bir
geometrik konumun söz konusu olmadığı durumlarda ise
aralarındaki bir benzerlik değeri üzerinden gruplara ayrılmaktadır.

• Benzerlik tabanlı kümeleme yaklaşımı ağlardaki düğümlerin


kümelenmesinde de kullanılmaktadır.

• Benzer düğümlerin aynı toplulukta yer alması gerektiği varsayımı


geçerlidir.
Benzerlik Tabanlı Topluluk Tespiti 19

• Benzerlik tabanlı topluluk tespiti yapılabilmesi için


• Düğümler arasında benzerlik ölçüsü tanımlanmalıdır.

• Benzerlik ölçüsü genellikle düğümlerin ortak komşularının sayısıdır.

• Büyük ağlarda düğümler ortak çok fazla komşuya sahip olabileceği için bu değer
normalize edilmelidir.

• Kosinüs Benzerliği ve Jaccard Benzerliği en yaygın kullanılan ölçütlerdir. (0-1) arasında
değer alır.

• Düğüm çiftleri arasındaki karşılıklı benzerlik değerleri hesaplandıktan sonra veri
madenciliği literatüründeki herhangi bir hiyerarşik kümeleme algoritması kullanılarak
düğümler kümelenir.

• Sonuç olarak ağdaki toplulukları hiyerarşik olarak görüntülemeye olanak sağlayan


dendrogram yapısı elde edilmiş olur.
Benzerlik Tabanlı Topluluk Tespiti 20
TEŞEKKÜRLER

You might also like