Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 144

Makine Öğrenmesi

Giriş
Dr. Öğr. Üyesi Hikmet MARAŞLI
Kapsam ve İçerik

• Giriş
• Ders İçeriği
• Kavramlar
• İnsan Gibi Düşünen Sistemler
• Yapay Zeka
• Makine Öğrenmesi
Giriş
Zeka nedir?
• İnsanın; öğrenme, anlama, düşünme, sorgulama, planlama, problem
çözme gibi zihinsel işlevleri zeka olarak tanımlanmıştır.
• Zeka zaman içinde; eğitim, öğrenme ve çevresel etkenlere bağlı
olarak gelişebilmektedir.
• Akıl: Düşünme, kavrama, anlama yetisidir.
Bilgisayar Bilimi (Computer Science)
• Bilgisayar Bilimi
• Bilgisayar bilimleri çalışma alanı sadece “bilgisayar” ile kısıtlı olmayan bir
bilim dalıdır.

• Algoritma tasarlama ve çözümlemeden bilgisayarların bu


algoritmaları gerçekleştirmesine hesaplama ile ilgili herşeyi içerir.

• Temelde Mantık ve Matematik bilimlerinin üzerine kurulmuştur ve


Elektrik,
Elektronik bilimlerinin teknolojilerini kullanır.
Bilgisayar
Mühendisliği
• Problem çözme için algoritma çözümleme ve tasarımı, bilimsel yönteme dayalı
titiz bir yaklaşım içerir.
• Bilgisayar bilimleri de özellikle algoritmanın sonucunu geçerlemek için
• Hipotezler oluşturulur
• Bu hipotezler test edilir
• Ve sonuca göre algoritmalar gözden geçirilir.
• Bilgi teknolojileri (information technology) ve bilgi sistemleri
yönetimi (information systems management)
• Hesaplamaya işletmeci bakış açısından yaklaşır.
• Bilgi ve bilgisayar teknolojilerinin etkili kullanımına odaklanır.
Nanoteknoloji
• Nanoteknoloji kullanılarak geliştirilmeye başlayan ve geliştirilecek yongalar
ve mantık kapıları daha küçük cihazların yapılmasını sağlayacaktır.
• Yakın gelecek sadece birkaç atomdan oluşacak ve nanoteller olarak
adlandırılan elektrik iletkenleri sadece bir atom kalınlığında olacak ve bir
veri biti bir elektronun varlığı veya yokluğu ile temsil edilecektir.
• Uçan, Yürüyen, Yüzen ve Bütünleşen Nanorobotlar
• Bilim adamları, programlanabilen antikorlar olarak görev yapacak
nanorobotları oluşturmak için nanoteknolojiyi kullanmayı hedefliyorlar.
• Mutasyona uğramaya devam eden patojenik bakterilere ve virüslere karşı
korumaya yardımcı olacak ve nanobilgisayar içeren birçok ilaç mikropları
etkisiz hale getirecektir.
• Nanorobotların insan tıbbının geleceğinin bir parçası olacağı tahmin
edilmektedir.
IoT- Nesnelerin İnterneti
• IoT (Internet of Things) , nesnelerin interneti ile nesneler çevrelerinde bilgi
toplayan, farklı protokolleri kullanan akıllı ağ yapısında, birbirlerine bağlanarak,
birbirleri ile haberleşen ve bilgilerden davranış geliştiren donatılmış akıllı
makinelerdir.
• Gezgin (mobil) ağlar ve internetin gelişimiyle birlikte akıllı makinelerin kişiler ile
iletişim kurmaları kolaylaştı ve insanlar da onları her yerden, her zaman
gözlemleme ve kontrol etme şansına sahip oldu.
• Yakın gelecekte birbirlerine bağlı akıllı makineler sayesinde ortaya çıkacak veri
miktarı inanılmaz derecede arttacak ve bu büyük verilerin çözümlenerek işlenmesi
zor ve karmaşık hale gelecektir. Bunun yanında verilerin gizliliği ve güvenliği de
önemli bir konu olarak karşımıza çıkmaktadır.
• Karşılıklı etkileşimin her nesnenin içine gireceği ve farklı nesnelerin ortak amaçlar
için gezgin hareket edeceği bir döneme gireceğiz. Bu arada insanların fizyolojik ve
psikolojik olarak bu değişime nasıl karşılık vereceği de önemli soru olarak kendini
göstermektedir.
Makine Öğrenmesi
• Bilgisayar kontrolündeki bir sistemin ya da cihazın faaliyetlerini insan zekasına benzer şekilde yerine getirme
yeteneği kazandırılması, bilgi yığınından öğrenen zekanın geliştirilmesi ile mümkün olabilir.
• Diğer bir anlatımla, kendi kendine öğrenen matematiksel modeller ve algoritmalar ile insandan bağımsız otonom
davranış geliştirmesi ile mümkün olabilir.
• Verilere dayalı tahminler ve otonom davranış paternleri geliştiren matematiksel modelle ve algoritmalar
bilgisayar sistemlerinin temel yazılımlarıdır.

Bilgisayar Sistemleri:
• CPU (Mikroşlemci), Bellek, I/O Birimleri ve Sistem Bus
• Sistem Bus: Adres Bus, Data Bus, Control Bus
• Adres Bus bellek gözü ve I/O Birimlerini seçer. Data Bus: Birimlerin CPU ile veriş haberleşmesi yapar. Control Bus:
CPU’nun
komutları işlemisi durumunda değişimler hakkındaa bilgi verir.
• Analog dünya ile Bilgisayar sistemleri arasındaki I/O birimleri:
Algılayıcılar, detektörler, ölçerler ve sürücü kartlardır.
• Sürücü kartları: Motor, piston, makara, kol kontrolunda
kullanılır.Training Data Machine Learning Algorithm
Training
Prediction
“Live” Data Trained Model Prediction
Makine Öğrenmesi KonusundaUzmanlık için
Önkoşullar
• Bir kuruluşta makine öğrenimini devreye almanın, teknolojiye ilişkin pratik operasyonel
içgörü ve ekipler arasında işbirliğini geliştirme becerisi gerektirmektedir.
• Teknik yetenekler gerektirmez ve size kod yazmayı öğretmez - daha ziyade,
kuruluşunuzun veri yığınına ulaşmasına yardımcı olmak için makine öğrenimi
kullanılarak işinizdeki sorunları çözme becerisi ile donatmayı amaçlamaktadır.
• Machine Learning is Everywhere: Image Recognition, Speech Recognition, Stock
Prediction, Medical Diagnosis, Data Analytics, Robotics and more…
Kuantum Makine Öğrenmesi
• Son yıllarda veri analizi uygulamaları ve akıllı makineler ilgili araştırmalar güçlü bir şekilde
yeniden ortaya çıkmıştır.
• Bu güçlenen ilgi kısmen klasik hesaplama yöntemlerindeki gelişmeler ve kısmen de Kuantum
Hesaplama (QC - Quantum Computing) ve ilgili kuantum teknolojileri tarafından sunulan
muazzam paralellik potansiyelinden kaynaklanmaktadır.
• Hesaplama yöntemlerindeki bu gelişmeler, Makine Öğrenmenin (ML – Machine Learning),
veri güdümlü öğrenme ve kuantum destekli hesaplama yöntemleri, hizmet odaklı tamamen
akıllı bir iletişim ağının isteklerini gerçekleştirmede güçlü bir potansiyele sahiptir.
• Ortaya çıkan insan ve makine arası bağlantıyı artırma paradigmasında, ağ düğümü sayısı ve
veri trafiğinde önemli bir artış beklenmektedir.
• Makine Öğrenmesi (ML ) ve Quantum Hesaplama (QC) yöntemleri hacimli verilerin verimli bir
şekilde işlenmesine yönelik olarak, Quantum ML (QML) teknolojilerini sağlayan yeni bir
çerçeve sunacaktır.
• IOT
• 5G ve 6G
Pattern Neurocomputing
Recognition
Statistics

Deep
Learning
+
Artificial
Data Intelligenc
Mining e
Machine
Databases Learning
Knowledge
Discovery
Makine Öğrenmesi
Tarihi
Makine Öğreniminin Kısa Tarihi
• 1950s • 1980s:
– Samuel’s checker player - Gelişmiş karar ağacı ve kural öğrenme
– Selfridge’s Pandemonium - Açıklamaya Dayalı Öğrenme (EBL)
• 1960s: - Öğrenme ve planlama ve problem çözme
– Neural networks: Perceptron - Yardımcı program sorunu
– Pattern recognition - Analoji
– Learning in the limit theory - Bilişsel mimariler
– Minsky and Papert prove limitations of - Sinir ağlarının yeniden dirilişi (bağlantısallık, geri
Perceptron yayılım)
• 1970s: - Valiant’ın PAC Öğrenme Teorisi
– Symbolic concept induction - Deneysel metodolojiye odaklanın
– Winston’s arch learner
– Expert systems and the knowledge acquisition • 1990s
bottleneck - Veri madenciliği
– Quinlan’s ID3 - Uyarlanabilir yazılım aracıları ve web
– Michalski’s AQ and soybean diagnosis uygulamaları
– Scientific discovery with BACON - Metin öğrenme
– Mathematical discovery with AM - Takviye öğrenme (RL)
- Endüktif Mantık Programlama (ILP)
-
Makine Öğreniminin Kısa Tarihi
• 2000s
- Vektör makinelerini ve çekirdek yöntemlerini destekleyin
- Grafik modeller
- İstatistiksel ilişkisel öğrenme
- Transfer öğrenimi
- Sıra etiketleme
- Toplu sınıflandırma ve yapılandırılmış çıktılar
- Bilgisayar Sistemleri Uygulamaları (Derleyiciler, Hata Ayıklama, Grafikler,
Güvenlik)
- E-posta yönetimi
- Öğrenen kişiselleştirilmiş asistanlar
- Robotik ve vizyonda öğrenme
• 2010s
- Derin öğrenme sistemleri
- Büyük veri için öğrenme
- Bayesci yöntemler
- Çok görevli ve yaşam boyu öğrenme
- Görme, konuşma, sosyal ağlar, okumayı öğrenme vb. Uygulamalar
Ders İçeriği
Ders İçeriği
• Öğrenme problemi
- hipotez sınıfı, tahmin algoritması • Parametre belirsizliği
- kayıp ve tahmin kriteri - regresyon modeli, temel
- örnekleme, ampirik ve beklenen kayıplar model
• Regresyon, örnekleme - ML tahmincisinin
• Doğrusal regresyon ortalama
- tahmin, hatalar, analiz ve varyansı
• Doğrusal regresyon modellerinin ötesi • Aktif öğrenme
- toplamsal regresyon modelleri, - belirsizlik ölçüleri
örnekler - seçim kriterleri,
- genelleme ve çapraz doğrulama algoritmalar
- nüfus küçültücü
• İstatistiksel regresyon modelleri
- model formülasyonu, motivasyon
- maksimum olasılık tahmini
Ders İçeriği
Sınıflandırma ve regresyon
- sınıflandırmaya regresyon yaklaşımı
- Fisher doğrusal ayırt edici
- temel karar teorisi
Lojistik regresyon
- model, gerekçe
- tahmin, stokastik gradyan
- katkı uzantısı
- genelleme
Düzenlilik
- önceden, cezalar, MAP tahmini
- düzenlileştirmenin etkisi, genelleme
- düzenleme ve ayrımcılık
Ayrımcı sınıflandırma
- kriter, marj
- destek vektör makinesi
Bu Derste Neleri Ele Alacağız

• Denetimli öğrenme • Denetimsiz öğrenme


- Karar ağacı - Kümeleme
indüksiyonu - Boyutsal küçülme
- Doğrusal regresyon
- Lojistik regresyon • Pekiştirmeli öğrenme
- Zamansal fark
- Vektör makinelerini
öğrenme
ve çekirdek
yöntemlerini - Q öğrenme
destekleyin • Değerlendirme
- Model toplulukları
• Uygulamalar
- Bayes öğrenimi
- Sinir ağları ve derin
öğrenme
- Öğrenme teorisi gerçek uygulamalara uygulamaya
Makine öğrenimini
odaklanacağız
Bu Dersin Tamamlanmasıyla Aşağıdakilere Sahip
Olacaksınız:
• Makine öğreniminin (ML) yeteneklerinin anlaşılması ve iş probleminizi
etkili bir şekilde çözmek için formüle etme bilgisi.
• Makine öğrenimi modelini dağıtmak, izlemek ve değerlendirmenin
yanı sıra alaka düzeyini ve farklı makine öğrenimi modellerinin
kullanımlarını değerlendirmek için etkili bir süreç.
• Kurumsal veri olgunluğuna ulaşmak için verileri verimli bir şekilde -
etik ve güvenli bir şekilde - toplamak, işlemek ve kullanmak için bir
bilgi temelinin temeli.
• Makine öğrenimi yaklaşımınız için iş durumunu iletme ve kodlama
ve
makine öğrenimi çabalarınızı doğru yönde yönlendirme yeteneği.
Makine Öğrenmesi
Uygulamaları
• Makine öğrenimi ile iş süreçlerindeki sorunların çözülmesi.
• Bir iş problemini çözmek için verileri kullanmanın etik ve yasal
süreçlerinin keşfedilmesi.
• Makine öğrenimi modellerinin performansını ölçülmesi
ve değerlendirilmesi.
• İş dünyasında derin öğrenmenin uygun uygulamalarını
araştırılması.
• Model üretilmesi. Bir modelin devreye alınmaya hazır olmasını
etkileyen faktörlerin incelenmesi.
• Organizasyonel makine öğrenimi yaklaşımının gerekçelendirilmesi.
• Veri yığınından bilgelik elde etmek için makine öğreniminde,
uygulamaya
yönelik bir strateji geliştirilmesi.
Amazon Web Services (AWS)

• AWS Ücretsiz Kullanım kapsamında sunulan ürünleri kullanarak makine


öğrenimi
çözümleri oluşturulması:

• Amazon Polly: Metni gerçekçi konuşmaya dönüştürün


• Amazon Lex: Ses ve Sohbet Metni Tabanlı Sohbet Robotları Oluşturun
• Amazon Rekognition: Derin öğrenme tabanlı görüntü ve yüz tanıma hizmeti
• Amazon Comprehend: Sürekli eğitilen ve tam olarak yönetilen doğal dil
işleme (NLP)
• Amazon Transcribe: Otomatik konuşma tanıma ile uygulamalarınıza
konuşmayı
metne dönüştürme özelliği ekleyin
Kavramlar
Kavramlar
• Örüntü - Pattern: Olay veya nesnelerin düzenli bir biçimde birbirini takip
ederek gelişmesi (TDK). Bir nesnenin iki veya üç boyutlu, uzaysal ve
geometrik davranış paterni olarak düşünülebilir. Diğer bir ifadeyle
örüntü, ilgilenilen varlığın davranışı ile ilgili uzayda gözlenebilir veya
ölçülebilir geometrik bilgilere sahip olmasıdır.
• Olgu: Doğrulukları ispatlanmış önermeler veya beklenen eylemlerdir.
• Olay: Olguları oluşturan vakalardır. Örnek; Yağmur yağacak olması
olgu, bunun Salı günü olması olaydır.
• Sinyaller: Bilgi taşıyan değişkenlerdir. Matematiksel olarak, sinyaller
bir veya daha fazla bağımsız değişkenin fonksiyonu olarak temsil edilir.
Sinyaller, verilerin elektriksel veya elektromanyetik gösterimleridir.
• Hipotez: Bir problemi doğru sonuca ulaştırması beklenen çözüm
yollarıdır.
Araştırma konusuyla ilgili olarak ortaya konulan; doğruluğunun
araştırılması gereken önermelerdir. Hipotezler, araştırmaya yön veren
temel düşünceler, varsayımlardır.
Data types
Veriler farklı boyutlarda ve ayrıca türlerde
gelir:
• Metinler
• Sayılar
• Tıklama akışları
• Grafikler
• Tablolar
• Görüntüler
• İşlemler
• Videolar
Some or all of the above!
Academic Disciplines relevant to AI
• Philosophy: Logic, methods of reasoning, mind as physical system, foundations of learning, language,
rationality. (Mantık, akıl yürütme yöntemleri, fiziksel sistem olarak zihin, öğrenmenin temelleri, dil,
akılcılık.)
• Mathematics : Formal representation and proof, algorithms, computation, (un)decidability, (in)tractability
( ( Resmi temsil ve ispat, algoritmalar, hesaplama, karar verilebilirlik, karar verilemezlik, izlenebilirlik,
• izlenemezlik)
Probability/ modeling uncertainty, learning from
• Statistics
Economics: : utility, decision
datatheory, rational economic agents (fayda, karar teorisi, rasyonel
ekonomik faktörler)
• Neuroscience: neurons as information processing units.
• Psychology/ Cognitive how do people behave, perceive, process cognitive information,
knowledge.
Science: (İnsanlar bilgiyi nasıl algılar,
representbilişsel bilgiyi nasıl işler, bilgiyi nasıl temsil eder?
• Computer engineering: building fast computers
• Control theory: design systems that maximize an objective function over time (Zaman içinde bir hedef
işlevi
en üst düzeye çıkaran sistemlerin tasarlanması)
• Linguistics: knowledge representation, grammars
Öğrenmeye Giriş Konuları
• Doğrusal cebir tekrar
• Gudumlu oğrenme, Doğrusal regresyon, sınıflandırma, Naive Bayes, k-
en yakın komşu, karar ağacları
• Sınıflandırma, Lojistik Regresyon,
• Eniyileme, bayır inişi, Newton yontemi, Momentum
• Regularizasyon, Oz nitelik secimi,
• Yapay Sinir Ağları (YSA), Derin oğrenme cerceveleri (PyTorch), Otomatik
Turev alma
• Gudumsuz Oğrenme, k-ortalama obekleme, spektral obekleme
• Boyut duşurme, Tekil değer ayrışımı (SVD), Temel Bileşenler Analizi
(PCA),
• Matris Ayrışımları, Negatif olmayan matris ayrışımı, tavsiye sistemleri
Alt Yapı Gereksinimi

• İstatistik Veri analizi


• Olasılık: Bayes Kuramı, Markov Zincir Analizi, Rassal Değişkenler ve
Olasılık Yoğunluk Fonksiyonları, Hipotez
• Sinyaller ve Sistemler
• Mantık: Bolean Cebir, Sıralı Mantık, Durum Tablosu, Durum
Diyagramı, Doğruluk Tablosu
• Yazılım: Matlab, Python, Python Makine Öğrenmesi Algoritmaları,
C++, Assemble, R
Olasılıksal Yapay Öğrenme

• Olasılık kavramları tekrar, Bayes kuralı


• Bayesci çıkarım ve uygulamalar
• Zincir ve ağaç yapılı modellerde tam ve hatasız çıkarım, toplam
çarpım
algoritması
• Olasılık modelleri, en büyük olabilirlik, en büyük sonsal ve
Bayesci çözümler, Üstsel aileler
• Çok değişkenli Gauss modelleri, Bayesci doğrusal modeller
• Gauss süreçleri ve Faktör analizi
• Saklı Markov modelleri, ileri geri algoritması
• Doğrusal Dinamik sistemler ve çıkarım, Kalman süzgeci ve
düzleştiricisi
• Yaklaşık çıkarım, EM algoritması ve Varyasyonel yöntemler
Düşünen, bir insanın zihninde neler
oluyor?
Düşünen, bir insanın zihninde neler oluyor?

Düşünen bir insan için hayati öneme sahip olan şey nedir?

Düşünen insan beyninde anahtar işlev nedir?


İnsanlar Gibi Düşünen Sistemler
• “Bilgisayarları düşündürmeye … kelimenin tam anlamıyla zihne sahip makineler yapmaya çalışan yeni
ve heyecan verici bir çaba” (Haugeland, 1985)
• “Karar verme, problem çözme, öğrenme … gibi insan düşüncesi ile ilişkilendirdiğimiz
aktivitelerin otomasyonu” (Bellman, 1978)
• “İnsanların zekâlarını kullanarak gerçekleştirdiği fonksiyonları gerçekleştiren makineleri yapma
sanatı”
(Kurzweil, 1990)
• “İnsanların halihazırda daha iyi olduğu işleri bilgisayarların nasıl yapabileceğine dair yürütülen çalışma”
(Rich and Knight, 1991)
Rasyonel Düşünmek
Rasyonel Düşünen Sistemler:
• “Zihinsel yeteneklerin hesaplamalı modeller aracılığıyla incelenmesi” (Charniak ve McDermott, 1985)
• “Algılamayı, düşünmeyi ve anlamayı mümkün kılan hesaplama modellerinin incelenmesi ” (Winston,
1992)

Rasyonel Davranan Sistemler:


• “Akıllıca davranan faktörlerin tasarımı üzerine yapılan çalışma” (Poole et al., 1998)
• “İnsan yapımı şeylerde akıllı davranışın incelenmesi ” (Nilsson, 1998)
İnsan Gibi Düşünme: Bilişsel Modelleme
Yaklaşımı
• Zihinsel süreçleri anlamanın yolları:
1) İç-gözlem
2) Psikolojik deneyler
3) Dilbilim
• Disiplinler-arası bir alan olan Bilişsel Bilim Yapay Zekadan
modellerini ve Psikolojiden
bilgisayar deneysel teknikleri alıp bir araya getirerek
insan zihninin nasıl çalıştığına ilişkin teoriler üretir.
Rasyonel Düşünme: “Düşüncenin Yasaları”
Yaklaşımı
• Aristoteles, “Doğru Düşünmenin Yasalarını” ilk formüle eden
düşünürlerdendir.
• => “Syllogisms” =>
Mantık
• Yapay Zekaya Mantıkçı Yaklaşım: Mantık programlarına dayanarak
akıllı sistemler üretmeyi amaçlayan yaklaşım.
• Üç Önemli Problem:
1) Bilginin formüle edilmesi
2) Teorik olarak çözülemez sorunların varlığı
3) Teorik olarak çözülebilenin pratikte çözülemezliği
Rasyonel Davranma: Rasyonel ‘faktör’ yaklaşımı

• ‘Faktör’ programlarını diğer programlardan ayıran


yönler:
- Otonom kontrol
- Ortamı algılama
- Uzun bir zaman diliminde varlığını sürdürme
- Değişime uyum gösterme
- Empati
• Rasyonel ‘faktör’ en iyi sonuca ulaşacak şekilde davranır.
Genel Bir Tarihçe
• Herşey düşünce süreçlerinin mekanikleştirilmeye çalışılması ile başladı.
• Aristoteles mantığı ve Euclid (Öklid) geometriyi kodladı.
• 19. Yüzyılda Boole ve Morgan daha da ileri gidip çıkarım şemalarını kodladılar. Boole
kitabına “Düşüncenin Yasaları” adını verdi.
• Russell ve Whitehead “Matematiğin Prensipleri” kitabını yazdı.
• Gödel çağdaş mantığın iflasını gösterdi.
• Turing tek bir evrensel makinenin programı olarak Turing makinelerini geliştirdi.
• McCulloch ve Pitts Turing’in “hesaplanabilirlik” tezine dayalı sinir hücresi (nöron)
modellerini
geliştirdiler.
• Doğal Dil İşleme teknikleri ileri düzeylere ulaştı (örn: ALICE, ELIZA).
Aristoteles’in Syllogistic Mantığı
• Mantık bilimi 2000 yıldan daha uzun bir süre önce, Aristoteles’in bir dizi düşünceyle ilgili felsefi
sezgiyi Syllogism’ler biçiminde biraraya toplayıp düzenlemesiyle başladı.

• Syllogism’ler iki öncülden bir sonucun elde edildiği özel türde

çıkarımlardır: Bütün çocuklar ben-merkezcidir.


Bazı insanlar ben-merkezci değildir.
-----------------------------------------------
Bazı insanlar çocuk değildir.

• Yalnızca aşağıdaki türden önermeler Aristoteles’in çıkarım şemalarında

yer alır: Bütün A’lar B’dir.


Bütün A’lar B
değildir. Bazı A’lar
B’dir.
Bazı A’lar B değildir.
Öklid’in Aksiyomları
Öklid (Euclid) 10 aksiyom öne sürmüştür. Bunlardan, genel kavramlar olarak adlandırdığı, 5 tanesi Geometriye
özgü değildir:
1. Aynı şeye eşit olan iki şey birbirine de eşittir.
2. Eğer eşit iki şeye eşit miktarlar eklenirse, elde edilen bütünler de eşit
3. olur. Eğer eşit iki şeyden eşit miktarlar çıkarılırsa, kalanlar da eşit olur.
4. Birbiriyle çakışan/örtüşen şeyler birbirine eşittir.
5. Bütün parçadan büyüktür.

Diğer 5 aksiyom Geometriye özgüdür ve Öklid bunlara postülalar


demiştir:
1. Herhangi bir noktadan bir başka herhangi bir noktaya bir doğru çizmek
2. mümkündür. Bir doğru boyunca sürekli olarak sonlu uzunlukta doğrular üretebiliriz.
3. Verilen herhangi bir merkez ve herhangi bir mesafe ile bir çember
4. tanımlayabiliriz. Bütün dik açılar birbirine eşittir.
5. Eğer iki doğruyu kesen bir üçüncü doğru aynı tarafta iki dik açıdan daha küçük iç açılar oluşturuyorsa, kesilen
iki doğru bu tarafta sonsuza kadar uzatılırsa kesişirler.
Boole Mantığı ve De Morgan
Yasaları
• 19. YY. matematikçisi George Boole’dan adını alan Boole Mantığı (Boolean
Logic), bütün değerlerin Doğru ya da Yanlış’a indirgendiği bir Cebir türüdür. Bool
mantığı her bitin alabileceği 0 ve 1 değerlerinden oluşan ikili sistemle çok iyi
örtüştüğü için Bilgisayar Bilimleri açısından özel bir önem taşır.

• 19. YY. mantık ve matematikçisi Augustus De Morgan’dan adını alan De


Morgan Yasaları (ya da De Morgan Teoremi) Bool Cebrinin ve Küme Teorisinin
iki önemli prensibini oluşturur:

• değil (P ve Q) = (değil P) veya (değil Q)


• değil (P veya Q) = (değil P) ve (değil Q)
Russell ve Whitehead’in Matematik Prensipleri

• Bertrand Russell ve Alfred North Whitehead 1910-1913 arasında bütün klasik


mantığın önermelerini ifade etmek amacıyla mantıksal simgeciliğin dilini kullanarak
Principia Mathematica’yı yazdılar.
• 20. YY.’ın başında Russell ve arkadaşları mantıksal paradoksları tartışma konusu yaptılar:
• Russellın Paradoks’u : Kendi kendisinin elemanı olmayan bütün kümeleri içeren küme.

• Berber Paradoksu: Köyde kendi kendine tıraş olmayan herkesi köy berberi tıraş eder? Berberi kim
tıraş eder.
• Epimenides (Girit ’linin) Paradoks’u : Bütün Girit’liler yalancıdır.

• Yalancının Paradoksu: “Ben yalancıyım” ya da “Bu cümle yanlıştır.”


Gödel’in Eksiklik Teoremi

• Gödel Yalancının Paradoksunu aşağıdaki şekilde


değiştirdi: “Bu önerme ispatlanabilir değildir.”
• …
• Aritmetiğin her tutarlı biçimselleştirilmesi için öyle aritmetik doğrular
vardır ki, bunlar bu biçimsel sistem içinde ispatlanabilir değillerdir.
Alan Mathison Turing

23 Haziran 1912’ de Londra’ da doğdu.


1938’de ABD Princetown Üniversitesi’nde Alonzo yanında hazırladığı teziyle
Church’un
doktor oldu.
İngiltere’ye döndüğünde, II.Dünya Savaşı sırasında Almanların “Enigma”
kodlarının çözülmesinde önemli rol oynadı.
1945’ te Automatic Computing Engine (ACE) olarak adlandırılan büyük bir bilgisayarın
tasarım, yapım ve kullanım çalışmalarını yönetti.
1950 yılında Mind dergisinde yayınlanan “Computing Machinery and Intelligence”
adlı makalesinde bugün TURING TESTİ olarak bilinen ünlü testi açıklamıştır.
1954’te intihar ederek öldüğü sanılıyor.
Bilgiyi işleyen ve değiştiren bir makine!
Alan Turing (1912 – 1954) bilgisayarı yaratan ilk insandı. Turing aslında matematiksel bir
problemin çözümünü düşünüyordu.Matematikteki probemler basit kurallar dizisi takip
edilerek çözülürse ne olur? Bu da bilgisyaralar hakkında düşünmesini sağladı.
Beklenmedik bir şey oldu ve bilgisayar ortaya çıktı.

Turing’in muhteşem fikri ilk kez 24 yaşındayken 1936 yılında yazdığı günümüzde efsane
“Hesaplanabilir
olan sayılarda karar veren problemlerin uygulanması” 36 sayfalık
isimli yayınlandı. kitapta
Turing bir soru sordu:
• Hesaplama yapan, bir insanın zihninde neler olur?
• Hesaplama yapan kişi için hayati öneme sahip olan şey nedir?
• Hesaplama işleminde insan beyninde anahtar işlev nedir?
Hesaplama işleminde belirli kuralların tekrar edildiğini fark etti. Turing tüm
hesaplamaların
İnsan Gibi Davranma: Turing
Testi
Zekânın tanımlanmasına işlevsel yaklaşım: zeki varlıklardan ayırt edilemezlik üzerine kurulu bir
test. Testi geçecek bilgisayar programının sahip olması gereken yetenekler:
1) Doğal Dil İşleme
2) Bilgi Gösterimi
3) Otomatik Akıl Yürütme
4) Öğrenme
5) Algılama
6) Robotik hareket
Karar Problemi

• Alan Turing’i şimdilerde Turing denilen kuramsa cihazı


tasarlamaya yönelten şey Karar
Makinesi l
Problemidir:
“Her formel sistem (biçimsel dizge) F için; F’deki dilbilgisel
her
olarak doğru dizi
betimlenebilir hakkında
bir formel sistem ‘karar veren’
mümkün olarak
müdür?”
bulmak (Casti & Depauli 2000) sonlu
Turing Testi (Tanım)
• Kriter: Bilgisayar/makine sorduğumuz herhangi bir soruya insanınkinden
edilemeyecek
ayırt yanıtlar veriyorsa gerçekten düşünmektedir.
• Test Düzene ği:
 Bilgisayar, gönüllü bir insanla birlikte sorgulayıcının görüş alanının dışında bir
yere
 saklanır.
Sorgulayıcı, yalnız soru sormak suretiyle, hangisinin bilgisayar olduğunu
saptamaya çalışır.
 Sorgulayıcının soruları, daha önemlisi aldığı yanıtlar, tamamen ses gizlenerek,
yani
ya bir klavye sisteminde yazılarak veya bir ekran gösterilerek verilir.
 Sorgulayıcıya, bu soru/cevap oturumunda elde edilen bilgiler dışında, her iki
 taraf
İnsanhakkında hiçbir bilgiiçtenlikle
denek soruları verilmez.yanıtlar ve kendisinin insan, öteki deneğin
bilgisayar olduğuna dair sorgulayıcıyı ikna etmeye uğraşırken, bilgisayar
‘yalan’ söylemeye programlanmış olduğu için kendisinin insan olduğuna
sorgulayıcıyı inandırmaya çalışır.
Yapay
Zeka
Yapay Zeka Türleri

• Yapay Süper Zeka: Bilimsel yaratıcılık, genel bilgelik ve sosyal


beceriler dahil olmak üzere neredeyse her alanda en iyi insan
beyninden çok daha akıllı bir zeka.

• Yapay Genel Zeka: Yalnızca belirli bir soruna (insan


düzeyinde zeka) değil, herhangi bir soruna zeka uygulama
becerisine sahip bir makine

• Yapay Dar Zeka: Belirli bir görevde insan zekası


veya verimliliğine eşit veya aşan makine zekası
Yapay Zekanın Alt Kümeleri

Artificial Intelligence

Makine Öğrenmesi Machine Learning


is a subset of
Artificial
Intelligence
Deep Deep Learning Derin Öğrenme, insan
Learning is a subset of benzeri karar vermeyi simüle
Machine etmek için sinir ağlarını
Learning kullanır.
Yapay Zeka (1)
• “Yapay Zeka” terimi 1956 yılında Massachusetts Teknoloji
Enstitüsü'nden John McCarthy tarafından oluşturuldu. Bilgisayarların
insan gibi davranmasını amaçlayan bilgisayar biliminin bir dalıdır.
• Yapay Zeka, gerçek yaşam durumlarında karar veren makineler
geliştirmek için, insan dillerini anlamak, etkileşimli oyunlar oynamak için
bilgisayarların programlanmasıdır.
• Bilgisayarları duyusal uyaranları duymak, görmek ve bunlara tepki
vermek üzere programlamak ve insan beynindeki nöronlar (sinir ağları)
arasındaki fiziksel bağlantı türlerini yeniden üretmeye çalışarak insan
zekasını taklit eden sistemler tasarlamak.
• Bilgisayar kontrollü robotik organlar geliştirmek,
Yapay Zeka (2)
• İşini mükemmel yapan canlı sistemlerini ve İnsan beynini model alan yapay zeka
çalışmaları; günlük hayatın farklı alanlarında ürünler vermesinin yanında,
tahmin, sınıflandırma, kümeleme gibi amaçlar için de kullanılmaktadır.
• Uzman sistemler, Genetik algoritmalar, Bulanık mantık, Yapay sinir ağları,
Makine öğrenmesi gibi teknikler, genel olarak yapay zeka teknolojileri olarak
adlandırılmaktadır.
• Genel anlamda yapay zekadan kastedilen; insan zekasının, sinir sistemi, gen
yapısı gibi fizyolojik ve nörolojik yapısının ve doğal olayların modellenerek
makinelere (bilgisayar ve yazılımlara) aktarılmasıdır. Özetle yapay zeka; “insan
gibi düşünen, insan gibi davranan, akılcı (rasyonel) düşünen ve akılcı davranan”
canlıların zekice olarak kabul edilen davranışlarına sahip bilgisayar sistemleridir
ve makine öğrenmesi bu anlamda yapay zekanın evresi olarak kabul
edilmektedir.
Yapay Zeka
(3)
• Yapay zeka araştırmacıları, insan gibi düşünebilen sistemleri
araştırmaya devam ederken, rasyonel karar alan sistemler (Uzman
sistemler) üzerine yoğunlaşan çalışmalar da hız kazanmıştır.
Yapay sinir ağları
• Yapay sinir ağları, insan beyninin bilgiyi nasıl işlediği mantığının
araştırılmasıdır.
• Yapay sinir ağları, biyolojik sinir sistemine benzer nöronlar içerir ve bu
nöronlar çeşitli şekillerde birbirlerine bağlanarak iletişim ağını oluştururlar.
• Bilgisayarın temel matematiğini geliştiren Macar asıllı matematikçi John Von
• Neumann’ın kurduğu
İşlemci ve bellek mimariye
arasında göre bilgisayarın
bilgi iletişim yolları işlemcisi ve belleği
İşlemcinin ayrıdır.
işlem yapma
ile veri iletim yolarının veriyi okuma ve yazma hızları bilgisayarın
vardır. hızı kapasitesini
belirler. Fakat insan beyni bilgisayardan farklıdır ve Von Neumann mimarisi
ile çalışmaz.
• Beynimizdeki nöronlar (10 milyar) ve bağlantı noktaları (Synapses – 10
trilyon)
paralel çalışır. Bu nedenle beyin sürekli öğrenen bir yapıya sahiptir.
Öğendiklerinden karar veren makine
• Bilgisayar donanım ve yazılımların kontrolündeki bir makineye
kendisinden beklenen işlevleri canlılara benzer şekilde yerine getirme
yeteneği kazandırılmasıdır.
• Öğrenerek Karar veren makine çalışmaları genellikle canlıların bir işlevi
yerine getirken geliştirdikleri davranış yöntemleri analiz edilerek,
matematiksel modellerinin geliştirtirilmesine yöneliktir.
• Öğrenen makine araştırmacıları, insan gibi düşünebilen sistemleri
araştırmaya devam ederken, rasyonel karar alan sistemler (Uzman sistemler)
üzerine yoğunlaşan çalışmalar da hız kazanmıştır.
• “Öğrenerek karar veren makine" kavramının fikir babası, "Makineler
düşünebilir mi?" tartışmasını başlatan Alan Mathison Turing'dir. 1943'te II.
Dünya Savaşı sırasında Kripto analizi gereksinimleri ile üretilen elektromekanik
cihazlar sayesinde bilgisayar bilimi ve yapay zekâ kavramları doğmuştur.
Sibernetik yapay zeka
• Sibernetik, karar çıktısının geri bildirim girişi olarak sistemi tetiklemesi esasına
dayanmaktadır. İnsani müdahaleye gerek duymadan, makinenin değişen
durumlara göre kendi kendini düzenleyebilen sistemleri inceleyen bilim
dalıdır.

• Yapay sinir ağları konusundaki çalışmaların Minsky ve Papert'in 1969'da


yayınlanan Perceptrons adlı kitaplarında tek katmanlı algaçların bazı basit
problemleri çözemeyeceğini gösterip aynı kısırlığın çok katmanlı algaçlarda
da beklenilmesi gerektiğini ileri sürdüler.
• Sibernetik akımın görevle ilgili vargıların veya sonuçların bir yargıya
dönüşerek diğer kavramlar ile bir ilişki kurulamamasından kaynaklanan
başarısızlıklar görülmektedir. Bu durum aynı zamanda semantik (anlam
bilimi) süreçlerin de benzeşimlendirilememesi gerçeğini doğurdu.
Uzman sistemler
• Sembolik ve sibernetik zeka konularında yapılan çalışmalarda görülen
başarısızlıklar, her sorunu çözecek genel amaçlı sistemler yerine belirli bir
uzmanlık alanındaki bilgiyle donatılmış programları kullanma fikrinin
gelişmesine sebep oldu ve bu durum yapay zeka alanında yeniden bir
canlanmaya yol açtı.
• Kısa sürede “Uzman sistemler” adı verilen bir metodoloji gelişti. Fakat
burada çok sık rastlanan tipik bir durum, bir otomobilin tamiri için
önerilerde bulunan uzman sistem programının otomobilin ne işe
yaradığından haberi olması gerekliliğidir.
Makine Öğrenmesinin Yapay zeka ile ilişkisi
• Bilimsel bir çaba olarak, makine öğrenmesi yapay zeka arayışından doğdu.
• Akademik bir disiplin olarak AI'nın ilk günlerinde, bazı araştırmacılar makinelerin verilerden
öğrenmesini istiyorlardı. Soruna çeşitli sembolik yöntemlerle ve daha sonra "sinir ağları" olarak
adlandırılan yöntemle yaklaşmaya çalıştılar; bunlar çoğunlukla algılayıcılar ve daha sonra
genelleştirilmiş doğrusal istatistik modellerinin yeniden icadı olarak bulunan diğer modellerdi.
Olasılıksal akıl yürütme, özellikle otomatik tıbbi tanıda da kullanılmıştır.
• Bununla birlikte, mantıksal, bilgiye dayalı yaklaşıma artan vurgu, yapay zeka ve makine
öğrenmesi
arasında bir kaymaya neden oldu.
• Olasılıksal sistemler, veri toplama ve temsil etme ile ilgili teorik ve pratik problemlerle
boğulmuştu. 1980'e gelindiğinde, uzman sistemler yapay zekaya hâkim olmuştu ve istatistikler
kaybolmuştu.
• Yapay zeka içinde sembolik / bilgiye dayalı öğrenme üzerine çalışmalar devam etmiş, bu da
tümevarımsal mantık programlamaya yol açmıştır, ancak daha istatistiksel araştırma çizgisi artık
yapay zekâ alanının dışında, örüntü tanıma ve bilgi edinmede olmuştur.
• Yapay sinir ağları araştırması aynı zamanda yapay zeka ve bilgisayar bilimleri tarafından terk
edilmişti. Bu çizgi de, Hopfield, Rumelhart ve Hinton da dahil olmak üzere diğer disiplinlerden
araştırmacılar tarafından “bağlantıcılık” olarak AI / CS alanının dışında devam etti. Başlıca
başarıları 1980'lerin ortalarında geri yayılımın yeniden keşfedilmesiyle geldi.
Yapay zekâ, makine öğrenmesi, derin öğrenme:
• Yapay zekâ, ister makine öğrenmesi kullansın ister kullanmasın herhangi bir tahmin veya karar işlemini
gerçekleştiren teknolojilerin genel adıdır. Genel kanaatin aksine yapay zekâ makine öğrenmesi veya
derin öğrenme algoritmaları olmaksızın da çalışan bir algoritma olabilir.
• Makine öğrenmesi algoritmaları ortaya çıkana kadar yapay zekâ çalışmaları “hard-coded” olarak
nitelendirilen yani tüm mantıksal ve matematiksel işlemlerin yazılımcı tarafından bizzat kodlandığı bir
yapıya dayanmaktaydı. Örneğin ilk satranç oyuncusu yapay zekâ algoritmaları tamamen böyleydi.
Yapay zekânın bu türü sembolik yapay zekâ olarak adlandırılmaktadır.
• Makine öğrenmesinde algoritmalar tamamen veriden öğrenir. Makine öğrenmesini hard-coded olarak
kodlanmış sembolik yapay zekâ algoritmalarından ayıran özellik algoritmanın tamamen veriden
öğrenmesidir. Doğal olarak akla makine öğrenmesi algoritmalarının verilerden öğrenmesinin riskli
tarafları gelebilir. Sorulara yanıt veren yazılımsal makine öğrenmelerine ahlaksız ve ırkçı söylemler sıkça
sorulursa, günün sonunda yazılımın kendisi sapık ve ırkçı bir karaktere bürünebilmektedir.
• Derin öğrenme modeli, verinin yapısına göre hangi parametrelere ne ağırlık verileceğini kendisi
keşfetmektedir. Derin öğrenme algoritması da veriye dayalı öğrenme gerçekleştirmekle birlikte,
öğrenme süreci standart makine öğrenmesi algoritmalarında olduğu gibi tek bir matematiksel modele
değil sinirsel ağ (neural network) olarak ifade edilen ağ diyagramlarına benzeyen yapıda geliştirilen
hesaplamalarla çalışmaktadır. Her derin öğrenme algoritması bir makine öğrenmesi algoritmasıdır çünkü
verilerden öğrenme gerçekleştirmektedir. Ancak her makine öğrenmesi algoritması derin öğrenme
algoritması değildir; nitekim derin öğrenme, makine öğrenmesinin spesifik bir türüdür.
• .
Yapay Zeka-Makine Öğrenmesi-Derin Öğrenme

YAPAY ZEKA DERİN ÖĞRENME


1950’lerde açığa çıkmış 2010’lu yıllarda
MAKİNE ÖĞRENMESİ
olup, makinaların kullanılmaya başlanmış,
insanlar kadar 1980’lerde açığa çıkmış büyük ile tek bir
kabiliyetli bir şekilde olup veri madenciliğin katmanda değil, birçok
bazı işlemleri kullanılması ile beraber katmanda makine
yapabilmesi olarak daha popüler hale öğreniminde kullanılan
tanımlanabilir. gelmeye başlamıştır. hesapları tek bir
seferde yapma
kabiliyetine sahiptir.
Yapay Zeka
1950’de Alan Turing,
yayınlamış olduğu bir
makalede
makinelerin düşünüp
düşünemediğini
gündeme getirmiştir.

insan zekasının
Ancak yapay zekanın
karakteri olan asıl isim babası 1956
işlemleri
gerçekleştirebile
yılında konu ile ilgili
n makinalar bir akademik
konferans
düzenleyen John
McCarthy’dir.
Yapay Zeka
Katmanları

Sorun
Bilgi Nedensellik Algılama Öğrenme Planlama
çözm
e
Makine öğrenmesi
yapısal işlev olarak öğrenebilen ve veriler
üzerinden tahmin yapabilen
algoritmaların çalışma ve inşalarını
araştıran bir sistemdir.
Denetimli
Öğrenme

Denetimsi
z
Öğrenme
Makine Yarı
öğrenmesi Denetimli
Öğrenme
Takviyeli
Öğrenme

Yoğun
Öğrenme
Makine Öğrenmesi

Veri madenciliği ise


Makine öğrenmesi bilinen verilerdeki (geçmiş)
özelliklere dayanarak bilinmeyen özelliklerin
öğrenilen verilerden keşfedilmesine odaklanır.
yapılan tahminler üzerine Bu veri tabanlarında bilgi
odaklanır. keşfi analizinin bir adımıdır.
Derin öğrenme (deep learning) makine
öğrenmesi
için kullanılan farklı yöntemlerden biridir.

Derin öğrenme yöntemi insan beyninin


öğrenme ve karar verme yöntemlerinden
esinlenerek geliştiriliyor, yani nöronların
hareketleri taklit ediliyor.

Bu da “Yapay Sinir Ağları” (Artificial


Neural Networks) sayesinde oluyor.
Makine Öğrenmesi
Makine Öğrenmesi
• Çok büyük miktarlardaki verinin elle islenmesi ve analizinin yapılması mümkün değildir.
• Amaç geçmisteki verileri kullanarak gelecek için tahminlerde bulunmaktır.
• Bu problemleri çözmek için Makine Öğrenmesi (machine learning) yöntemleri gelistirilmistir.
• Makine öğrenmesi yöntemleri, geçmisteki veriyi kullanarak yeni veri için en uygun modeli
bulmaya çalısır.
• Verinin incelenip, içerisinden ise yarayan bilginin çıkarılmasına da Veri Madenciliği (data
mining)
adı verilir.
• Bilgisayar kontrolündeki bir sistemin ya da cihazın faaliyetlerini insan zekasına benzer şekilde
yerine getirme yeteneği kazandırılması, bilgi yığınından öğrenen zekanın geliştirilmesi ile
mümkün olabilir.
• Diğer bir anlatımla, kendi kendine öğrenen matematiksel modeller ve algoritmalar ile
insandan
bağımsız otonom davranış geliştirmesi ile mümkün olabilir.
Makine Öğrenmesi
• Şu ana kadar robotlar, tüm adımlarda yazılan kodlar ile iş gören makinelerdi.
Dolayısıyla robotlar ve onları kontrol eden bilgisayar sistemleri bilinçli değillerdi.
• Bilinç: Öğrenerek algılama, anlamlandırma, canlandırma yeteneklerinin
zihine kazandırılmasıdır.
• Şu andan itibaren bilgisayaralara öğrenmeyi öğretmeye başladık. Buna da,
makine öğrenmesi dedik.
• Makine öğrenmesi dünyayı değiştirecek mi? Kontrolden çıkıp herşey makinelerin
kontrolü altında mı olacak?
• Makineler iki şekilde öğreniyor: Denetimli (supervised) ve denetimsiz.
• Denetimli öğrenmede bilgisyardan beklediğimiz çıktıyı elde edebilmek için
girdiler veriyoruz. Bu veriler ile ne yapacağının kodunu yazıyoruz. Herbir adımda
herbir komut için detaylı kod yazmak zorundayız. Bilgi
Makine Öğrenmesi
Geniş tanım:
• Verilerdeki kalıpların bir bilgisayar tarafından otomatik keşfi.

• Bu öğrenmektir, çünkü bilgisayara bir başlangıç örüntü tanıma modeli


ve bazı veriler verilir ve modelin nasıl daha iyi hale getirileceğini
çözer.

• Bu makinedir, çünkü bilgisayar insan müdahalesi olmadan otomatik


olarak öğrenir (ilk model ve veri seçimi dışında).
Machine Learning
Machine learning uses data and produces a program to perform a task

Task: Human Activity Detection

Standard Approach Machine Learning App


roach

Computer Machine
Program Learning

Hand Written Program Formula or Equation


model : Inputs --+
If X_acc > 0 .5 Yactivity
then "SITT ING" Outputs
If Y_ ace < 4 and Z_acc >
= P1Xacc + Machine
5 then "STANDING" PzYacc model = < Learning >(sensor_data,
+ P3Zacc + activity)
A lgor·ithrn
Deneyim
Performans
Artırma Karar
verme
How can we
Make it Happen?
What Will Prescriptive
Happen? Analytics

Predictiv
Why did it
e
Happen? Analytics
Valu

Diagnostic
e

What Analytics
Happened ?
Descriptive
Analytics

Difficulty
Classificatio
n
Algorithm

Regression
Algorithm
1Which other customers have similar
preferences to this one? Clusterin
2What are the most common
patterns in gasoline price changes? g
Algorithm

1When will this customer make


another purchase?
Regressio
2How many new followers will I get n
next week? Algorithm

1Will this customer click on the top


link?
Classification
2 Which offer should this customer Algorithm
receive?
Makine öğrenimi ile ilgili disiplinler
• Yapay zeka
• Bayesci yöntemler
• Kontrol teorisi
• Bilgi teorisi
• Hesaplamalı karmaşıklık teorisi
• Felsefe
• Psikoloji ve nörobiyoloji
• İstatistik
• Mühendislik ve iş dünyasında birçok pratik
problem
Makine öğrenmesi (ML) :
• Makine öğrenmesi (ML) deneyim yoluyla otomatik olarak gelişen bilgisayar
algoritmalarının incelenmesidir. Yapay zekanın bir alt kümesi olarak görülür.
• Makine öğrenmesi algoritmalardan oluşur. Açık bir şekilde programlanmadan tahminler veya kararlar
vermek için "öğrenme verileri" olarak bilinen örnek verilere dayalı bir matematiksel model
oluşturulmasıdır. Makine öğrenmesi algoritmaları, gerekli görevleri yerine getirmek için geleneksel
algoritmalar geliştirmenin zor veya mümkün olmadığı filtreleme ve katsayıları değişken fonksiyonların
çok çeşitli uygulamalarında kullanılır.

• Makine öğrenmesi, bilgisayarları kullanarak tahmin yapmaya odaklanan hesaplama


istatistikleriyle yakından ilgilidir.
• Matematiksel optimizasyon çalışması, makine öğrenmesi alanına yöntemler, teori ve uygulama
alanları sağlar. Veri madenciliği, denetimsiz öğrenim yoluyla keşifsel veri analizine odaklanan ilgili bir
çalışma alanıdır. İş problemleri boyunca uyguladığı uygulamalarda, makine öğrenmesi aynı zamanda
tahmine dayalı analitik olarak da adlandırılır.

• Makine öğrenmesi, bilgisayarları açıkça programlanmaksızın görevleri nasıl gerçekleştirebileceklerini


keşfetmeyi içerir. Belirli görevleri yerine getirmeleri için sağlanan verilerden öğrenen algoritmaları içerir.
Atanan basit görevler için, makineyi eldeki sorunu çözmek için gereken tüm adımların nasıl
yürütüleceğini söyleyen algoritmaları programlamak mümkündür; bilgisayar tarafında öğrenmeye gerek
yoktur. Daha gelişmiş görevler için, bir insanın gerekli algoritmaları manuel olarak oluşturması zor
olabilir. Uygulamada, insan programcıların gereken her adımı belirtmesinden ziyade makinenin kendi
algoritmasını geliştirmesine yardımcı olmak daha etkili olabilir.
Makine öğrenmesi (ML) :
• Canlı verilerle uçta makine öğrenimi modellerini çalıştırırken, göz önünde bulundurmanız gereken sadece makine
öğrenimi modeli değildir.
• Her şeyden önce, verileri muhtemelen farklı protokoller ve veri formatları kullanarak makinelerden veya diğer
veri kaynaklarından elde etmeniz gerekir.
• Ardından verileri hazırlamanız gerekir. Canlı bir ortamda, her sensörden bağımsız olarak veri akışı alırsınız, ML
modelleri ise her sensörden belirli bir sırayla veri içeren numuneler bekler. Bunu çözmek için, canlı akışları zamana
göre hizalamanın ve muhtemelen verileri yeniden sıralamanın bir yoluna ihtiyacınız var. Makine öğrenimi
modelinin beklediği örnekleri doldurmak için daha yavaş sensörlerden gelen verilerin tekrarlanması veya
enterpolasyonunun yapılması için farklı frekanslarda veri ileten sensörlere de sahip olabilirsiniz.
• Son olarak, ister yerinde bir makine veya sisteme gönderilmesi gereken bir tetikleyici olsun, ister yerel olarak
veya bulutta bir BT sistemine iletilmesi gereken bazı içgörüler olsun, ML çıkarımının sonuçlarını sunmanız
gerekir..
Makine Öğrenmesinin Veri madenciliği ile ilişkisi
• Makine öğrenmesi ve veri madenciliği genellikle aynı yöntemleri kullanır ve
önemli ölçüde örtüşür, ancak makine öğrenmesi öğrenme verilerinden
öğrenilen bilinen özelliklere dayanarak öngörüye odaklanırken, veri madenciliği
verilerde (önceden) bilinmeyen özelliklerin keşfine odaklanır (bu
veritabanlarında bilgi keşfinin analiz basamağı).
• Veri madenciliği birçok makine öğrenme yöntemi kullanır, ancak farklı hedefleri
vardır; Öte yandan, makine öğrenmesi aynı zamanda veri denetim yöntemlerini
"denetimsiz öğrenme" veya öğrenme doğruluğunu geliştirmek için bir ön
işleme adımı olarak kullanır.
• Makine öğrenmesinde, performans genellikle Bilinen bilgiyi yeniden
üretirken, bilgi keşfi ve veri madenciliği için temel görev önceden bilinmeyen
bilgilerin keşfidir.
• Bilinen bilgilere göre değerlendirildiğinde, bilgisiz (denetimsiz) bir yöntem
diğer denetimli yöntemlerle kolayca daha iyi performans gösterirken, tipik bir
veri madenciliği görevinde denetimli yöntemler öğrenme verilerinin
bulunamaması nedeniyle kullanılamaz.
Makine Öğrenmesinin Optimizasyon ile ilişkisi
• Makine öğrenmesinin de optimizasyon ile yakın bağları vardır: birçok
öğrenme problemi, bir öğrenme seti örneğindeki bazı kayıp işlevlerinin en
aza indirilmesi olarak formüle edilmiştir.
• Kayıp fonksiyonları, eğitilmekte olan modelin tahminleri ile gerçek
problem örnekleri arasındaki tutarsızlığı ifade eder (örneğin,
sınıflandırmada, örneklere bir etiket atamak ister ve modeller, bir dizi
grubun önceden atanmış etiketlerini doğru şekilde tahmin etmek için
eğitilir örnekler).
• İki alan arasındaki fark genelleme amacından kaynaklanmaktadır:
optimizasyon algoritmaları bir öğrenme setindeki kaybı en aza indirirken,
makine öğrenmesi görünmeyen numunelerdeki kaybı en aza indirmekle
ilgilidir.
Makine Öğrenmesinin İstatistiklerle ilişkisi
• Makine öğrenmesi ve istatistikler, yöntemler açısından yakından ilişkili
alanlardır, ancak temel amaçlarında farklıdır: İstatistikler, bir örneklemden
nüfus çıkarımlarını çekerken, makine öğrenmesi genelleştirilebilir tahmin
modelleri bulur. Michael I. Jordan'a göre, metodolojik prensiplerden
teorik araçlara kadar makine öğrenmesi fikirleri istatistiklerde uzun bir
geçmişe sahiptir. Ayrıca, veri bilimi terimini, genel alanı çağırmak için bir
yer tutucu olarak önerdi.

• Leo Breiman iki istatistiksel modelleme paradigmasını ayırt etti: veri modeli
ve algoritmik model, ki burada "algoritmik model", Rastgele orman gibi
makine öğrenme algoritmaları aşağı yukarı.

• Bazı istatistikçiler makine öğrenmesi yöntemlerini benimsemiş ve


istatistiksel öğrenme olarak adlandırdıkları birleşik bir alana yol
açmışlardır.
Neden matematik için endişeleniyorsunuz?

Gerçekten faydalı sonuçlar elde etmek için, belirli genel makine


öğrenimi ilkeleri ve bireysel algoritmaların iç işleyişi hakkında iyi
matematiksel sezgilere ihtiyacınız var.
Sezgiler şunları yapmanıza izin verecektir

• Problem için doğru algoritmaları seçeceksiniz.


• Parametre ayarları, doğrulama stratejileri hakkında iyi seçimler
yapacaksınız.
• Fazla veya yetersiz uyumu tanıyacaksınız.
• Yetersiz / belirsiz sonuçları gidereceksiniz.
• Sonuçlara uygun güven / belirsizlik sınırları koyacaksınız.
• Kodlama algoritmalarında daha iyi bir iş yapacak veya onları
daha
karmaşık hale getireceksiniz.
Makine öğrenimi gerektiren bir göreve klasik bir örnek:
2'yi neye benzetmek çok zor
Öğrenme algoritması kullanılarak çözülen problemler
Kalıpları tanıma:
- Yüz kimlikleri veya yüz ifadeleri
- El yazısı veya sözlü kelimeler
- Tıbbi görüntüler
Kalıp oluşturma:
- Görüntüler veya hareket dizileri oluşturma
Anormallikleri tanımak:
- Olağandışı kredi kartı işlemleri
- Bir nükleer santralde olağandışı sensör okuma kalıpları
Tahmin:
- Gelecekteki hisse senedi fiyatları veya döviz kurları
Örnek Uygulamalar
• İnternette arama
• Hesaplamalı biyoloji
• Finans
• E-ticaret
• Uzay araştırması
• Robotik
• Bilgi çıkarma
• Sosyal ağlar
• Hata ayıklama yazılımı
Makine Öğreniminin Son Teknoloji Uygulamaları
• Otonom Arabalar
• Sosyal Medyada Derin Öğrenme
• Yüz Görüntülerinde Derin İnanç Ağı
• Nesne Parçalarının Öğrenilmesi
• Birden Çok Nesne Üzerinde Eğitim
• Derin Öğrenme ile Sahne Etiketleme
• Derin Öğrenme Modellerinden Çıkarım
• Otomatik Konuşma Tanımada Makine Öğrenimi
• Konuşma Teknolojisinde Derin Öğrenmenin
Etkisi
Makine Öğreniminin Son Teknoloji
Uygulamaları Autonomous Cars •Nevada, Haziran 2011'de otonom
arabaların yollarda kullanılmasını
yasal hale getirdi.
•2013 itibariyle, dört eyalet
(Nevada, Florida, California
ve Michigan) otonom
arabaları yasallaştırdı.
YUz gOrUntUierinde derin Ogren
me
Deep Belief Net on Face
Images
h -.....
,
- - object
models

object parts
(combinatio
n of edges)

edge
s

pixel
Based on s
materials
by Andrew Ng
İki dünyayı birleştirmek

• Veri Bilimi
• Yeni, güçlü, saf veri tabanlı metodolojiler
• Derin teorik anlayış
• Modelleme, Simülasyon, Optimizasyon
• Geleneksel (diferansiyel denklem tabanlı)
metodolojiler
• Mevcut fiziksel veya mühendislik
sistemlerinin karmaşıklığı çok büyük
Machine Learning Problem
Data Data Feature Algorithm Select ion Making
Gathering Preprocessing Engineering & Tra ining Predictions
Collect data from Clean data to Making your Selecting the right Evaluate
various sources have data more useful machine learning model t he
homogeneity model

Data Preprocessing

Is there anything wrong with the data? 100 00

9000
• Missing va lues 6000

4000
• Outliers
2000

• Bad encoding (for text) 20 40 60 80 10 0

• Wrongly-labeled examples

• Biased dat a
• Do I have many more samples of one
class tllan tile rest?

Need to f ix/ remove


data?
Veri
Madenciliği
Veri Madeni
En değerli maden olan altının saflaştırılmasını düşünün.
Madeni arama, miktarını belirleme, damarlarında ilerleme, taşıma,
saflaştırma, işleme, satış.
Gömü peşindeki mezar hırsızlarına dikkat edilmesi gerekir. Mısır’da,
arkeloglar firavun mezarına girdiklerinde yağmalandığını görrdüler. Yapılan
araştırmalar hayret vericiydi. Firavun gömüldüğü anda yağmalanmıştı!
Veri madenciliği
• Veri Madenciliği, büyük miktardaki veri yığını içerisinden desenlerin, ilişkilerin, önemli
bilgilerin keşfedilmesi tekniğidir.
• Kötüye kullanım tespiti ve anormallik tespiti yöntemleri kullanılırken yapay sinir ağları,
bayes ağlar ve KNN gibi sınıflandırma yöntemleri; bölünmeli, çizge tabanlı ve hiyerarşik
demetleme yöntemleri, karar ağaçları ve genetik algoritmalar da mevcuttur. Ayrıca
farklı yöntemlerin birleştirilmesi ile oluşturulan hibrit yöntemler de kullanılmaktadır.
Ağ Güvenliği ve Veri Madenciliği
• Ağ güvenliği, bilgilerin güvenilir bir ortamda bozulmadan iletiminin sağlanması, güvenliğe aykırı durumların
ve saldırıların tespit edilmesi ve ağ içerisindeki araçların çalışmalarının kontrolü işlemlerinin düzenli olarak
gerçekleştirilmesi ile bütünlüğün, gizliliğin ve erişime açıklığın devamlılığının sağlanması olarak
tanımlanmaktadır.
• İnternet veya yerel ağdan gelebilecek, ağdaki sistemlere zarar verebilecek, çeşitli paket ve verilerden oluşan
saldırıları fark etmek üzere tasarlanmış sistemlerdir. Ağ trafiği (ağtemelli) ya da bir bilgisayar sistemi
içerisinde toplanan veriler (sunucu-temelli) incelenerek saldırılar tespit edilmektedirler.
• CERT (Computer Emergency Readiness Team) tarafından yıllara göre rapor edilen saldırı sayıları, her geçen
yıl artışın ciddi boyutlara ulaştığını göstermektedir.

Saldırılar dört temel kategoride toplanmaktadır:


• DOS: Hizmet engelleme.
• R2L: Yönetici hesabı ile yerel oturum açma.
• U2R: Kullanıcı hesabının yönetici hesabı gibi davranmaya çalışması.
• PROBE: Bilgi tarama.
Karar Destek Sistemleri
• Karar Destek Sistemleri, değişik kaynaklardan toplanan bilgilerin
düzenlenerek, karar modellenerek, bilgiler analiz edilerek ve değerlendirme
sonuçlarını karar vericiye sunan bilgisayar tabanlı sistemlerdir.
• Bir karar verici için verilen kararın doğruluğu, onun yeteneklerine, deneyimine
ve bilgi birikimine olduğu kadar sahip olduğu veri kümesinin yeterliliğine de
bağlıdır.
• Kararın başarısında, verilerin doğru depolanması, doğru sınıflanması,
doğru ayıklanıp işlenmesi ve doğru yorumlanması çok önemli bir rol oynar.
• Bu nedenle, veri madenciliği, Karar Destek Sistemleri için etkili araçlardan
biridir.
Veri tabanları
• Veri tabanları: Elde edilen verilerin tutulduğu alanlardır.
• Bir veri tabanı sistemi, birbiri ile ilişkili verilerin birikimini içeren, veriye erişimi sağlayarak veriyi
yönetmeye yardımcı olan yazılım programları kümesidir.
Veri tabanları kullanım amaçlarına göre farklı isimler alır.
• İlişkisel veritabanları, her biri farklı isimler alan tablolardan oluşur. Her tabloda her bir kaydın özelliklerinin
değerlerini tutan alanlar ve her kayda ait bir tekil anahtar bulunur.
• Bir üniversitenin veritabanını ilişkisel veri tabanına örnek olarak verebiliriz. Zira her bir kişi için ayırt edici bir
öğrenci numarası, hangi yılda kayıt yaptırdığı, hangi bölümde okuduğu gibi alanlar ile öğrenciye ait bilgiler
saklanır. Buradan çeşitli sorgular ile hangi bölümde kaç öğrencinin okuduğu, geçtiğimiz yıl kaç kişinin belli
bir bölüme kayıt yaptırdığı gibi soruların cevapları bulunabilir.
• İşlemsel veritabanında her bir kaydın bir işlem olduğu varsayılır. Bir marketin veri tabanını düşünecek
olursak, her an bir satış yapıldığını ve her bir satışın işlemsel veri tabanında bir kayıt olarak göründüğü
varsayılabilir. Bu veritabanından, bugün, ilgilenilen üründen kaç tane satıldığı sorusunun cevabına
ulaşılabilir.
• Zaman serisi veritabanı düzenli zaman aralıkları ile elde edilmiş (yıllık, haftalık, günlük) verilerin tutulduğu
alanlardır. Örnek olarak borsa verilerinin, stok kontrolleri sonucu alınan verilerin, sıcaklık ölçümlerinden
elde edilen verilerin depolanması gösterilebilir.
Veri Ambarları
• Veri Ambarları: “Veri ambarları, tüm operasyonel işlemlerin en alt düzeydeki verilerine kadar inebilen,
etkili analiz yapılabilmesi için özel olarak modellenen ve tarihsel derinliği olan veri depolama sistematiği
olarak tanımlanabilir.”
• Günlük işlemler sonucu, farklı kaynaklardan toplanan veriler, temizleme dönüştürme, birleştirme gibi
işlemlerden geçirilerek, daha önce inşa edilmiş veri ambarının yapısına uygun hale getirilerek veri
ambarına aktarılır. Veri ambarları, üzerinde, verilerin yüklenmesi ve erişimi dışında herhangi bir işlem
yapılmasına izin vermez. Veri ambarları belirli aralıklar ile güncellenirler.
• Mimari açıdan veri ambarları üç farklı şekilde olabilir. İlki, işletmelerin farklı kaynaklardan (işletmenin
kendi işlemsel veritabanı sistemleri ve dış kaynaklar dâhil olmak üzere) aldıkları tüm verilerin tutulduğu
“işletme ambarları”, ikincisi veri üzerinde çalışma yaparak karar alan kişiler için belirli kurallara göre
oluşturulmuş “veri pazarları” , sonuncusu ise işlemsel veri tabanlarının görsel hali olan “ görsel ambarlar”
‟dır.
Veri madenciliğinde kullanılan modeller: tahmin edici ve tanımlayıcı

• Tahmin Edici Modeller : Tahmin edici modellerde, sonuçları bilinen verilerden hareket edilerek bir
model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için sonuç
tahmin edilmesi amaçlanmaktadır.
• Tanımlayıcı Modeller : Tanımlayıcı modellerde, veri kümesinde bulunan gizli örüntülerin (olayların ve
nesnelerin ortaya çıkardığı davranış değişikliklerinin desenleri) tanımlanması amaçlanmaktadır.
Veri Madenciliği Süreci
Veri madenciliği süreci dört aşama ile tanımlanabilir.
• İlk aşamada problem tanımlanarak veri kaynakları değerlendirilir.
• İkinci aşamada veriler kullanıma uygun hale getirilmek için
hazırlanır.
• Arkasından model kurulur ve
• nihai aşamada model değerlendirilerek kullanıma hazır hale getirilir.
Problemin Tanımlanması
Amaç, işletme problemine verileri kullanarak çözüm getirmek olduğundan, ilk olarak ihtiyaç duyulan şey
tam olarak tanımlanmalıdır. Bu problem, işletmenin ayrılmakta olan müşterisinin belirli özelliklerini
tanımlayarak ona uygun davranmak olabildiği gibi, kendi kaynaklarını optimum kullanabilmek için yapacağı
bir planlamada gelecek dönemdeki harcamalarını tahmin etmek şeklinde de olabilir.
“Bu adımda ihtiyaç duyulan şeyin tanımlanması için cevaplanması gereken sorular neyin otomatize
edilmeye değer olduğu ve neyin insan içeren süreçlere bırakılması gerektiği, amacın ne olduğu ve hangi
performans kriterlerinin daha önemli olduğu, sürecin sonucunda elde edilecek çıktının keşif, sınıflandırma,
özetleme gibi şeyler için kullanılıp kullanılmayacağı olabilir.”10
Problemin tanımlanması durumunda ihtiyaç duyulan iş modelinin kalıbı da belirlenmiş olur.
Problemin Tanımlanması
Amaç, işletme problemine verileri kullanarak çözüm getirmek olduğundan, ilk olarak ihtiyaç duyulan şey
tam olarak tanımlanmalıdır. Bu problem, işletmenin ayrılmakta olan müşterisinin belirli özelliklerini
tanımlayarak ona uygun davranmak olabildiği gibi, kendi kaynaklarını optimum kullanabilmek için yapacağı
bir planlamada gelecek dönemdeki harcamalarını tahmin etmek şeklinde de olabilir.
“Bu adımda ihtiyaç duyulan şeyin tanımlanması için cevaplanması gereken sorular neyin otomatize
edilmeye değer olduğu ve neyin insan içeren süreçlere bırakılması gerektiği, amacın ne olduğu ve hangi
performans kriterlerinin daha önemli olduğu, sürecin sonucunda elde edilecek çıktının keşif, sınıflandırma,
özetleme gibi şeyler için kullanılıp kullanılmayacağı olabilir.”
Problemin tanımlanması durumunda ihtiyaç duyulan iş modelinin kalıbı da belirlenmiş olur.
Verilerin
Hazırlanması
Modelin kurulması için gerekli bilgilerin hazırlandığı aşamadır. Öncelikle toplam, maksimum, minimum değer
gibi dağılım ölçüleri; aritmetik ortalama, ağırlıklı ortalama gibi cebirsel ölçüler veya serpilme,dağılma
diyagramı gibi grafiksel öğeler kullanılarak verilerin durumu hakkında bilgi edinilir. Verilerde eksik, hatalı,
gürültülü bilgi olup olmadığı bu şekilde kontrol edilmiş olur. Eksik değerlerde kaydı dikkate almama, global
sabit ile eksik değerleri doldurma, eksik değere o değişkenin ortalama değerini verme, gürültülü değerlerde
regresyon ile belirli fonksiyonel kalıba sokma gibi yöntemler ile verilerdeki sıkıntı giderilebilir.
Farklı kaynaklardan gelen, aynı değişkene ait verilerin tiplerinde, alan isimlerinde uyuşmazlık olması halinde
gerekli değişikliklere gidilerek tüm verileri bir arada tutabilecek yapı oluşturulmalıdır.
Bazı modellerin gereksinimlerini göz önünde bulundurmak açısından farklı dönüşümlere gitmek de veri
hazırlanırken dikkate alınması gereken hususlardan olabilir. Örneğin bazı değişkenlerdeki değerler çok
yüksek ise, bu değerleri normalize ederek, uzaklıklar ile çalışan kümeleme algoritmalarının öğrenme fazını
hızlandırarak modelin oluşturulma aşaması için kolaylık sağlanmalıdır.
Değişken sayısının çok yüksek olduğu, hangi değişkenlerin öneminin daha yüksek olduğuna karar
verilemediği durumlarda faktör analizi, temel bileşenler analizi gibi yöntemler kullanılarak boyut
indirgemeleri yapılmalıdır. Zira bu indirgemeler modele girecek değişken sayısını azaltarak modeli gereksiz
bilgilerden ayıklar ve daha sağlıklı bir sonucun çıkmasına zemin hazırlarlar.
Gerektiğinde kategorik değişkenlerde kategori aralıklarını genişleterek kategori sayısını azaltma veya sürekli
bir değişkeni kategorik hale getirmek de verinin hazırlanmasında dikkat edilmesi gereken unsurlardandır. Çok
kategorili değişkenler duruma göre modelin çalışma süresini ve sürecin performansını olumsuz
etkileyebilmektedir.
Modelin Kurulması
Modelin kurulması aşamasında birçok model denenerek veriyi en iyi temsil eden model seçilir. Verileri
temsil eden en iyi modeli bulabilmek için çok sayıda model kurulmalı, en iyi sonucu alana kadar denemeye
devam edilmelidir.
Modelin kuruluşu, amacımızın ne olduğuna, problemimizi ne şekilde çözmek istediğimize ve sonucun ne
kadar işimize yarar olacağına göre değişebilir. Örneğin görmek istediğimiz gelecek dönemdeki tahmini
ciromuz ise, sürekli bir değişkeni tahmin edeceğimiz doğrusal regresyon modelini; müşterilerimizin
pasifleşme eğiliminde olup olmadıkları ise kategorik bir değişkeni tahmin edeceğimiz sınıflandırma modelleri
olan karar ağaçlarını, yapay sinir ağını veya kategorik değişkenin olasılığını tahmin edeceğimiz lojistik
regresyon modelini, hangi ürünlerimizin diğerlerine oranla daha çok beraber alındığı ise birliktelik analizi,
beraber alınan bu ürünlerin hangi sırayla alındığı, nedensellikleri ise sıralı örüntü algoritmaları kullanılabilir.
Ayrıca müşterilerimizin sahip oldukları alışveriş özelliklerine göre (gelme sıklıkları, uğradıkları mağazalar, satın
aldıkları ürünler vb.) belirli gruplara ayırmak için kümeleme algoritmaları kullanılabilir.
Model kurulurken denetimli veya denetimsiz öğrenmeye göre farklı aşamalar uygulanmaktadır. Örneğin
sınıflandırma algoritmaları kullanılırken tüm veri kümesi öğrenme ve test kümesi olarak ayrılmalı;
modelin verilerden öğrenerek oluşturulması öğrenme kümesi, doğruluğunun kontrolü ise test kümesi ile
gerçekleştirilmelidir.
Kurulan modellerde birbiri ile ilişkili olan veya anlamsız olan değişkenlerin elenmesine dikkat edilmelidir.
Amaç bilgi çıkarımı olduğundan ve birbiri ile ilişkili olan değişkenler bize ekstra bilgi vermediğinden, diğerine
göre daha anlamlı olan değişkeni modele katmak faydamıza olacaktır.
Modelin Değerlendirilmesi
Kurulan modellerin karşılaştırılarak veri kümesini en iyi temsil eden modelin seçildiği aşamadır.
Karşılaştırma için, sınıflayıcının tahmin ettiği sınıfların oranını belirten doğruluk oranı kullanılır. Sınıflayıcının
doğruluk oranının görece yüksek olması, diğer modellere göre veri kümesini daha iyi ifade ettiğini
gösterebilir. Doğruluğun testi için kullanılan geçerlilik yöntemleri basit geçerlilik yöntemi, çapraz geçerlilik
yöntemi, n-katlı geçerlilik yöntemi olarak sıralanabilir.
Basit geçerlilik yönteminde verilerin bir kısmı test verisi olarak ayrılır, kalan kısım üzerinde modelin öğrenimi
gerçekleştirildikten sonra ayrılan kısım üzerinde test işlemi yapılır. “Bir sınıflama modelinde yanlış olarak
sınıflanan olay sayısının, tüm olay sayısına bölünmesi ile hata oranı, doğru olarak sınıflanan olay sayısının
tüm olay sayısına bölünmesi ile doğruluk oranı hesaplanır.”11 Çapraz geçerlilik yöntemi daha az sayıda veri
kümesine sahip olunduğu durumlarda kullanılabilir. Bu yöntemde veri kümesi rastgele seçilerek iki eşit
gruba ayrılır, gruplar sırayla öğrenme ve test kümesi yapılarak elde edilen doğruluk oranlarının ortalaması
kullanılır.
N-katlı geçerlilik yöntemi de çapraz geçerlilik yöntemi gibi küçük veri kümeleri için kullanılmaktadır. Veri
kümesi birden fazla gruba ayrılır, bir tanesi test diğerleri öğrenim için kullanılır. Test kümesi değiştirilerek
doğruluk
oranı hesaplanır ve elde edilen oranların ortalaması kullanılır.
Risk matrisi geçerlilik yöntemlerini görselleştirmek için kullanılabilen bir araç olabilir. Yeni çıkan bir ürünü
piyasaya sürmeden önce belli sayıda kişi ile görüşülerek ürünün tutup tutmayacağı konusunda bir
araştırma yapıldığını ve ürün hakkındaki fikirleri iyi ya da kötü olarak sınıflandırmak istediğimizi düşünelim.
Sonuçta karşılaştıracağımız sınıflandırma algoritmalarının doğruluğunu aşağıdaki şekilde görselleştirebiliriz.
Veri Madenciliğinin Kullanım Alanları
• Bankacılık sektöründe veri madenciliği yoğunlukla kredi sahtekârlıkları tespiti, kredi risklerini
değerlendirme,
karlılık analizi, trend analizi ve müşteri yönetimi içindirektpazarlama kampanyalarında kullanılmaktadır.
• Son tüketiciyedirektulaşan perakende sektörü için veri madenciliği güçlü bir araçtır. Sektördeki firmalar,
müşteri yönetimi için veri toplamayı plastik kartlar aracılığı ile yapabilmekte, müşterilerin her türlü
bilgisini ve alışverişlerini, veri ambarı altyapılarında saklayarak, kişiye özel, hedef kitleli kampanyalar
tasarlayabilmekte; bunun için ise bankalarda olduğu gibi kümeleme yöntemleri kullanarak kişilerin
özelliklerini anlama ve buna göre müşterileri belirlenen yaşam tarzlarına atama veya değerine göre
segmentlere ayırma, mağazalara uğrama sıklıklarına göre skorlama, sınıflandırma algoritmaları, regresyon
gibi yöntemler ile müşteri ömrünü belirleme, pasifleşme eğilimi olanları tahminleme, müşterilerin geri
dönüşlerinin belirlenmesi veya beraber alınan ürünleri yakalamak için birliktelik tespiti gibi çok çeşitli
analizler kullanılabilmektedir.
Veri Madenciliğinin Kullanım Alanları
• Telekomünikasyon sektörü zaman içerisinde hizmet içeriğini farklılaştırarak sadece yerel ve uzun mesafeli
telefon hizmeti sunmaktan çıkmış, fax, internet erişimi yolu ile veri transferi, cep telefonu ve bunun gibi
diğer veri trafiklerinin alt yapısını sağlayan bir sektör haline dönüşmüştür.” Bundan başka,
telekomünikasyon sektörünün bazı ülkelerde yeniden düzenlenmesi, yeni bilgisayarların ve iletişim
teknolojilerinin gelişmesi ile birlikte sektör daha da hızlı bir şekilde büyümekte ve rekabetçi bir hale
gelmektedir. 14 Bu noktada veri madenciliği iş içeriğini anlamak, iletişim desenlerini tanımlayabilmek,
sahtekârlıkları yakalayabilmek, veri kaynaklarını daha iyi kullanabilmek ve hizmet kalitesini arttırabilmek
açısından önem kazanmıştır.
Veri Madenciliğinde Kullanılan Yazılımlar
• Enterprise Miner
• SAS
• Clementine çözümü
• SPSS
• Intelligent Miner,
• Viscovery,
• Unica,
• Angoss Knowledge
Seeker
Makine Öğrenimi
Gerekli Alanlar
Makine öğrenimi için gerekli matematik alanları
• Makine öğrenimi hem istatistiğin hem de bilgisayar biliminin bir
parçasıdır
- Olasılık
- İstatiksel
veri
analizi
- Doğrulam
a
- Hata
tahminleri
, güven
aralıkları
• Doğrusal
cebir
- Veriler
Veri konuları
• Öznitelik türleri
• Veri kümesi türleri
• Veri kalitesi sorunları
• Ön işleme
• Dönüşümler
• Özet istatistikler
• Görselleştirme
Veri konuları
• Kayıt
- Veri matrisi
- Belge verileri
- Işlem verileri
• Grafik
- Dünya çapında Ağ
- Moleküler yapılar
• Sipariş verilmesi
- Konumsal
veriler
- Zamansal
(zaman serisi)
verileri
- Sıralı veriler
- Genetik dizi
verileri
Sınıflandırma teknikleri
Basic Concepts, Decision Trees, and Model
Evaluation
• Karar ağaçları • Decision trees
• Kural tabanlı yöntemler • Rule-based methods
• Lojistik regresyon • Logistic regression
• Diskriminant analizi • Discriminant analysis
• k-En yakın komşu (örnek tabanlı • k-Nearest neighbor (instance-based
öğrenme) learning)
• Bayes Yaklaşımı • Bayes
• Nöral ağlar • Neural networks
• Vektör makineleri desteklemek • Support vector machines
• Bayes tahmin ağları • Bayesian belief networks
Öznitelik
Vektörü
Öznitelik (makine öğrenmesi)
• Makine öğrenmesi ve örüntü tanıma alanlarında, gözlemlenen bir olgunun ölçülebilir bir niteliğine özellik
(ya da öznitelik) denir. Anlaşılır, ayırt edici ve bağımsız özellikler seçmek etkili örüntü tanıma,
sınıflandırma ve regresyon algoritmaları için kritik bir adımdır. Özellikler genellikle sayısaldır ancak
sentaktik örüntü analizinde kelimeler ve çizgeler de kullanılır.
• Bir sayısal öznitelikler kümesinin tanımlanması için öznitelik vektörü kullanılabilir. Bir öznitelik
vektörü kullanılarak iki ihtimalli sınıflandırma yapılması öznitelik vektörü ve bir ağırlıklar vektörünün
skaler çarpımının alınması ve çarpım sonucunun bir eşik değeri ile karşılaştırılması ile mümkün olur.
• Bir öznitelikler vektörü kullanılarak yapılan sınıflandırma algoritmalarından bazıları en yakın
komşu sınıflandırması, yapay sinir ağları ve Bayes yaklaşımlarıdır.
• Makine öğreniminde ve örüntü tanımada bir özellik, gözlemlenen bir olgunun bireysel ölçülebilir bir
özelliği veya karakteristiğidir. Bilgilendirici, ayırt edici ve bağımsız özellikler seçmek, örüntü tanıma,
sınıflandırma ve regresyonda etkili algoritmalar için çok önemli bir adımdır. Özellikler genellikle sayısaldır,
ancak dizeler ve grafikler gibi yapısal özellikler sözdizimsel örüntü tanımada kullanılır. "Özellik" kavramı,
doğrusal regresyon gibi istatistiksel tekniklerde kullanılan açıklayıcı değişkenle ilgilidir.
Öznitelikler

• Ortalama ve Toplam
• Markov Katsayıları
• Varyans ve Standart Sapma
• Entropi
• Etkinlik
• Varyans
• Basıklık (Kurtosis)
• Çarpıklık (Skewness) • Frekans Bandları
• Polinom Uydurma • Genlik Değerleri
• Willison Genliği • Filtreleme
• Sıfır Geçiş Sayısı Yöntemleri
• Min. ve Max. Noktalar
Varyans - Standart Sapma

• Aritmetik Ortalama: Alınan örnekleme değerlerinden bir ya da iki tanesi çok yüksek ya da
düşük olursa aritmetik ortalama davranışın eğilimini yansıtmaz.
• Varyans - Standart Sapma: Standart sapma, değerlerin aritmetik ortalamasından kaynaklanan
kök ortalama karesi (RMS) sapmasıdır. Olasılık ve istatistikte, bir olasılık dağılımının standart
sapması, rasgele değişken veya popülasyon veya değerlerin yayılmasının bir ölçüsüdür.
Genellikle σ harfi ile belirtilir (küçük harf sigma). Standat sapma, varyansın karekökü olarak
tanımlanır. Varyans, veriler ile aritmetik ortalama farklarının karlerinin toplamıdır. Ölçülen
verilerin ortalamaya yayılmasını ölçer. Standart sapma, aritmetik ortalamadan olan sapmayı
verir.
• Veri değerleri aritmetik ortalamaya yakınsa, standart sapma küçüktür. Ayrıca, birçok veri
noktası ortalamanın uzağındaysa, standart sapma büyüktür. Tüm veri değerleri eşitse, standart
sapma sıfırdır.
• Bir veri dağılımındaki değişimin önemli bir ölçüsü varyanstır. Varyansın karekökü alınarak
standart
sapma elde edilir.
• Standart sapma dizideki herbir değerin aritmetik ortalamaya yakınlığını gösterir. Standart
sapmanın küçük olması ortalamalarda sapmaların ve riskin az olduğunu, standart sapmanın
büyük olması ortalamalarda sapmaların ve riskin çok olduğunu gösterir.
Öznitelik (makine öğrenmesi)
• Makine öğrenmesi ve örüntü tanıma alanlarında, gözlemlenen bir olgunun ölçülebilir bir niteliğine özellik
(ya da öznitelik) denir. Veri yığınından anlaşılır, ayırt edici ve bağımsız özellikler seçmek etkili örüntü
tanıma, sınıflandırma ve regresyon algoritmaları için kritik bir adımdır. Özellikler genellikle sayısaldır ancak
sentaktik örüntü analizinde kelimeler ve çizgeler de kullanılır.

• İşlenmemiş öznitelikler kümesi gereksiz öğeler içerebilir ve büyüklüğünden ötürü yönetilmesi zor olabilir.
Bu yüzden, makine öğrenmesi ve örüntü tanıma uygulamalarından çoğu özniteliklerin bir alt
kümesinin seçilmesini ya da yeni ve indirgenmiş bir öznitelikler kümesinin oluşturulmasını içerir.
Kullanılacak özniteliklerin öğrenmeyi kolaylaştırması, genelliği ve yorumlanabilirliği artırması
amaçlanır.

• Özniteliklerin çıkarılması ya da seçilmesi öznitelik mühendisliği olarak adlandırılır. Birçok farklı


ihtimalin deneylenmesi ve hazır yöntemler ile bir alan uzmanının önsezilerinin bir araya getirilmesini
gerektirir.
Öznitelik (makine öğrenmesi)
• Girdi verileri kullanılarak yeni türetilmiş değerler çıkarılma işlemidir.
• Bir sınıflandırıcının başarısı özniteliklerin doğru çıkartımı ve seçilimi ile doğru orantılıdır.
• Modele verilecek öznitelik sayısı yani boyut fazlalığı oluşmuş ise bu durum modelin işini zorlaştırır.
• İşe yaramayan öznitelikler ayıklanmalıdır.
• Ne kadar çok öznitelik var ise o kadar çok eğitim süresi ve işlem yükü oluşturur. Bu nedenle öznitelik
seçme ve azaltma yöntemleri kullanılmalıdır.
Öznitelik (makine öğrenmesi)
• Genelde gerçek dünya problemlerinde veriler ön işlem, öznitelik çıkarma, öznitelik şeçme veya azaltma
ve sınıflandırma işlemlerinden sırasıyla geçer.
• Öznitelik çıkarma işlemi genelde veriye ait olan alanla ilgili uzman kişiler tarafından çıkartılır.
• Böyle bir uzman yok ise klasik makina öğrenmesinde PCA, LDA, CCA ve otomatik kodlayıcılar gibi
yöntemler uygulanır. Bu da Feature Extraction kısmının uzman kişiler tarafından yapılması manasına
geliyor.
• Derin öğrenme yöntemleri denince akla ilk gelen CNN de ise öz nitelik şeçme ve öznitelik çıkarma işlemi
için
konvolüsyon katmaları kullanılır.
• Makina öğrenmesinde öz nitelik çıkarımı için matematiksel ve istatistiki bir sürü yöntem kullanırken
derin öğrenme konvolüsyon ilginç ve başarılı bir şekilde öznitelik şeçme ve çıkarma işlemini kendisi
yapmış olur.
• Elimizde resimlerden insan yüzlerini tespit eden bir problem olsun. Eğer biz bu problemi makine
öğrenimi ile çözecek olsaydık insan yüzünün tüm belirgin özelliklerini sisteme tanımlamamız gerekecekti.
Derin öğrenmede ise yüzleri belirleyen öznitelikleri algoritma kendisi bulacaktır. Derin öğrenmenin güçü
işte tamda burdan geliyor.
Makine Öğrenmesi
Types of Learning
Denetimli Öğrenme
• Etiketler sağlanmıştır, güçlü bir öğrenme sinyali vardır.
• Örneğin. sınıflandırma, regresyon.

Denetimsiz öğrenme
• Doğrudan öğrenme sinyali yoktur. Biz sadece veride yapı bulmaya çalışıyoruz.
• Örneğin. kümeleme, boyutluluk azaltma.

Yarı denetimli Öğrenme


• Verilerin yalnızca bir kısmının etiketleri vardır.
• Örneğin. büyüyen bir çocuk.

Pekiştirmeli öğrenme
• Öğrenme sinyali (skaler) bir ödüldür ve bir gecikmeyle gelebilir.
• Örneğin. labirentte bir fare, satranç oynamayı öğrenmeye çalışıyor.
Classificatio
n
Algorithm

Regressio
n
Algorithm

Clustering
Algorithm
Öğrenme
• Denetimli Öğrenme : “Örnekten öğrenme olarak da isimlendirilen denetimli öğrenimde, analizi yapan kişiler
tarafından ilgili sınıflar önceden belirlenen bir kritere göre ayrılarak, her sınıf için çeşitli örnekler verilir.
Sistemin amacı, verilen örneklerden hareket ederek her bir sınıfa ilişkin özelliklerin bulunması ve bu
özelliklerin belirli kural cümleleri ile ifade edilmesidir.” Bu amaçla, bütün veri kümesinden bir öğrenme
kümesi ayrılır ve model bu küme üzerinden kurulur. Ayrılan test kümesi ile de doğruluğu araştırılır. Modelin
doğruluğu yeterli görülüp kullanılmak istendiği takdirde yeni gelen örneklere model uygulanır ve o
örneklerin hangi sınıfa ait olduğunu kullanılan model belirler. Denetimli öğrenme sürecinin işlediği
tekniklere karar ağaçlarını örnek verebiliriz.
• Denetimsiz Öğrenme : Denetimsiz öğrenmede sınıflar önceden belirli olmayıp, veri kümesindeki
verilerin özelliklerine göre sınıfların oluşturulması söz konusu olmaktadır. Denetimsiz öğrenme sürecinin
işlediği tekniklere kümeleme tekniklerini örnek verebiliriz.
Machine learning structure

• Supervised learning
Karar Komutları:
• If then else
• For
• Switch Case
• While
• Do while
Algorithms

• Makine öğrenimi sisteminin başarısı aynı zamanda algoritmalara da


bağlıdır.

• Algoritmalar, bilgi yapılarını bulmak ve inşa etmek için aramayı kontrol


eder.

• Öğrenme algoritmaları, eğitim örneklerinden faydalı bilgiler çıkarmalıdır.


Algorithms

• Supervised learning:
• Prediction
• Classification (discrete labels), Regression (real
values)
• Unsupervised learning:
• Clustering
• Probability distribution estimation
• Finding association (in features)
• Dimension reduction
• Semi-supervised learning
• Reinforcement learning
• Decision making (robot, chess machine)
Machine Learning Approaches
• Denetimli (endüktif) öğrenme
- Verilen: eğitim verileri + istenen çıktılar (etiketler)
- Etiketli bir eğitim seti ile öğrenme
- Örnek: etiketli e-postalardan oluşan eğitim setine sahip e-posta spam
algılayıcısı
• Denetimsiz öğrenme
- Verilen: eğitim verileri (istenen çıktılar olmadan)
- Etiketsiz verilerdeki kalıpları keşfetme
- Örnek: benzer belgeleri metin içeriğine göre kümeleme
• Yarı denetimli öğrenim
- Verilen: eğitim verileri + istenen birkaç çıktı
• Pekiştirmeli öğrenme
- Bir dizi eylemden elde edilen ödüller
- geri bildirime veya ödüle dayalı öğrenme
- Örnek: Kazanarak veya kaybederek satranç oynamayı öğrenin
Machine learning structure

• Unsupervised learning
Denetimli Öğrenme
• Denetimli öğenmede bilgisyardan beklediğimiz çıktıyı elde edebilmek için
girdiler veriyoruz. Bu veriler ile ne yapacağının kodunu yazıyoruz. Herbir
adımda herbir komut için detaylı kod yazmak zorundayız.
• Bilgisayara nasıl anlamlandıracağı öğretiliyor. Matemetiksel
modeller geliştiriyoruz. Algoritmalar yazıyoruz.
• Bilgisayar sistemleri ya da bilgisayarların kontrol ettiği makineler yazılan
kodlar ile çok kaleteli, hızlı, güvenilir işler yapabilirler.
Gözetimli Öğrenme

• Kayıp fonksiyonu, bayır


inişi, olabilirlik
• Lineer modeller, Destek
Vektör Makineleri, üretici
öğrenme
• TAğaç temelli ve topluluk
yöntemleri, k-NN, öğrenme
teorisi
Supervised learning categories and techniques

• Linear classifier (numerical functions)


• Parametric (Probabilistic functions)
• Naïve Bayes, Gaussian discriminant analysis (GDA), Hidden Markov models
(HMM),
Probabilistic graphical models
• Non-parametric (Instance-based functions)
• K-nearest neighbors, Kernel regression, Kernel density estimation, Local regression
• Non-metric (Symbolic functions)
• Classification and regression tree (CART), decision tree
• Aggregation
• Bagging (bootstrap + aggregation), Adaboost, Random forest
Learning techniques

• Linear classifier

, where w is an d-dim vector (learned)

• Techniques:
• Perceptron
• Logistic regression
• Support vector machine (SVM)
• Ada-line
• Multi-layer perceptron (MLP)
Learning techniques

• Non-linear case

• Support vector machine (SVM):


• Linear to nonlinear: Feature transform and kernel
function
Denetimsiz Öğrenme
• Denetimli öğenmede girdiler ve çıktılar vardı. Bilgisayar, talimatlara
uygun
çıktılar üretmektedir.
• Denetimsiz öğrenmede veri yığını var.
• Gelecekte bilgi güç olacaktır.
• Yazılır, kodlardan elde edilen talimatlar ile bilgisayar yığındaki verileri
sınıflandırılacak. Yani karşılaştıracak, etiketliyecek.
• Sonrasında analiz edecek, Optimize yapacak, karar vermesi için olasılık
hesaplamaları yapacak. Ve karar verecek.
• Yüksek doğruluk oranında tahminde nasıl bulunacak?
Unsupervised learning categories and techniques

• Clustering
• K-means clustering
• Spectral clustering
• Density Estimation
• Gaussian mixture model (GMM)
• Graphical models
• Dimensionality reduction
• Principal component analysis (PCA)
• Factor analysis

You might also like