Derin öğrenme
Makine öğrenmesi ve veri madenciliği |
---|
Yapay zekâ |
---|
dizisinin bir parçası |
Derin öğrenme (aynı zamanda derin yapılandırılmış öğrenme, hiyerarşik öğrenme ya da derin makine öğrenmesi) bir veya daha fazla gizli katman içeren yapay sinir ağları ve benzeri makine öğrenme algoritmalarını kapsayan çalışma alanıdır.
Yani en az bir adet yapay sinir ağının (YSA) kullanıldığı ve birçok algoritma ile, bilgisayarın eldeki verilerden yeni veriler elde etmesidir.
Derin öğrenme gözetimli, yarı gözetimli veya gözetimsiz olarak gerçekleştirilebilir.[1] Derin yapay sinir ağları pekiştirmeli öğrenme yaklaşımıyla da başarılı sonuçlar vermiştir.[2] Yapay sinir ağları, biyolojik sistemlerdeki bilgi işleme ve dağıtılmış iletişim düğümlerinden esinlenilmiştir. Yapay sinir ağlarının biyolojik beyinlerden çeşitli farklılıkları vardır. Özellikle, sinir ağları statik ve sembolik olma eğilimindeyken, çoğu canlı organizmanın biyolojik beyni dinamik(plastik) ve analogtur.[3][4][5]
Tarihçe
[değiştir | kaynağı değiştir]Derin öğrenme kavramı, 1940'lardan beri geliştirilen sinir ağlarına dayanmaktadır. 1980'ler ve 1990'lar boyunca, araştırmacılar geri yayılım (backpropagation) ve destek vektör makineleri gibi daha gelişmiş tekniklerle sinir ağları üzerinde çalıştılar. 2000'lerde, büyük miktarda etiketli verinin ve daha güçlü donanımların kullanılabilir hale gelmesiyle, derin öğrenme alanında büyük ilerlemeler kaydedildi. Bu dönemde, yapay sinir ağları ve derin öğrenme, tanıma ve sınıflandırma görevlerinde insan seviyesinde performans sergilemeye başladı.[6]
Derin Öğrenme Modelleri ve Teknikleri
[değiştir | kaynağı değiştir]Derin öğrenme modelleri, farklı yapı ve işlevlere sahip çeşitli sinir ağlarından oluşur. Başlıca derin öğrenme modelleri şunlardır:[7]
- Yapay Sinir Ağları (ANN)
- Evrişimli Sinir Ağları (CNN)
- Tekrarlayan Sinir Ağları (RNN)
- Uzun Kısa Vadeli Bellek (LSTM)
- Generative Adversarial Networks (GAN)
Derin öğrenme algoritmaları, büyük veri kümesi üzerinde eğitilerek başarılı tahminler yapabilirler. Bu süreçte sıkça kullanılan teknikler şunlardır:
- Geri yayılım (Backpropagation)
- Aktivasyon fonksiyonları
- Dropout ve düzenlileştirme (Regularization)
- Stokastik Gradyan İnişi (SGD)
- Adam optimizasyonu
Uygulama Alanları
[değiştir | kaynağı değiştir]Derin öğrenme, bilgisayarlı görü ve ses tanıma, doğal dil işleme, tıbbi görüntü analizi ve oyun stratejileri gibi çeşitli alanlarda başarıyla kullanılmaktadır. Ayrıca, otomotiv, eğlence, finans ve sağlık gibi sektörlerde önemli rol oynar.[7]
Örnek kullanım alanları:[8]
- Yüz tanıma sistemleri,
- Ses tanıma sistemleri,
- Araçlarda otopilot özelliği ve sürücüsüz kendi kendine giden araçlar,
- Alarm sistemleri, (kamera kayıtlarını sürekli kontrol etmek yerine, yalnızca olağandışı hareketlerde alarm sisteminin devreye girmesi gibi teknolojiler derin öğrenme sayesinde mümkün olmaktadır.)
- Sağlık sektöründe kanser araştırmaları, (Kanserli hücre örneklerinin tanıtıldığı derin öğrenme algoritmaları, yeni hücrelerin kanserli olup olmadığı tanısını koymakta hem daha hızlı hem de daha başarılı oluyor.)
- Görüntü iyileştirilmeleri,
- Tavsiye sistemleri (örneğin beğenilebilecek ürün, müzik ve film önerileri sunmada)
- Siber tehdit analizleri
Kaynakça
[değiştir | kaynağı değiştir]- ^ Bengio, Yoshua; LeCun, Yann; Hinton, Geoffrey (2015). "Deep Learning". Nature. 521 (7553). ss. 436-444. Bibcode:2015Natur.521..436L. doi:10.1038/nature14539.
- ^ Francois-Lavet, Vincent (2018). "An Introduction to Deep Reinforcement Learning". Foundations and Trends in Machine Learning. 11 (3–4). ss. 219-354. doi:10.1561/2200000071. 11 Temmuz 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Temmuz 2019.
- ^ Marblestone, Adam H.; Wayne, Greg; Kording, Konrad P. (2016). "Toward an Integration of Deep Learning and Neuroscience". Frontiers in Computational Neuroscience. 10: 94. arXiv:1606.03813. Bibcode:2016arXiv160603813M. doi:10.3389/fncom.2016.00094. PMC 5021692. PMID 27683554. S2CID 1994856.
- ^ Olshausen, B. A. (1996). "Emergence of simple-cell receptive field properties by learning a sparse code for natural images". Nature. 381 (6583): 607–609. Bibcode:1996Natur.381..607O. doi:10.1038/381607a0. PMID 8637596. S2CID 4358477.
- ^ Bengio, Yoshua; Lee, Dong-Hyun; Bornschein, Jorg; Mesnard, Thomas; Lin, Zhouhan (13 February 2015). "Towards Biologically Plausible Deep Learning". arXiv:1502.04156 [cs.LG].
- ^ Alom, Md Zahangir; Taha, Tarek M.; Yakopcic, Christopher; Westberg, Stefan; Sidike, Paheding; Nasrin, Mst Shamima; Van Esesn, Brian C.; Awwal, Abdul A. S.; Asari, Vijayan K. (12 Eylül 2018). "The History Began from AlexNet: A Comprehensive Survey on Deep Learning Approaches". arXiv:1803.01164 [cs]. 8 Nisan 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2023.
- ^ a b "What Is Deep Learning? | How It Works, Techniques & Applications". www.mathworks.com (İngilizce). 14 Nisan 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2023.
- ^ Beyaznet. "Derin Öğrenme (Deep Learning) Nedir?". www.beyaz.net. 28 Mayıs 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ağustos 2023.