10 adımda makine öğrenmesi

CRM.İstanbul 21/11/2018

Makine Öğrenmesi Nedir?

Her konuda öğrenimi kolaylaştıran makine öğrenmesi yapay zekanın bir alt alanıdır. Bilgisayar bilimleri ve matematik mühendisliği alanlarında uzmanlık gerektirir. Makine öğrenmesi, matematiksel ve istatistiksel yöntemler ile bilgisayar bilimleri ve matematik mühendisliğinden faydalanarak, mevcut verileri analiz eden ve bu verilerden anlamlı çıkarımlar sunabilen modelleme ve algoritmalardan oluşur. Bu çıkarımlar ile bilinmeyene yönelik tahminler de sunabilen makine öğrenmesi, hali hazırda elde olan veriler ile gerçekleştirilir.

Makine öğrenme modelleri çok dar tanımlanmıştır. Makine öğrenme teknikleri tarafından sunulan fırsatlar ise sınırsızdır. Modeller bilinen bir problemi, probleme ait ortamdan edilen veriye göre modelleyen çeşitli yaklaşım ve algoritmalardan oluşur. Makine öğrenmesi modelleri bir olayı veya bir sayıyı öngörerek, çok özel tahminlerde bulunabilir, bir soruyu yanıtlayabilir ve yapay zeka çözümlerine önemli girdiler sunabilirler.

10 adımda makine öğrenmesi

Makine Öğrenmesinin Tarihçesi

Makine öğrenme sistemleri yeni olarak düşünülse de, kökenleri İkinci Dünya Savaşına, 1950’lere uzanır. 1950’de Alan Turing, Turing Testini bilgisayarın bir insanı geçip geçmeyeceğini görmek için tasarladı. Reading Üniversitesi’nde Eugene adında bir chatbot, Turing testini geçti. Böylece öğrenme kabiliyetine sahip ilk sinir ağları 1950 yıllarında inşa edilmiş oldu.

1967’de K-en yakın komşuları algoritması (KNN) makine öğrenmesi oluşturuldu. Araştırmacılar 1980 ve 1990’larda beynimizin yapısından esinlenerek bir tür makine öğrenme modeli olan yapay sinir ağlarını eğitmek için yeni bir algoritma sınıfı daha oluşturdu.

1950’li dönemlerden bu yana yapay zeka teknolojilerinde hızlı bir ilerleme görülemedi. Zaman geçtikçe, gelişen bilgisayarlar ile birlikte yapay zeka teknolojileri de gelişti. Son yirmi yılda veri kullanılabilirliği bin kata, temel algoritmaların gelişmişlik seviyesi yüz kata ve donanım hızı en az yüz kata kadar arttı. Günümüzde veri miktarındaki artış, çok geliştirilmiş algoritmalar ve daha güçlü bilgisayar donanımları yapay zeka teknolojilerinin önünü epey açtı.

Makine öğrenmesi algoritmaları genellikle üç şekilde sınıflandırılır.

-Gözetimli Öğrenme(Supervised Learning)
-Gözetimsiz Öğrenme (Unsupervised Learning)
-Takviyeli Öğrenme (Reinforcement Learning)

Gözetimli Öğrenme (Supervised Learning)

Bu sınıftaki algoritmalar, öğrendiklerinden yola çıkarak tahminleme yapmak için etiketli (labeled) verileri kullanır. Yani eğitimde kullanılacak veri ve veriye ait sınıflar (kategoriler/etiketler) önceden bilinir. Bu bilgi ile sistem öğrenir ve yeni gelen datayı bu öğrendikleriyle yorumlar.

Gözetimli Öğrenme yöntemleri iki grupta incelenir

– Sınıflandırma Yöntemi (Classification Method)
– Regresyon Yöntemi (Regression Method)

10 adımda makine öğrenmesi

SınıflandırmaYöntemi (Classification Method)

Sınıflandırma problemi için geliştirilen algoritmalar, adından da anlaşılacağı üzere verileri belli özelliklerine göre sınıflandırırlar. Sınıflandırma yapısal (structure) veya yapısal olmayan (unstructure) veriler üzerinde yapılabilir. Eğer sistem, hangi verinin, hangi koşullarda, hangi sınıfa ait olacağı bilgisi ile sınıflandırılarak eğitilirse, yeni veri setindeki veriyi de öğrendiklerine benzer biçimde sınıflandırabilir.

Sınıflandırma Yöntemleri de aşağıdaki gibi kategorize edilir;

–Binary Classification (İkili Sınıflandırma): İki olası sonuç ile sınıflandırma. Örn: Cinsiyet sınıflandırması (Erkek / Kadın)

–Multi Class Classification (Çoklu Sınıf Sınıflandırma): İkiden fazla sınıfı sınıflandırma. Bir sınıfa ait birden fazla farklı veri varsa bu farklı veriler tespit edilir ve her biri tek bir etikete atanır. Örn: Bir hayvan sınıfında kedi ya da köpek olabilir ancak ikisi birlikte bir sınıfta olamaz kendi içinde sınıflara bölünmelidir.

–Multi Label Classification (Çoklu Etiket Sınıflandırma): Bir veri birden fazla sınıfla ilişkilendirilebilir. Örn: Bir makale hem sağlık hem spor hem de insan ile ilgili olabilir.

Regresyon Yöntemi (Regression Method)

Diğer gözetimli öğrenme yöntemlerinden biri de Regresyon Yöntemidir. Regresyon problemleri, üretilen çıktının sürekli sayılardan oluştuğu durumlar için kullanılıyor.
Mesela bir çalışanın işe geldiği gün sayısı, gün içinde ürettiği ürün adedine göre ona sayısal bir verimlilik puanı oluşturmak isterseniz regresyon algoritmalarını kullanabilirsiniz.

10 adımda makine öğrenmesi

Gözetimsiz Öğrenme(Unsupervised Learning)

Gözetimli öğrenme yönteminin aksine herhangi bir kategorize edilmiş, etiketlenmiş eğitim verisi kullanılarak eğitilmez. Gözetimsiz öğrenme yöntemi, önceden eğitilmemiş veriler üzerinde çalışarak veriler arasında bağıntılar bulup birbirine yakın anlamda/içerikte/değerde olan verilerin kendi içinde kümelenmesi mantığıyda çalışır.

Girdi verisinin hangi sınıfa ait olduğu önceden bilinmez. Bu sınıflandırma işlemleri veriye bakılarak algoritmalar tarafından öğrenilir. Yeni gelen veriler de algoritmanın oluşturduğu gruplara uygun olarak en yakın gruba atanır.

Gözetimsiz öğrenme yöntemleri genelde üç başlık altında incelenir;

-Kümeleme (Clustering)
-Birliktelik Kuralı (Association Rule Mining)
–Boyut Azaltma (Dimensionality Reduction)

Kümeleme (Clustering)

Kümeleme yöntemi, veri setindeki her bir verinin birbirlerine benzerlik durumlarına göre gruplara ayrılması işlemine denir. Her bir grup birer küme anlamına gelir. Her kümede birbirine en yakın veriler olmalı ve birbiriyle benzerlik göstermeyen veriler de mümkün olduğunca farklı kümelerde olmalıdır yani kümeler arası benzerliğin az olması gerekmektedir.

Birliktelik Kuralı (Association Rule Mining)

Bu kural kümeleme yönteminden farklı olarak değişkenler arası ilginç ilişkileri keşfetmek için kurallar arayan bir yöntemdir. Veri seti içindeki geçmiş tarihli hareketlerin örüntülerini analiz eden ve birlikte gerçekleşme durumlarını çözümleyen veri madenciliği yöntemidir. Bu örüntülerden hareketle gelecekteki veriler için tahminleme yapabilir.

Boyut Azaltma (Dimensionality Reduction)

Boyut azaltma, amaç doğrultusunda en iyi sonucu verecek olan öznitelikler(feature) ile çalışmak için kullanışsız, gereksiz olan öznitelikleri çıkartmak, veri boyutunu azaltmak olarak nitelendirilebilir.

Öznitelik (feature): Veriye ait her bir özelliğe verilen isimdir. (Örneğin: ad, soyad, yaş, doğum yeri, kan grubu vs. bilgileri)

10 adımda makine öğrenmesi

Takviyeli Öğrenme (Reinforcement Learning)

Bu öğrenme biçimi diğerlerinden biraz farklıdır. Temelinde canlıların davranış psikolojisine dayandırılır. Bu yöntem öğrenme işlemini çevreden aldığı geri bildirim (feed-back) ile gerçekleştirmektedir.

Bu yöntemle olası durumların, hedef olup olmadığının kontrol edilir. Denemelerin sonucunda hedefe ulaşılamadığında ceza (penalty), ulaştığında ise ödül (reward) sinyali alınır ve sistem ceza sinyali aldığı hamleyi bir daha tekrarlamaz. Ödül sinyali aldığı deneyimden faydalanarak öğrenmeye devam eder ve hep maksimum ödülü amaçlayarak sürekli öğrenmeye işlevini sürdürür.

Bu sebeple mükemmele erişme, öğrenmeyi durdurma gibi bir durum söz konusu olmaz. Algoritma sürekli öğrenmeye devam eder.

10 adımda makine öğrenmesi

Makine Öğrenmesi Nedir?

Makine Öğrenmesinin Tarihçesi