!-- Global site tag (gtag.js) - Google Analytics -->

Makine öğrenimi için matematiği nasıl öğrenirim?

Makine Öğrenimi için gerekli matematiği sezgisel olarak öğrenmek için ayrıntılı 5 aylık bir plan:

Bu cevapta, tüm önemli matematik konularını kronolojik sırayla düzenlenmiş uygun çevrimiçi öğrenme kaynaklarıyla kapsayan 5 aylık bir plan vereceğim. Bu kaynaklar, yalnızca ML algoritmalarının değil, aynı zamanda istatistiksel sinyal işleme, hesaplama elektrodinamiği, vb. gibi birçok ileri mühendislik alanının sezgisel olarak anlamamı sağladı. Bakış açısı programlama (yani sadece akıllı araç kutuları, kütüphaneler ve fonksiyonlar kullanarak) ve her bir makalenin tüm türevlerini ve ön koşullarını anlamak haftalar veya aylar alabilir. Ünlü dediği gibi: “Matematik evrenin dilidir” dolayısıyla fizik dilidir ve tüm mühendislik alanları doğrudan veya dolaylı olarak fizikten türetildiği için matematik de mühendislik dilidir. Bir ML geliştiricisi veya araştırmacısı olmayı düşünüyorsanız, matematik öğrenmekten kaçmanın bir yolu yoktur. İşte ML öğrenmek için çok önemli olan konuların listesi:

  1. Doğrusal Cebir (isteğe bağlı ileri düzey konuları şunları içerir: Çok doğrusal ve Tensör cebiri)
  2. Olasılık Teorisi (isteğe bağlı ileri konular: Ölçü Teorisi, Stokastik Süreçler, Bilgi Teorisi)
  3. Çok Değişkenli Analiz (isteğe bağlı ileri konular: Stokastik Analiz, Diferansiyel Denklem)
  4. Çok Değişkenli İstatistikler (isteğe bağlı ileri konular: Rastgele Matris Teorisi)
  5. Konveks Optimizasyon (isteğe bağlı ileri konular: Stokastik ve Konveks Olmayan Optimizasyon)

Yukarıdaki listede kalın yazı tipindeki beş konu, ML algoritmalarının matematiksel olarak anlaşılması için gereklidir. Aslında, bu konular herhangi bir mühendislik alanındaki karmaşık konuları anlamak için yeterlidir. “İsteğe bağlı” olarak işaretlenmiş kalan konular basitçe bir uzantıdır ve önceden araştırma yapmak için gereklidir.

Bu konuların her birinin ustalaşması aylar veya yıllar alabilir. Ancak ML için gereken alt konuları yeterince kapsayacak kaynaklar sağlayacağım. İşte haftada yaklaşık 9 ila 11 saat gerektiren 5 aylık plan.


İlk ay:

Linear Algebra ile başlayın. En iyi kaynak dersler ve Prof. Gilbert Strang'ın kitabı. MIT OCW'de 35 ders bulunmaktadır. UG programının son sınıflarındaki her öğrenci 1 saat içinde bir dersi uygun notlarla bitirebilir. Hızlı bir şekilde anlayabiliyorsanız, dersleri 1.5x veya 2x hızda izleyin. Vektör ve matris işlemlerinde yer alan adımları anlamak bu dersin daha kolay kısmıdır. Bu adımları 3D veya 2D alanda görselleştirmek sabır ve sezgiye ihtiyaç duyar ve Veri Bilimi için çok önemlidir. Belirli bir dönüşüm matrisinin belirli bir vektörü nasıl etkilediğini ve yeni dönüştürülmüş alanla nasıl konuştuğunu görselleştirmeye çalışın. Fiziksel olarak görselleştirilecek en önemli iki konu özdeğer ve taban değişimi.

En güzel görselleştirme “ Doğrusal Cebirin Özü” çalma listesi altında “blue1brown” adlı Youtube kanalı tarafından sağlanmaktadır. ” . Sadece her biri 10-15 dakikalık 15 ders vardır. Prof Strang tarafından öğretilen görselleştirme konularında zorluk çekiyorsanız, önce bu 15 dersi bitirin. 1 hafta sürecek. Toplam: “3blue1brown” için 1 hafta ve Gilbert Strang'ın dersleri için 3 hafta. Biraz zaman kalırsa, çok satırlı cebir ve Tensörlerde rastgele youtube videoları izleyin. Bunlar şimdilik isteğe bağlı. Genel olarak, lineer cebiri anlamak, vektörler ve matrisler açısından çok miktarda veriyi temsil etme sanatını öğrenmenize ve fiziksel 3D alanı matematiksel anlayışınızı N-boyutlu özellik alanına genişletmenize yardımcı olacaktır.


İkinci ay:

Bu en zor ay olabilir. Olasılık ve Ölçü teorisi için. Olasılık teorisi, deterministik matematikte öğrendiğimiz gibi belirli bir kurallar dizisi değildir (cebir veya matematik gibi). Gerçek dünyadaki veriler ve olaylar, okullarda öğretilen para veya zarların çevrilmesinden çok daha karmaşıktır. Olasılık belirsizlik bilimidir. İnsan davranışındaki kuantum kanunları veya kalıpları olsun, her şeyin belirsizlikleri vardır, ancak yeterli gözlem / veri ile, bu belirsizlikler deterministik asimtotik yasalarla modellenebilir ve bu nedenle gerçek dünya verilerini anlamlandırmak için olasılık teorisi bir zorunluluktur.

Bu konuda mevcut en iyi ders dizisi Prof Krishna Jagannathan'ın kursu Grimmett'ın olasılık ve rastgele süreçler kitabı eşlik ediyor.  Ayrıca Olasılık teorisinin bir üst kümesi olan Ölçü Teorisi konularını da kapsar. Bu ders, soyut düşünme yeteneklerinizi sınırlarına kadar test edecektir. Temel olasılıktan memnun değilseniz, bu kursu izlemeyin. Bunun yerine Prof. John Tsitsiklis'in derslerini izleyebilirsiniz. Daha uygulamalı bir derstir ve soyut konulara ve türetmelere daha az odaklanır. Olasılık aksiyomları gibi çok temel konularla başlayacak, ancak yakında Markov Zincirleri, En küçük kareler, rasgele değişkenlerin yakınsaması, vb. Bu kursa tam bir ay vermenizi öneririm.


Üçüncü ay:

Üçüncü ay Çok Değişkenli Analiz içindir. Temel matematik kavramlarınız paslanmışsa endişelenmeyin. Çok değişkenli analizle ilgili her ders, analizin temellerini kapsayacaktır. Sadece makine öğreniminde yaygın olarak kullanılan analize odaklanmak istiyorsanız, sadece diferansiyel hesabı çalışabileceğinizi ve daha sonraki aşamalar için integral hesabı bırakabileceğinizi belirtmek çok önemlidir. Üçüncü ayda, sadece diferansiyel hesabı incelemeniz gerekiyor. İlk 15 günde 99 konferansı “ 3Blue1Brown ” ile izleyin” . Endişelenmeyin, bu dersler ortalama 5-8 dakika uzunluğundadır. böylece kolayca yapılabilir. İntegral hesapta olduğu gibi bu derste kalan dersleri de bırakın. Kalan 20 günde, “ Çok Değişkenli Analiz ” in ilk 20 dersini Prof. Denis Auroux'dan bitirin”Veya “ Adrian Banner tarafından Çok Değişkenli Analiz ”in ilk 6 dersini izleyin .

Mola ve Ayarlamalar:

Bir ara verelim ve rahatlayalım. Kendinizi tebrik edin. ML için gerekli olan% 80 temel matematikle zaten işiniz bitti. Şimdiye kadar, programın 10-20 gün gerisinde olduğunuzu varsayalım. TELAŞA GEREK YOK! Programınızın geri kalanını ve ML algoritmaları hakkındaki anlayışınızı etkilemeyecek birkaç şeyi atlayabilirsiniz. Denis Auroux ve Adrian Banner ile çok değişkenli matematik derslerini atlayabilirsiniz. Eğer programın çok gerisindeyseniz, bu aşamada 3blue1kahverengi videoları yeterlidir. Bu size 15-20 gün kazandırır. Prof Tsitsiklis'in son 7 dersi de olasılıkla atlayabilirsiniz . Bu ayrıca 7-8 gün tasarruf sağlayacaktır. Ancak mümkünse bu ayardan kaçının.

Dördüncü Ay:

Şu anda bazı ünlü ML algoritmalarını doğrudan kapsayan Çok Değişkenli İstatistikler'deyiz . Bu konu lineer cebir ile Olasılık ve istatistikin yüksek boyutlu uzayda birleşiminden türetilmiştir. Bu, iyi tanımlanmış konvansiyonel müfredat bulunmayan geniş bir konudur. Bunda çok derine inmenin bir anlamı yok. Sadece bu üç görevden birini en fazla 15 gün içinde tamamlayın ve ML'ye özgü Çok Değişkenli istatistiklerle işiniz bitti:

  1. R. Johnson tarafından yazılan kitabın 4., 7. ve 8. bölümleri : Uygulamalı Çok Değişkenli İstatistiksel Analiz veya
  2. T W. Anderson'ın kitabının 2,3 ve 11 bölümleri : Çok Değişkenli İstatistiksel Analize Giriş veya
  3. Aşağıdaki konular hakkında internetten rastgele bazı iyi videoları ve makaleleri (beğenme / abone / yorum vb. Sayısına bakın) seçin: Çok Değişkenli Normal dağılım, Temel Bileşen Analizi (PCA), Tekil Değer Ayrıştırma (SVD), Kovaryans matrisinin özellikleri ve Gauss Karışım Modelleri.

Yine, yukarıda belirtilen üç kaynaktan sadece birini tercihinize göre tamamlayın.

Mola ve Ayarlamalar: Dördüncü ayda hala 15 gününüz kaldı. Dinlenin, keyfini çıkarın, filmleri, TV dizilerini ya da sizi yenileyen her şeyi izleyin ve kendinizi son tur için hazırlayın.


Beşinci Ay:

Bu ay, şimdiye kadar öğrendiğiniz her şeyin kullanılacağı konuya yöneliktir. Konveks Optimizasyonu öğrenelim Daha önce öğrenilen tüm araçlar, belirli ayarlanabilir parametrelerle bir başlangıç ​​modeli oluşturmanıza yardımcı olacaktır. Bu parametrelerin değerleri, modelinizin ampirik verileri ne kadar iyi temsil ettiğine karar verir ve bu değerler, optimizasyon teorisindeki araçlar kullanılarak tahmin edilir. Ne yazık ki, bu konuda sınırlı sayıda iyi organize edilmiş kurs veya kitap bulunmaktadır. Kaynakların çoğu mühendislik açısından çok karmaşıktır. Yüksek lisans düzeyinde derslerin çoğu dersleri ve Prof. Stephen Boyd'un kitabını kullanmaktadır.(Stanford) . Kuşkusuz kitabının uygulamalı konveks optimizasyonu öğrenmek için en kapsamlı kaynak olduğu. Ancak, bu planda çok derinlemesine ele almadığımız titiz çok değişkenli analize ihtiyaç duyduğundan zor olabilir.

Boyd'un kitabına ve derslerine daha basit bir alternatif, Prof. Aditya K. Jagannatham'ın dersidir.” . Bu, içeriği ve en son teknolojilerin gerçek dünyadaki örnek sayısı açısından benzersiz bir derstir. Bu dersin tek dezavantajı, sadece elektrik mühendisliği kökenli öğrencilerin anlayacağı “Kablosuz İletişim” ile ilgili örneklerdir. Genel olarak, konveks optimizasyonu öğrenmek için iki seçenek vardır ve her ikisi de ağırdır. Konveksoptimizasyona daha az zaman vermek ve sadece pratik kavramları öğrenmek istiyorsanız, bu stratejiyi takip edin:

Profesör Jagannatham'ın dersinin 1 ila 33 derslerini ve 42 ila 50 derslerini izleyin (dersler küçüktür (her biri yaklaşık 20 dakika)). Kablosuz İletişim örneklerini anlayamıyorsanız endişelenmeyin. Bundan sonra doğrudan Boyd'un kitabının 6. bölümünü okuyun ve Prof. Boyd'un web sitesinde bu bölüm için verilen Matlab / python kodlarını uygulayın. Bu kadar.

Tebrikler! Sadece makine öğrenimini anlamak için değil, aynı zamanda herhangi bir mühendislik matematiğini anlamak için gerekli tüm önemli konuları tamamladınız.

Altıncı Ay ve sonrası:

Şimdi hazırsınız. Makine Öğrenimi ile ilgili herhangi bir standart kitabı veya kursu almanız yeterlidir. Artık ML'deki herhangi bir konunun arkasındaki matematiksel özü elde edebileceksiniz. ML meraklılarının çoğu, yukarıdaki tüm Matematik kurslarını okumadan önce Prof. Andrew Ng'nin kursunu izlemiş olabilir. Şimdi rotasını tekrar izle. Önemli bir fark hissedeceksiniz. Artık verilerin olasılık özelliklerini anlayabilir, daha iyi sonuçlar elde etmek için geleneksel maliyet işlevlerini verilere göre düzenleyebilir ve hatta kendi özelleştirilmiş algoritmalarınızı yapabilirsiniz.

Matematiksel açıdan ML'yi incelemek için önerilerim:

  1. Stanford'dan Prof. Trevor Hastie ve Prof. Tibshirani'nin herhangi bir kitabı veya videosu dersi. En çok tavsiye edilen başlangıç ​​seviyesi kitabı Hastie ve Tibshirani'nin “ İstatistiksel Öğrenmeye Giriş ” dir.
  2. Örüntü Tanıma ve Makine Öğrenimi Kitabı, Christopher Bishop.
  3. Hesaplamalı Düşünme ve Veri Bilimine Giriş.
  4. Tommi Jaakkola'dan Makine Öğrenmesi.

Daha önce de söylediğim gibi, matematik bilim adamlarının ve mühendislerin dilidir. Fizik, Bilgisayar Bilimi, Mühendislik, finans alanındaki herhangi bir konuyu rastgele seçmeniz ve anlamanız için süper güç verecektir. Çok çeşitli görünen alanların çılgınca farklı fenomeni açıklamak için tam olarak aynı matematiksel yöntemleri nasıl kullandığını görünce şaşıracaksınız. Örneğin, öz iletişimin kesin yöntemi kablosuz iletişimde, finansta portföy optimizasyonunda, inşaat mühendisliğinde stres / şekil değiştirme modellemesinde, veri biliminde boyutsal azalma, genetik hastalıklara karşı aşılama tasarımı ve diğer birçok alanda kullanılmaktadır. Umarım bu cevap mühendislik matematiğini, özellikle Veri Bilimi'nde harika algoritmaları anlamak için güçlü bir kavrayış elde etmenize yardımcı olacaktır.

Soru sormaktan çekinmeyin.