——深度學習是通向人工智慧的途徑之一。具體來說,它是機器學習的一種,是一種能夠使計算機系統從經驗和資料中得到提高的技術。我們堅信機器學習可以構建出在複雜實際環境下執行的AI系統,並且是唯一切實可行的方法。深度學習在許多軟體領域都已被證明是有用的,包括計算機視覺、語音和音訊處理、自然語言處理、機器人技術、生物資訊學和化學、電子遊戲、搜尋引擎、網路廣告和金融。
維恩圖展示了深度學習是一種表示學習,也是一種機器學習,可以用於許多(但不是全部)AI 方法
流程圖展示了 AI 系統的不同部分如何在不同的 AI 學科中彼此相關。陰影框表示能從資料中學習的元件
目錄大綱:
本書共二十章,分為三大部分。第一部分介紹基本的數學工具和機器學習的概念;第二部分介紹最成熟的深度學習演算法,這些技術基本上已經得到解決。第三部分討論某些具有展望性的想法,它們被廣泛地認為是深度學習未來的研究重點。
- 第一章:引言
- 第二章:線性代數
- 第三章:機率與資訊理論
- 第四章:數值計算
- 第五章:機器學習基礎
- 第六章:深度前饋網路
- 第七章:深度學習中的正則化
- 第八章:深度模型中的最佳化
- 第九章:卷積網路
- 第十章:序列建模:迴圈和遞迴網路
- ......
機器學習基礎
監督學習演算法——支援向量機
支援向量機(support vector machine, SVM)是監督學習中最有影響力的方法之一 。類似於邏輯迴歸,不同於邏輯迴歸的是,支援向量機不輸出機率,只輸出類別。
支援向量機的一個重要創新是 核技巧(kernel trick)。核技巧 觀察到許多機器學習演算法都可以寫成樣本間點積分的形式。例如,支援向量機中的線性函式可以重寫為
深度學習中的正則化
機器學習中的一個核心問題是設計不僅在訓練資料上表現好,並且能在新輸入上泛化好的演算法。在機器學習中,許多策略顯式地被設計來減少測試誤差(可能會以增大訓練誤差為代價)。這些策略被統稱為正則化。我們將在後文看到,深度學習工作者可以使用許多不同形式的正則化策略。事實上,開發更有效的正則化策略已成為本領域的主要研究工作之一。
深度模型中的最佳化
深度學習演算法在許多情況下都涉及到最佳化。例如,模型中的進行推斷(如PCA)涉及到求解最佳化問題。我們經常使用解析最佳化去證明或設計算法。在深度學習涉及到的諸多最佳化問題中,最難的是神經網路訓練。甚至是用幾百臺機器投入幾天到幾個月來解決單個神經網路訓練問題,也是很常見的。因為這其中的最佳化問題很重要,代價也很高,因此研究者們開發了一組專門為此設計的最佳化技術。本章會介紹神經網路訓練中的這些最佳化技術。
深度學習中的結構化機率模型
深度學習為研究者們提供了許多建模方式,用以設計以及描述演算法。其中一種形式是 結構化機率模型(structured probabilistic model)的思想。我們曾經在第 3.14 節中簡要討論過結構化機率模型。
結構化機率模型使用圖來描述機率分佈中隨機變數之間的直接相互作用,從而描述一個機率分佈。在這裡我們使用了圖論中 ‘‘圖’’ 的概念,由於模型結構是由圖定義的,所以這些模型也通常被稱為 圖模型(graphical model)
深度生成模型
在本章中,我們介紹幾種具體的生成模型,這些模型可以使用第十六章至第十九章中出現的技術構建和訓練。所有這些模型在某種程度上都代表了多個變數的機率分佈。有些模型允許顯式地計算機率分佈函式。
其他模型則不允許直接評估機率分佈函式,但支援隱式獲取分佈知識的操作,如從分佈中取樣。這些模型中的一部分使用第十六章中的圖模型語言,從圖和因子的角度描述為結構化機率模型。其他的不能簡單地從因子角度描述,但仍然代表機率分佈。
最後需要領取這本【吳恩達大佬最新手寫筆記——深度學習機器學習實戰專案案例分析!】的小夥伴麻煩幫忙點贊+轉發文章後,私信我【009】即可獲取!