人工智慧,大資料分析處理隨著計算機硬體能力的提升最近20年得到了空前的發展,很多人對這些改變我們生活的技術都很有興趣,於是準備用通俗易懂的講解是大家更好的感知內部的實現原理。
比如工廠的一條電視機生產流水線,總共需要4道工序完成,原材料輸入--》工序A--》
工序B--》工序C--》工序D--》產品輸出,每一道工序需要選配合適的工人並且為工人提供合適的生產工具,來使得我們的最終產品輸出具有很高的質量和良品率。這樣選取不同年齡,學歷,性別的工人和合適品牌的工具就成為了構建合適生產線的重點。假如你是廠長,你就可以拿不同的工人和工具來測試成品質量,根據結果來最後確定每個工序工人的年齡,學歷,性別屬性和工具品牌。這些屬性在人工智慧模型裡就稱為引數。同時廠長還可以決定每道工序讓多少個工人來一起做可以達到更好的效果,這個被稱為模型的超引數,這個引數是對模型結構的設定。平時我們聽說的調參俠調的就是這個超引數。
假如我們現在有一個函式 Y=3*X+5
X=1 Y=8; X=2 Y=11;X=3 Y=14;
這時我們可以從X很快得到Y的值
如果反過來我們不知道函式的樣子,只知道 X=1 Y=8; X=2 Y=11;X=3 Y=14;這樣的數字組合,我們如何能推到出函式的樣子。我們可以假想函式符合Y=K*X+B的樣子,也可以是
Y=K*X*X+M*X+B的樣子,這樣我們可以根據上面的X和Y來推到出K,M,B的值,我們把這樣的函式樣子稱為模型,K,M,B稱為模型引數。不同模型和引數對資料的擬合程度都不一樣,我們就是要找到這樣的模型和引數使得和實際資料的擬合程度最好。也就是根據資料求函式,和根據函式求值正好互反。
現在主流的神經網路引數量很大,基本百萬級起步,傳統電腦CPU的計算模式求解這些引數比較吃力,所以這是就把這些計算放到顯示卡上,顯示卡善於做這些計算,導致了顯示卡價格的水漲船高