監督學習演算法:
1、分類:當資料用於預測分類變數時,監督學習也稱為分類。 當分配標籤或指示符時,狗或貓分配給影象就是這種情況。 當只有兩個標籤時,這被稱為二進位制分類。 當有兩類以上時,這些問題被稱為多類分類;
2、迴歸:當預測連續值時,問題變成一個迴歸問題;
3、預測:這是基於過去和現在的資料來預測未來的過程。這是最常用的分析趨勢。一個常見的例子可能是根據本年和前幾年的銷售額估計下一年的銷售額。
監督學習演算法:
1、分類:當資料用於預測分類變數時,監督學習也稱為分類。 當分配標籤或指示符時,狗或貓分配給影象就是這種情況。 當只有兩個標籤時,這被稱為二進位制分類。 當有兩類以上時,這些問題被稱為多類分類;
2、迴歸:當預測連續值時,問題變成一個迴歸問題;
3、預測:這是基於過去和現在的資料來預測未來的過程。這是最常用的分析趨勢。一個常見的例子可能是根據本年和前幾年的銷售額估計下一年的銷售額。
機器學習的本質是求解一個最最佳化問題。而遺傳演算法屬於最最佳化演算法中的不確定性最佳化(Stochastic optimization)。最最佳化求解,可以看作一個在解空間內的搜尋問題。不確定性最佳化,它的搜尋方向沒有一個確定的數學表示式,而是依賴一個隨即變數,在最佳化收斂到區域性極值時,能跳出區域性最優。計算生物裡,有段時間流行過一些以GA演算法為基礎的Marker篩選方法,但這類演算法終究是非主流。因為在對於求解生物問題來講,最重要的是結果的穩健與可重複,這一點恰恰是GA的弱點。
1、首先找一本機器學習相關書籍,簡要過一遍基礎概念。
2、如果對於遇到的數學概念不明白的,還需要補充高數、線性代數、機率論相關知識。
3、熟悉了基礎概念之後,就可以到國際上的會議、期刊上尋找感興趣的方向的論文了。
4、瞭解一個領域的最新研究,需要泛讀大量文獻。選擇精讀其中有借鑑意義的部分文章,然後找到作者主頁(國際會議的文章作者一般都有個人主頁),可以獲取到程式碼,論文中往往也會提到資料集。獲取到程式碼和資料集之後,就可以著手復現論文中的實驗了。
5、在復現實驗之中,你會加深瞭解到論文的優點和不足之處,也為以後自己的最佳化奠定了基礎。