方法:
1、需要理解主流機器學習演算法的原理和應用。
2、需要熟悉至少一門程式語言。
3、需要理解資料庫原理,能夠熟練操作至少一種資料庫。
4、資料探勘能力只能在專案實踐的熔爐中提升、昇華,所以跟著專案學挖掘是最有效的捷徑。
資料探勘:又譯為資料探勘、資料採礦。它是資料庫知識發現中的一個步驟。資料探勘一般是指從大量的資料中自動搜尋隱藏於其中的有著特殊關係性的資訊的過程。資料探勘通常與計算機科學有關,並透過統計、線上分析處理、情報檢索、機器學習
方法:
1、需要理解主流機器學習演算法的原理和應用。
2、需要熟悉至少一門程式語言。
3、需要理解資料庫原理,能夠熟練操作至少一種資料庫。
4、資料探勘能力只能在專案實踐的熔爐中提升、昇華,所以跟著專案學挖掘是最有效的捷徑。
資料探勘:又譯為資料探勘、資料採礦。它是資料庫知識發現中的一個步驟。資料探勘一般是指從大量的資料中自動搜尋隱藏於其中的有著特殊關係性的資訊的過程。資料探勘通常與計算機科學有關,並透過統計、線上分析處理、情報檢索、機器學習
統計分析與資料探勘有很大區別,具體區別表現在以下方面:
1、資料量:資料分析的資料量可能並不大,而資料探勘的資料量極大;
2、約束:資料分析是從一個假設出發,需要自行建立方程或模型來與假設吻合,而資料探勘不需要假設,可以自動建立方程;
3、物件:資料分析往往是針對數字化的資料,而資料探勘能夠採用不同型別的資料,比如聲音,文字等;
4、結果:資料分析對結果進行解釋,呈現出有效資訊,資料探勘的結果不容易解釋,對資訊進行價值評估,著眼於預測未來,並提出決策性建議。
資料探勘,從字面上理解,就是在資料中找到有用的東西,哪些東西有用就要看具體的業務目標了。最簡單的就是統計應用了,比如電商資料,如淘寶統計過哪個省購買泳衣最多、哪個省的女生胸罩最大等,進一步,可以基於使用者的瀏覽、點選、收藏、購買等行為推斷使用者的年齡、性別、購買能力、愛好等能表示一個人的畫像,就相當於用這些挖掘出來的屬性來刻畫一個人,這些還是最簡單的東西,更深層次的比如預測(股票預測),但是比較難。