深·觀察深·觀察

數據挖掘如何就業(yè)？

2016年11月08日 18:42 | 來源：芝諾數據分析mp

分享到：

5. hadoop,hive之類的需要學習嗎？

我覺得應當學習，首先Hadoop和Hive很簡單（如果你用AWS的話你可以開一臺EMR，上面直接就有Hadoop和Hive，可以直接從使用學起）。

我覺得如果不折騰安裝和部署，還有Linux和MySQL的經驗，只要半天到一天就能熟悉Hadoop和Hive的使用（當然你得有Linux和MySQL的基礎，如果沒有就先老老實實的學Linux和MySQL，這兩個都可以在自己的PC上安裝，自己折騰）。

Spark對很多人來說才是需要學習的，如果你有JAVA經驗大可以從JAVA入門。如果沒有那么還是建議從Scala入門，但是實際上如果沒有JAVA經驗，Scala入門也會有一定難度，但是可以慢慢補。

所以總的來說Spark才足夠難，以至于需要學習。

最后的最后我有一些建議。第一要對自己有一個系統(tǒng)的認知，自己的編程水平夠么，SQL會用么，Linux會用么，能流暢的看英文文檔么？

如果上面任何一個問題的答案是No，我都不建議直接轉行或者申請高級的數據挖掘職位（因為你很難找到一個正經的數據挖掘崗位，頂多是一些打擦邊球的崗位，無論是實際干的工作還是未來的成長可能對你的幫助都不大）。

無論你現在是學生還是已經再做一些前段后端、運維之類的工作你都有足夠的時間補齊這些基礎知識。

補齊了這些知識之后，第一件事就是了解大數據生態(tài)，Hadoop生態(tài)圈，Spark生態(tài)圈，機器學習，深度學習（后兩者需要高等數學和線性代數基礎，如果你的大學專業(yè)學這些不要混）。

選定其中一個方向做一些鉆研和學習，網上有很多現成的資料（基本上是英文的，所以我說了，不能看英文的趕緊去背單詞），科學上網用谷歌這個大家都懂。希望我的建議能對你有一些幫助。

編輯：梁霄

01 02 03

關鍵詞：數據挖掘學習公司算法機器生態(tài)圈