Java :只要了bai解一些基礎即可,做大數(shù)據(jù)不需要很深的Java 技術,學java SE 就相當于有學習大數(shù)據(jù)。
Linux:因為大數(shù)據(jù)相關軟件都是在Linux上運行的,所以Linux要學習的扎實一些,學好Linux對你快速掌握大數(shù)據(jù)相關技術會有很大的幫助,能讓你更好的理解hadoop、hive、hbase、spark等大數(shù)據(jù)軟件的運行環(huán)境和網(wǎng)絡環(huán)境配置,能少踩很多坑,學會shell就能看懂腳本這樣能更容易理解和配置大數(shù)據(jù)集群。
Hadoop:這是現(xiàn)在流行的大數(shù)據(jù)處理平臺幾乎已經(jīng)成為大數(shù)據(jù)的代名詞,所以這個是必學的。
Zookeeper:這是個萬金油,安裝Hadoop的HA的時候就會用到它,以后的Hbase也會用到它。
Mysql:我們學習完大數(shù)據(jù)的處理了,接下來學習學習小數(shù)據(jù)的處理工具mysql數(shù)據(jù)庫,因為一會裝hive的時候要用到,mysql需要掌握到什么層度那?你能在Linux上把它安裝好,運行起來,會配置簡單的權限,修改root的密碼,創(chuàng)建數(shù)據(jù)庫。
Sqoop:這個是用于把Mysql里的數(shù)據(jù)導入到Hadoop里的。
Hive:這個東西對于會SQL語法的來說就是神器,它能讓你處理大數(shù)據(jù)變的很簡單
Oozie:既然學會Hive了,我相信你一定需要這個東西,它可以幫你管理你的Hive或者MapReduce、Spark腳本,還能檢查你的程序是否執(zhí)行正確。