從2月28號開始報名大數據微專業,到4月29號看完最後模塊的視頻。兩個月的時間,收穫很是大。早在上班的時候就對大數據的技術很是好奇,後來考了研,終於有時間和機會來系統地學習。因爲我不是cs本科出身,在報名這門課以前,我本身學習了不少前置知識,好比linux,數據庫,java,python。我能在比較短的時間內完成這門課的學習主要得歸功於前置知識的掌握。java
在線技術課程我看過不少,就這麼課來講,穿插着手把手教你的操做和原理講解。我認爲在線課程老師的聲音、說話節奏以及普通話水平是衡量一門課能不能聽下去的一個重要指標,孟碩老師在這幾方面都很是棒。整個課程的邏輯設置很是合理,從須要的linux知識講解,到hadoop基礎組件,再到hive,hbase,再到spark的各個接口,甚至包括必備的數學基礎。值得一提的是,學了這麼長時間的線性代數和矩陣分析,纔在這門課裏明白了特徵值、特徵向量到底意味着什麼。python
學習這門課程,最重要的就是不能怕麻煩,開始跟着老師搭環境,後續全部的操做都要本身嘗試,並且須要記筆記。不少細碎的知識點若是不放在筆記中,很快就忘了甚至忘了是哪一個視頻裏講的。重要的事再怎麼強調都不過度,不能怕麻煩。個人環境就崩過不少次,有想給硬盤擴容本身做死的,有莫名其妙組件很差使從新裝的,有我無法解決的linux的莫名其妙的問題致使的。儘管會浪費一些時間,可是沒有合適的環境學習大數據,絕對是一件不靠譜的事。
linux
個人寫做水平本身內心是有數的,但仍是但願對你們有所幫助。
數據庫