《全棧數據之門》(暫定書名)是末學近5年來工做技能的積累,從8個月前開通公衆號寫的第一篇起,中間也不知度過了多少個寂寞的夜晚。python
寫文章原本就是一個很費力的活,何況寫書要求還得高些。算法
原計劃寫的是七章,每章七篇,共計七七得四十九篇。只是在寫做過程當中,捨棄了部分原計劃的篇幅。感受以目前的功力,或是寫不出特點,或是沒有好的應用場景,或是沒有寫做的動力,或是……總之,理由老是能夠找出來的,正如男人老是能夠找到出軌的理由同樣好笑。框架
捨棄了部分篇幅,也增長或者替換了部份內容,所以目前仍是七個章節,只是每章節只餘六篇文章,共講六七得四十二篇。六這個數字,其實也是極好的,正合了八卦中每一卦六爻的數,何況,看過《鹿鼎記》的朋友,應該都知道有本書叫《四十二章經》的嘛,也許四十二這個數字也還不差。機器學習
對於暫時棄而不用的素材,或許再過3、五年,屆時若是技術上還有大境界上的提高,再彙編成冊,也未可知。分佈式
若是此書能叫《全棧數據之門》(具體書名還得再與出版社編輯討論才定),那麼也許下一本就叫《全棧數據之路》。正如同登山通常,入了門,還得找條路上山。工具
目前的字數統計在12萬左右,因有部分代碼與結論直接截圖了,統計字數會吃虧一些。oop
言歸正傳,數量多少也許並不過重要,我相信讀者也更關心書的質量。這也正是末學完成初稿卻還未交稿的緣由。由於,接下來是二稿的開始。學習
在二稿中還有不少的事情要作,還須要修正大量的細節,目前能想到的有以下:大數據
修正錯別字,修正標點符號,讓文章能讀通、可讀通。編碼
增長更多的圖表,讓文章表述更清晰。
給文章增長可讀性,也許就應該多扯淡,讓觀點在扯淡或者比喻中更加顯現,而不是生硬的文字。
完善每章的引言,除了六篇正文外,引言原本就是在計劃中的。
統一文章中的風格,包括使用的環境,演示數據,這又是一個大工程。
調整部分文章的內容,盡能夠多增長小標題,讓文章更有條理。也會修正部分的描述,讓整本書看起來,會更加的順暢。
(先作完上面的,其它的想到再作,目標不要太多)。
固然,若是有更好的建議,也請留言或者回復公衆號,讓我知道。
下面附上目前的初稿大綱,看了大綱,若是想幫忙審稿或者參與改進,請聯繫我。
0x10【引言】Linux引言
0x11【初稿】Linux基礎,從零開始
0x12【初稿】Grep與Sed,文本處理
0x13【初稿】數據琅琊棒,假裝者AWK
0x14【初稿】Shell快捷鍵,Emacs入門
0x15【初稿】緣起於Linux,一入Mac誤終身
0x16【初稿】集大成者,集羣安裝
0x20【引言】Python引言
0x21【初稿】道法天然,Python出洞
0x22【初稿】Anaconda,Ipython
0x23【初稿】美不勝收,Python工具
0x24【初稿】SQL技能,必備MySQL
0x25【初稿】Pandas,數據之框
0x26【初稿】Zeppelin,一統江湖
0x30【引言】大數據引言
0x31【初稿】神象住世,Hadoop
0x32【初稿】分治之美,MapReduce
0x33【初稿】Hive基礎,蜂巢與倉庫
0x34【初稿】Hive深刻,實戰經驗
0x35【初稿】SQL與NoSQL,Sqoop爲媒
0x36【初稿】大無所大,生態框架
0x40【引言】機器學習引言
0x41【初稿】Sklearn,機器學習
0x42【初稿】模型評估,交叉驗證
0x43【初稿】數據礦工,一致清洗
0x44【初稿】中文向量,詞袋模型
0x45【初稿】近朱者赤,相親KNN
0x46【初稿】自學數據,神蟒領舞
0x50【引言】算法引言
0x51【初稿】很傻很天真,樸素貝葉斯
0x52【初稿】菩提之樹,決策姻緣
0x53【初稿】隨機之美,隨機森林
0x54【初稿】孤立森林,挖掘異常
0x55【初稿】自編碼器,深度之門
0x56【初稿】集體智慧,失控哲學
0x60【引言】Spark引言
0x61【初稿】PySpark,強者聯盟
0x62【初稿】RDD算子,運算之魂
0x63【初稿】神器之父,Scala入世
0x64【初稿】分佈式SQL,蝶戀飛舞
0x65【初稿】DataFrame,加油雄起
0x66【初稿】機器之心,學習ML庫
0x70【引言】數據場引言0x71【初稿】數據科學家,必備之Shell0x72【初稿】分析之始,描述統計0x73【初稿】大數據分析,七層基本功0x74【初稿】數據極客,職位信息0x75【初稿】數據科學,七大技能0x76【初稿】色便是空,blank與null