第二章:分佈式
備註:
1.本書第二章樣例數據因爲纔有的是短連接,國內的用戶可能沒法下載。我把數據集拷貝到百度網盤上。你們能夠從這個地方下載:
http://pan.baidu.com/s/1pJvjHA7工具
謝謝讀者錢先生指出這個問題。翻譯
2.P11,要記得設置log4j.properties文件,將日誌級別改成WARN,不然看到的輸出可能不太同樣:有許多的INFO!日誌
勘誤表:
1.第2章P16頁開始部分,「建立RDD的動做(action)並不會致使集羣執行分佈式計算」中「建立RDD的動做(action)」有錯誤,應該是「建立RDD的操做」component
2.第2章P30頁中間的運行結果應該是:
(1007, 0.2854529057466858)
(5645434, 0.09104268062279874)
(0, 0.6838772482597568)
(5746668, 0.8064147192926266)
(0, 0.03240818525033484)
(795, 0.7754423117834044)
(795, 0.5109496938298719)
(795, 0.7762059675300523)
(12843, 0.9563812499852178)ci
每行後面的序號和括號是沒有的!io
第四章集羣
備註:百度
1. P56.「該數據集能夠在線下載http://i.cn/R2wmIsI,這個短連接國內可能下載不了,能夠增長一個註釋:中文版的讀者能夠在https://archive.ics.uci.edu/ml/machine-learning-databases/covtype下載foreach
勘誤:
1. P52 第一段,「即便它已經和「向均數迴歸」」中,「向均數迴歸」改成「趨均數迴歸」,以保持先後一問一致。
2. P54.圖4-1中的中文有誤。英文版上原本也是錯的。「牛奶超過建議食用期3天了嗎」,左邊分支應該爲「是」,「已變質」,右邊分支爲「否」
3. P58.最後一段:「以前,爲了評測保留的收聽數據」中」評測「改成」評價「
4. P60.倒數第三段」召回率是被分類器標記爲」正「的全部樣本與。。。「改成」召回率是被分類器標記爲」正「並且確實爲」正「的樣本與。。。「
5. P63第一段"假設子數據包含N個。。。"中」子數據「改成」子數據集「
第5章
1. P72. 倒數第3段,」i「應該爲"k"
2. P80.中代碼部分的一個註釋能夠翻譯一下。」#first time only「,翻譯爲」#這行代碼只需運行一次「
3.P84.第三段,」本節使用熵做爲同類性度量「,將」同類性「改成」同質性「
4.P86.」爲了好玩「,能夠改成」爲了知足你們的好奇心」
第6章
P90.倒數第二段,「曲棍球棒圖」,改成「曲棍球杆曲線」
第11章
1. P195第一段。「或者只能拿到大腦截面的幾張靜態圖像」調整爲「或者只能拿到大腦的幾張靜態截面圖像」
2. P195.第一段末尾,「範式」改成「模式」
3. P196.第一段末尾,「活動模式」改成「大腦活動模式」
4.P196.「人們偏心Python工具」改成「人們更喜歡用Python工具」
附錄A
1. P213.第二段,」對應必定數量的檔口(slot)「,改成」對應必定數量的slot「,slot不要翻譯!
2. P219.表A-1中,」邏輯迴歸和Regularized Variants「改成」邏輯迴歸及其正則化變體「,」Regularized Variants(Ridge/L2/LASSO/L1)「改成」正則化變體(Ridge/L2/LASSO/L1)「
其餘:
1. P226.」 腹部爲米色且帶有帶褐色斑點「,多了一個」帶「,改成」 腹部爲米色且帶有褐色斑點「
第三章
1.P40.」它的體積可不小「,」體積「改成」體量」
2.方框中第一句,「也就是階段全部任務所需信息」,改成「也就是該階段全部任務所需信息」,增長一個」該「字
3.P44.倒數第二段開頭前兩句「本書附帶源代碼給出了處理AUC的實現,很複雜。源代碼的註釋作了必定程度的解釋,這裏咱們就不重複了」,改成「AUC的具體實現請參考本書附帶的源代碼。代碼實現比較複雜,請參考源代碼的註釋,這裏咱們就不重複說明了。」
第9章
1. P155.第二段後面,「即時分析」應爲「即席分析」
2. P156.第一段,「時間週期」改成「時間跨度」
3.P156.倒數第二段,「全球其餘國家」改成「世界其餘國家」
4.P157.第一段第一句。「咱們對VaR的定義都比較開放」。「開放'改成」寬泛「
5.P158. 倒數第三段。「因素彙報回報經驗平均向量」改成「因素平均回報經驗向量「
6.P158. 倒數第二段。最後一句」分佈方式「改成」分佈「,」方式「兩字去掉
第8章
1. P136. 第一段,「使人歡呼的是」,改成「使人高興的是」
2. P141.第三段最後一句,"屬性地圖"改成「屬性map」
3.P145.倒數第二段,第一句。「它們也可能存在有待咱們發現和處理的數據質量問題」,改成「它們也還可能存在數據質量問題,這些問題有待咱們進一步發現和處理」
4.P149.倒數第三段,「輸出行政區的記錄」改成「五個行政區的輸出記錄」
5.P153.倒數第三段。「司機和乘客可能會就在哪裏下車發生爭執」。改成「司機和乘客可能會發生摩擦」
第7章
1. P117.圖7-1的註解文字。「部分合伴生關係圖」,中多了一個「合」字,應刪除
2. P120.第三段代碼中「componentCounts.take(10)foreach(println)」中,少了一個「.」。應該爲「componentCounts.take(10).foreach(println)」。英文版原版自己的錯誤。
3. P124.第二段。「由於它們具備一種有意義的語義關係」,改成「由於它們具備某種值得咱們關注的語義關係」
4. P124.中卡方計算公司中,不是x而是希臘字母Chi(Χ)