在國內參加PDE考試的人比較少,致使資料也不多。我在19年1月30號去上海蔘加PDE考試,參加前也是徹底沒底,由於時間短資料少,但幸運的是順利經過了。回過頭來看,其中有些技巧和重點,在此作一些總結,但願能夠給參加PDE考試的同窗提供一些幫助。mysql
1)對雲有新的認識
2)對大數據架構、機器學習架構設計有新的認識
3)固然最重要的是得到google官方發的證書sql
1)花了5周的時間看完google官方提供的視頻,幾乎是徹底脫產(只作一些事故處理)。
2)試作官方提供example,一共20道題,我錯了五道。我錯的主要是安全和BigTable相關的。
3)google的同窗建議是看concept的相關內容,但離考試也就剩三四天了,不可能詳細複習,concept是必定看不完的。那麼就針對沒有掌握的知識進行復習,安全相關的官方視頻是沒有涉及的,因此必須本身找資料看,別的資料也沒有,就只能看concept中涉及安全的方便,這個比較少,最多一天就所有看完。BigTable看來我也是掌握很差,那麼我就看BigTable的concept知識。
4)看完上面的就參加考試了,也再沒作特別複習。mongodb
google的產品大體涉及存儲(cloud storage、SQL、spanner、memory、BigTable、datastore)、消息中間件Pub\Sub、計算(dataproc、BigQuery、Dataflow)、機器學習ML Engine、API、DataLab以及可視化。各個產品的使用場景必須內心有數,若是看完視頻忘了,必須從新複習,最好和開源對應起來,由於開源多多少少有點兒瞭解,不要從頭學習google cloud全部產品知識。
安全
把本身定位爲產品解決方案工程師,不是找最優解,而是找最適合案例的解決方案。架構
Cloud SQL 就是mysql\postsql的單機版,google幫你作了安裝部署和管理(安全、備份等),若是須要水平擴展就是spanner了,並且支持事務,這兩個產品的應用場景就是應用交易記錄等。機器學習
就是存儲引擎,什麼均可以放,沒有大小文件、結構化和非結構化的限制,利用好存儲級別(正常、nearline(月級訪問)和cold(年級訪問))能夠節約成本。oop
考試重點。注意key值的設置,如何避免熱點問題,時間序列的問題大部分就是選BigTable存儲,BigTable適用於時延性要求高的場景。post
相似於mongodb,經過屬性來查詢,不是重點。學習
考試重點。注意安全和視圖相關知識,數據存儲在BigQuery和存儲在cloud storage的價錢差很少,根據使用狀況,會自動處理存儲介質,下降價格,必定要合理利用BigQuery。大數據
主要是爲了適應客戶原來使用hadoop堆棧,如今不像修改代碼,就像上雲的場景。
是google大力推動的產品,是替代Dataproc的下一代計算引擎,實現自動擴縮容,而且流處理和批處理代碼保持一致。題外話:dataflow和bigquery(秒級響應)是google大數據方面兩大殺傷性武器,區別於其餘雲的地方。
Pub\Sub和dataflow配合使用處理事件流,延時性要求高選用BigTable存儲,不高選用BigQuery。
tensorflow的雲化版,實現離線訓練和在線服務的自動化,配合dataprep能夠實現離線數據的預處理,datalab(jupyter notebook)實現數據探索和離線訓練。
Auto ML是爲了豐富API,允許用戶本身提供數據,對模型進行訓練。
其實知識點也不那麼難,最後可貴多是英語這一關,視頻和考試全英語。祝你們順利經過考試。
若是有疑問歡迎關注下面公衆號進行交流。