初步瞭解:MPI集羣環境搭建html
連接:https://www.zhihu.com/question/48743915/answer/115738668git
馬鐵大神的phd thesis 總結裏面說了一句話 大概意思是說 單純的若是使用mpi 來實現一個算法 比spark 快五六倍是很正常的 可是spark 是一個 general 的 data flow 處理框架 就是能夠在數據的生命週期裏面 可使用spark 之上的具體實現來處理數據 ml 只是一部分而已 這就是spark 最大的賣點之一github
因此你用這個Prophet平臺來和spark 比 ml這方面的效率固然你要快了的 由於還有不少ml 專業的平臺都要比spark 快 這就不列舉了
由於spark 基於 mapreduce的 這種program model 就不是適合ml的 特別是ml 裏面大量參數的模型 好比lda 之類的 算法
DMTK includes the following projects:shell
(1) OpenCV的OpenCL實現了下面的哪些算法?框架
class cv::ml::LogisticRegression
Ref: How to use NVIDIA GPUs for Machine Learning with the new Data Science PC from Maingeardom
看樣子你們纔剛剛意識到這個事情,或者dnn就足夠了。機器學習
Goto: [CUDA] Install H2O.ai,有部分GPU實現的算法。分佈式
工具