如何使用Spark大規模並行構建索引

[size=medium] 使用Spark構建索引很是簡單,由於spark提供了更高級的抽象rdd分佈式彈性數據集,相比之前的使用Hadoop的MapReduce來構建大規模索引,Spark具備更靈活的api操做,性能更高,語法更簡潔等一系列優勢。 先看下,總體的拓撲圖: [/size] [img]http://dl2.iteye.com/upload/attachment/0114/9272/c
相關文章
相關標籤/搜索