《大數據工程師(運維)面試系列(4)》

1.MapReduce解決缺值問題? 一張很是寬,且數據量大的表,被分割成若干個hdfs上的小文件,其中有一個字段,是自增的(但分佈的文件中的這個字段值是亂序的),舉個栗子,好比:1,2,3。如今並不知道到底是哪幾個值缺失,請你用MapReduce的方式將那些缺失的值找到?html 其實這是MapReduce的典型應用場景之一——缺值查找。總體的一個思路是,先將這些亂序的值排好序,而後又由於表很是
相關文章
相關標籤/搜索