文本數據的分分合合

對於數據分析工作來說,可能最希望的是面對規整、一致的數據,例如定義清晰明確的關係數據庫,或者可以自由鑽取、切片的OLAP 數據倉庫。但不幸的是,很多時候,我們不得不面對來自方方面面的零散數據,親自操刀煎炒烹炸,這其中,文本數據的合併、分拆就有點像基本的刀工,既要做的漂亮,但又不能用太多的時間。這時候一把趁手好刀的作用就不容忽視了——我們這裏介紹的,集算器,就可以說是這個領域的雙立人、王麻子了。 仔
相關文章
相關標籤/搜索