在過去幾年,全球零售商一直試圖利用大數據創造價值。因爲其大數據分析基礎架構的限制,許多工做被一再推遲。Hadoop爲這些零售商打開了新的大門,它能夠解決他們在過去幾年在大數據領域面臨的許多問題和挑戰。算法
Hadoop:跨多門編程語言的大數據解決方案 數據庫
Hadoop背後的技術最初是由Google大約在10年前開發的。核心代碼主要是用Java編寫的,但有一些是用C編寫的。然而,它運行在一個稱爲MapReduce的編程模型中,這容許開發人員用其餘語言建立新的Hadoop代碼。 編程
因爲MapReduce環境能夠接受不一樣的編程語言代碼,所以它很是通用。它能夠提取,分析和操做許多不一樣來源的大數據。它使用各類算法來進行關聯規則學習,聚類,分類和迴歸。這些算法依賴於各類函數,包括貝葉斯,指望最大化和FP-Grown算法。 架構
Cloudera的首席執行官Mike Olson表示,Hadoop目前仍處於起步階段,但它已經在塑造零售和金融領域廠商使用大數據的方式了。 jsp
「Hadoop平臺旨在解決大量數據(多是複雜的和結構化的,而且不能很好地融入表中的數據)的混合問題。它適用於深度和計算量大的分析,例如聚類和定位...在在線零售中,若是想爲客戶提供更好的搜索答案,以提升用戶的購買慾望,Hadoop能夠很好地解決這一問題。 編程語言
Sears控股公司分部副總裁Aashish Chandra表示,Hadoop已經幫助公司下降了運營成本,提升了銷售額。Chandra說,之前的大數據提取工具缺少他們所須要的功能。 函數
使用Hadoop挖掘銷售點大數據 工具
銷售點數據在零售業中起着很是重要的做用。公司依靠銷售點大數據來預測將來銷售,管理庫存和項目人員需求。 oop
有許多銷售點工具能夠聚合銷售信息並將其存儲在大數據集中。然而,零售商難以用常規工具從PoS中挖掘大數據,即便它就存儲在SQL數據庫中。Hadoop使零售商更容易從客戶數據庫訪問信息,此數據能夠轉換爲其餘格式,並與其餘文件中的數據集合並。 學習
New Horizons CLC的John Soto聲稱Hadoop是零售業主要的改變者。
「大型零售商永遠不可能利用其傳統的大數據基礎設施進行這種分析。存儲如此多的歷史數據是十分昂貴的,而且數據類型複雜,而且須要至關多的準備以容許它與PoS事務組合。Hadoop解決了這兩個問題,而且能夠運行比舊系統更復雜的分析。」
Hadoop可讓零售商預測分析挑戰
Hadoop消除了零售商在利用大數據方面的一些障礙。這裏有一些該技術帶來的好處:
一、數據挖掘能力強。許多零售商都存儲了TB級別的數據。這些數據集每每難以提取,由於它們有很深的嵌套。Hadoop有很是複雜的索引算法,所以它能夠提取之前沒法爲大數據應用程序使用的數據。
二、與不一樣的數據格式兼容。零售商以許多不一樣的格式存儲數據。內部財務數據一般存儲在.csv文件中。零售商一直在努力進行審計,由於他們沒法比較結構化和非結構化數據集的數據。Hadoop能夠提取多種格式的數據,進行分析並以更具凝聚力的形式呈現,它使大數據分析專家可以從多個來源的數據集之間尋找相關性。
零售商已經發現了使用Hadoop的好處:
一、Staples使用Hadoop分析大數據和預測將來的銷售,這有助於他們更有效地分配資源給人員和庫存。 據報道,自使用Hadoop以來,Staples的促銷成本下降了25%。
二、亞馬遜使用Hadoop來改進欺詐檢測模型。據報告,他們將信用卡欺詐減小了50%,由於他們能夠更容易地識別出信用不佳的人。
三、相比以前,Brands能夠獲得更詳細的客戶信息,這有助於他們改進營銷策略。使用Hadoop和預測分析的零售商的銷售額增加了73%。
零售商只是開始認識到Hadoop和大數據的潛力。根據DeZyre所說,Hadoop最大的優點之一是它能夠幫助零售商實時識別和應對挑戰。這對防止欺詐尤爲重要,由於罪犯老是在考慮新的騙局。
「操縱者老是在發明新的欺詐工具和技術,零售商必須使用零售分析來識別欺詐活動,防止它們再次發生。使用大數據技術(如Hadoop,MapReduce和Spark),能夠對超過50 PB的數據執行分析,以準確預測潛在風險。」
更多大數據與分析相關行業資訊、解決方案、案例、教程等請點擊查看>>>
詳情請諮詢在線客服!
客服熱線:023-66090381