場景描述:在知名的電商平臺亞馬遜上,虛假評論一直在誘導着消費者購買僞劣產品。儘管亞馬遜對此進行了一些管控,但依舊沒法就這個現象一網打盡。近期,有媒體報道亞馬遜的賣家正在從專業的造假公司手中,以不菲的價格大量購買虛假評論,甚至還造成了一個不小的灰色市場。如何識別和監管這些假冒評論? AI 在其中又能扮演什麼樣的角色?
關鍵詞:電商購物 虛假評論 天然語言處理
一直以來,亞馬遜就在對抗虛假評論的道路上忙的焦頭爛額。算法
近日,外媒《每日郵報》發佈了一項調查,在亞馬遜平臺上,活躍着一批專門兜售虛假評論的公司,他們背後操縱着網站的虛假評論,每條假評論以 13 英鎊(約爲 116 元)的價格進行售賣。網絡
在爆料中,一家位於德國的公司 AMZTigers ,就專門從事着這類不正當的交易,它在英國有 3,000 名測試人員,整個歐洲有近 6 萬名人員,以提供快速的虛假評論服務。機器學習
亞馬遜曾屢次表示對平臺實行了監管措施,在過去一年裏,更是花費了 3 億英鎊( 27.26 億元),來保護客戶免受濫用、欺詐和其餘形式的不當行爲。但此次的報道,側映了它們的工做還有一些漏洞存在。工具
虛假評論不只僅只是亞馬遜須要面臨的問題,事實上,整個電商平臺都存在着氾濫的假冒/欺詐性評論,這幾乎就是網購環境下揮之不去的陰霾。學習
在虛假評論的背後,是巨大的市場利益驅動和惡性競爭在做怪。測試
在一項針對 2000 名成年人的調查統計中顯示,超過 97% 的買家會依賴在線評論的內容,作出最後的購買決定。網站
虛假評論每每伴隨刷單一塊兒出現。在去年末,新京報的一項調查中說起,阿里單在 2018 年一年裏,就監控到 2800 多個刷單團伙,其中包括刷單 QQ 羣 2384 個,空包交易平臺 290 個,刷單交易平臺 237 個。人工智能
刷單刷評的門檻很低,網絡上隨處可見,也掌握着巨大的流量。好比大平臺「握手網」客服號稱有 60萬「刷手」,而「寶寶刷單網」則稱天天有近萬名「刷手」在線。在遭曝光後,一些平臺關閉,另外一些則改頭換面從新開始刷單業務。spa
央視也曾曝光過,一家銷售不合格產品的兒童用品公司,在一年內刷單數量達到 1231 單,涉及金額超過 77 萬元,僞造了近 40 倍的虛假交易記錄,支也爲此支付了約 2 萬元的刷單佣金。3d
電商、網絡「刷手」、刷單渠道,交織在一塊兒,構成了龐大的刷單黑色產業鏈,它們有着一整套複雜而詳細的運做流程,從而產生了大量的虛假銷量和虛假評論。
2019 年 1 月 1 日,《電子商務法》開始施行,其中將「刷單」定義爲違法行爲,規定「電子商務經營者不得以虛構交易、編造用戶評價等方式進行虛假宣傳,欺騙、誤導消費者。」但由於違法成本低、隱蔽性強等特色,再加上平臺的推薦機制等緣由,催生了這一現象的野蠻生長。
除了電商平臺須要借鑑更加完善的管理制度以外,也許另外一種可行的方式,就是善用 AI 的力量。
從虛假評論受到人們和電商平臺的重視以來,傳統的數據分析方法,就一直被用來檢測假冒/欺詐性評論。但早期的數據分析技術,一般以提取定量和統計數據特徵爲主。
這些方法,可以篩選出一些低端的造假,想要進行更全面深度的數據分析,系統必須配備大量的後臺數據,並可以執行涉及該數據的推理任務。
因而,一些研究人員將方向轉向了機器學習和人工智能,用更有效的方法來對抗虛假評論。
真實的評論和虛假評論之間,有一些語言特徵上的差別。好比一個剛註冊的用戶,在評論中充斥了過度的溢美之詞,那麼頗有多是來自水軍的評論。使用有監督/或無監督的學習方法,讓 AI 學會去判斷這些差別,就是 AI 進行打假的關鍵一步。
此類技術,歸屬於天然語言處理上的範疇。經過提取和識別流行的電商平臺上,虛假和不可靠的消費者評論,經過訓練讓算法學會識別和判斷虛假評論,最終學會給用戶評論的可信度進行打分。
這其中一項重要的任務,在於進行異常檢測,從書寫樣式、格式,結合評論者的多種可用資料,判斷該評論屬於正經常使用戶仍是惡意的假冒評論。
好比發現拼寫和語法上可疑之處,結合評論數量,購買方式,日期不匹配以及其餘可疑評論活動的跡象。再結合人類分析團隊,從多個數據維度進行分析,以肯定評論真實性。
此外,還有一些更細緻的研究,會根據評論者的評論密度、情感分析和語義檢測,對評論進行更加精確的判斷。
當咱們試圖從用戶評論中,發現更多商品信息的時候,那些別有用心的人,早已將它們做爲了非法牟利的籌碼。
AI 可以幫助咱們從這些平臺中,過濾掉那些虛假的評論,打造一個相對乾淨的網購環境。
在此同時, AI 也會被用在製造虛假評論之中,隨之又誕生了檢測 AI 造假的技術... 這場較量,也逐漸升級爲 AI 的攻防之戰。
但確定的是,只有善用技術,用對技術,才能走向最終的勝利。