做者:京東AI研究院算法
導言
過去幾十年間,人類的計算能力得到了巨大提高;隨着數據不斷積累,算法日益先進,咱們已經步入了人工智能時代。確實,人工智能概念很難理解,技術更是了不得,背後的數據和算法很是龐大複雜。不少人都在疑惑,如今或將來AI將會有哪些實際應用呢?
其實,關於AI的實際應用以及所帶來的商業價值並無那麼的「玄幻」,不少時候就已經在咱們的身邊。接下來,【AI論文解讀】專欄將會經過相關AI論文的解讀,由深刻淺地爲你們揭祕,AI技術是如何對電商領域進行賦能,以及相關的落地與實踐。人工智能技術在電商領域,有着豐富的應用場景。應用場景是數據入口,數據經過技術獲得提煉,反過來又做用於技術,兩者相輔相成。
京東基於天然語言理解與知識圖譜技術,開發了商品營銷內容AI寫做服務。並將此項技術應用到了京東商城【發現好貨】頻道中。網絡
經過AI創做的數十萬商品營銷圖文素材,不只填補了商品更新與達人寫做內容更新之間的巨大缺口,也提高了內容頻道的內容豐富性。機器學習
同時,AI生成內容在曝光點擊率、進商詳轉化率等方面其實都表現出了優於人工創做營銷的內容。學習
接下來讓咱們一塊兒來看看,針對不一樣羣體採用不一樣營銷策略及不一樣風格的營銷文案從而提升營銷轉化率是怎樣經過AI來實現的。ui
與傳統的文本摘要任務相比,商品摘要任務更具挑戰性。一方面,商品給顧客的第一印象來自該商品的外觀,這對顧客的購買決策有着相當重要的影響。所以,商品摘要系統必須可以充分挖掘商品視覺信息,反映商品的外觀特點。另外一方面,不一樣的產品有不一樣的賣點。例如,緊湊型冰箱的優勢是節省空間,而環保型冰箱的優勢是節能。所以,商品摘要應該反映商品最獨特的方面,從而最大限度地促成消費者的購買。編碼
本文接下來將介紹由京東 AI 研究院提出的一種電商商品的多模態摘要模型,該模型能夠有效地整合商品的視覺和文本信息來生成賣點突出、流暢和簡潔的商品文本摘要。人工智能
論文的標題爲 :Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products ,發表於 AAAI 2020。spa
論文連接:http://box.jd.com/sharedInfo/2926429040ECC7D33d
以下圖1所示,商品廣告含有大量的文字介紹,顧客很難在短期內在這些廣告中獲取有價值的商品信息,尤爲是當顧客想要比較多個商品時,將會耗費大量的時間,影響了購物體驗。商品摘要模型能夠爲商品生成文本摘要,爲潛在消費者提供了短期內瞭解商品的便利。從消費者決策的角度出發,一個好的商品摘要須要反映商品的外觀特點和賣點信息,這也是本文提出的商品摘要模型的出發點。指針
圖1
論文提出了一種基於商品要素的多模態商品摘要方法,如圖1所示,該模型將商品圖像、產品標題和其餘產品描述做爲輸入,生成商品文本摘要。該模型不只能夠有效地整合商品的視覺和文本信息,並且從商品要素出發,使生成的商品摘要儘量的包含商品的特點要素,並提升商品摘要的流暢性和簡潔性。
論文中構建了一箇中文商品摘要數據集,該數據集包含約140萬個「商品-摘要」對,涵蓋家電、服飾和箱包品類。在該數據集上的實驗結果代表,文中提出的模型在自動評價和人工評價指標上都顯著優於其餘對比方法。
如圖2所示,論文中提出的商品摘要模型基於指針-生成器網絡(Pointer-Generator)。採用了三種策略將商品圖像信息融入模型中,包括使用商品圖片的全局特徵初始化編碼器,使用商品圖片的全局特徵初始化解碼器,以及使用商品圖片的局部特徵,經過注意力機制生成圖片上下文向量參與解碼。
圖2
首先,對商品要素進行建模(所謂的商品要素,就是商品不一樣方面的屬性。例如:對洗衣機而言,商品要素包括容量和能耗等),而後從商品的要素出發,對摘要的重要性、非冗餘性和可讀性進行建模。
(1)採用基於商品要素的RAML(reward augmented maximum likelihood)訓練,鼓勵模型生成的摘要涵蓋商品的特點要素。如圖2(b)所示,該商品ground-truth特點要素是容量、操控與電機,則該模型將會鼓勵生成描述容量、操控與電機相關的文本;
(2)採用基於商品要素的覆蓋度機制消除冗餘信息。傳統覆蓋度機制僅能在詞維度進行去冗餘,難以處理相關詞冗餘問題。如圖2(c)所示,「noise」、「quiet」和「tranquil」均在描述「運行聲音」這一商品要素,若是僅對「noise」進行去冗餘,難以保證「quiet」和「tranquil」不出現摘要中。本文提出的模型經過商品要素維度的去冗餘,能夠避免「noise」、「quiet」和「tranquil」同時出如今摘要中;
(3)經過商品要素放回跳機制提升摘要的可讀性。如圖2(d)所示,商品要素的回跳描述下降了商品摘要的連貫性,影響了消費者的閱讀體驗。本文提出的模型經過解碼時禁用回跳要素詞,有效地避免了這一現象。
如表1所示,本文提出的帶有的多模態商品摘要模型,MMPG模型取得了比全部基於純文本的模型更好的結果,這證實了商品視覺信息和商品要素信息在商品摘要任務中起着重要的做用。
表1
論文提出了一個多模態商品摘要模型,其能夠利用商品圖像、標題和其餘文本介紹,爲商品生成摘要。文中提出的模型能夠有效地利用商品的視覺信息,並反映商品的特點要素,從重要性、非冗餘性和可讀性的角度對商品要素進行了有效的建模。
對於電商而言,海量商品的營銷內容在由達人供稿的過程當中,受限於達人寫做的效率限制,商品更新速度明顯高於營銷內容上線速度,致使內容短缺。
AI生成內容在生成效率、曝光點擊率、訂單轉化率等方面其實都表現出了優於人工創做營銷的內容。該方法正在應用於垂直電商、綜合電商、社交電商、新媒體平臺等衆多場景。
P.S 同時也歡迎對NLP、文本生成和自動文摘感興趣的小夥伴加入咱們。相關信息諮詢,可在後臺給咱們留言哦~
京 東 AI 研 究 院
京東AI研究院專一於持續性的算法創新,多數研究將由京東實際的業務場景需求爲驅動。研究院的聚焦領域爲:計算機視覺、天然語言理解、對話、語音、語義、機器學習等實驗室,已逐步在北京、南京、成都、硅谷等全球各地設立職場。
歡迎點擊「閱讀」瞭解京東智聯雲AI研究院!