下筆若有神:這是一個基於營銷行業的 AI 技術實踐

image.png

今年京東 618,平臺累計下單金額超 2692 億元,創下了新的記錄。驚喜的數字背後, 離不開京東智聯雲的 AI 技術爲用戶多元購物體驗的賦能。在【發現好貨】中 AI 創做的內容是人工創做內容曝光點擊率的 1.4 倍。在京小智智能客服,智能生成了數百萬營銷文案,天天至關於超過 500 個文案編輯人員的工做量。網絡

「讀書破萬卷,下筆若有神」,當機器書讀萬卷的時候,可否作到下筆有神呢?框架

咱們正在經歷一個節奏愈來愈快的時代,互聯網上的信息來也匆匆去也匆匆,各行各業涉及到高頻內容生產和處理工做的都但願內容生產的速度快、質量高、數量多。而隨着人工智能技術的發展,讓機器輔助人類更高效地處理信息,以及讓機器自動生成信息都已經成爲可能。ide

讓機器「下筆若有神」,涉及到的就是天然語言處理(NLP)技術了,其實依據 NLP 讓機器幫助人工寫做的技術早已不是新鮮事,前兩年人工智能最火熱的時候,關於 「AI 寫新聞稿,記者要失業」、「AI 寫劇本,編劇要下崗」等新聞甚囂塵上,對於 AI 致使文字工做者失業的討論也是學術界、產業界喜歡探討的話題。性能

對於這種技術能力,在市場上咱們常聽到的稱呼則是「智能寫做」,它能夠普遍應用於各類業務場景中。學習

咱們以電商場景爲例,在電商產品頁面,經過點擊商品標題、商品詳情,到最終的下單行爲,圖文的感染力是左右用戶的實在緣由,並且隨着電商平臺體量增大,必然會面臨須要更快更優質的內容以實現電商轉化率地提高。但人工寫做很難知足電商場景的效率和成本要求,「智能寫做」這時候就能夠發揮出獨有優點。測試

那麼「智能寫做」在京東有哪些應用?涉及到哪些關鍵性技術?其在京東 618 又發揮了什麼做用呢?帶着這些問題,咱們採訪到了京東智聯雲平臺產品經理,天然語言處理與智慧內容營銷產品負責人朱林倉。ui

image.png

什麼場景適合讓機器代替人工?重複性的勞動。在寫做這件事上,把一些能找到規律的、大批量、短期內需產出的內容讓機器輸出,自己對於商業來講,具備成本優點效率優點編碼

從成本角度講,一個系統一我的操做就能生產出 10 倍於人工的營銷文案,這樣的場景中技術是必定佔優點的,並且當前的技術能力已經達到了替代部分人工的經濟可行性和技術可行性。人工智能

從效率角度講,機器可以經過數據分析,經過更精細的數據挖掘維度和非結構化營銷內容的數據化與結構化,有效提高營銷轉化率,進而提高單位流量成本下的 GMV 收益。spa

因此智能寫做在電商場景中的應用是很是佔優點的。同時也解決了品牌方、消費者和內容生產方三方的難題:品牌方所投放內容轉化訂單金額提高困難、消費者面對導購內容與商品不一致的平臺使得選擇成本增高,體驗變差、內容生產方人工成本居高不下,資料蒐集時間長,內容審覈修訂,素材產出效率低。

目前,京東的「智能寫做」更多應用在自身平臺——京東APP上:京東【發現好貨】頻道、京小智智能客服、京東搭配購、社交電商京粉、人機交互寫做等。

image.png

image.png

智能寫做可以針對不一樣羣體採用不一樣營銷策略,以及不一樣風格的營銷文案,從而提升營銷轉化率。具體是如何實現的呢?京東 AI 研究院提出了基於商品要素的多模態摘要模型,論文發表在 AAAI2020 上,可基於商品要素進行可控的文案生成。

這也得益於京東原創的商品元素體系,首先根據用戶的行爲(瀏覽、點擊、加購、下單、評論、分享等)識別用戶感興趣的商品要素——根據這些要素指定模型要生成的文案必須包含的商品要素——利用京東提出的基於商品要素可控的文案生成相應文案。

_在京東 APP,經過 AI 創做的數十萬商品營銷圖文素材,_不只填補了商品更新與達人寫做內容更新之間的巨大缺口,也提高了內容頻道的內容豐富性。同時,AI 生成內容在曝光點擊率、進商品詳情轉化率等方面,其實都表現出了優於人工創做營銷的內容。

另外,在其餘的互聯網場景中,智能寫做也在大放異彩。好比:店鋪裝修運營、廣告創意創做等場景下,將重複工做由 AI 技術完成,創意工做由 AI 構建數據支持和洞察支持,人機協同創做更高效的創意營銷內容。還有直播場景下,AI 能夠輔助主播創做黃金話術、實時洞察消費者情緒變化與直播間的消費者需求分佈等。

image.png

京東「智能寫做」依靠的關鍵技術就是多模態異構數據自動摘要技術。

經過輸入多模態(圖片+文本)、異構(結構化商品知識圖片和非結構化純文本)數據,挖掘賣點和商品要素,模型包括多模態的編碼器和解碼器、預訓練語言模型提升文本合規性、句間流暢度模型提升文本邏輯性、標點糾錯模型改正標點錯誤,最終輸出商品的營銷短文。

image.png

在這裏,經過解讀京東 AI 研究院入選 AAAI 2020 的兩篇論文,你們對智能寫做涉及到的模型將能有更好的瞭解。論文標題爲:《Aspect-Aware Multimodal  Summarization  for  Chinese  E-Commerce  Products》、《Keywords-Guided Abstractive Sentence Summarization》,分別介紹了基於商品要素地多模態摘要模型和基於關鍵詞指導的生成式句子摘要方法。

關於論文能夠點擊如下連接瞭解詳情:

* 《Aspect-Aware Multimodal  Summarization  for  Chinese  E-Commerce  Products》論文解讀

*《Keywords-Guided Abstractive Sentence Summarization》論文解讀

image.png

自動文本摘要是 NLP 領域中的一個傳統任務,提出於 20 世紀 50 年代,其目標就是基於給定的文本,生成一段包含其中最重要信息的簡化文本。經常使用的自動文本摘要方法包括抽取式自動文摘(Extractive Summarization) 和生成式自動文摘(Abstractive Summarization)。抽取式自動文摘經過提取給定文本中已存在的關鍵詞、短語或句子組成摘要;生成式自動文摘則是經過對給定文本創建抽象的語意表示,利用天然語言生成技術,生成摘要。

京東提出的方法則是融合了抽取式自動文摘和生成式自動文摘,在 Gigaword 句子摘要數據集上與對比模型相比,也取得了更好的性能。

如何讓句子「由長變短」呢?京東提出的想法是:輸入文本中的關鍵詞能夠爲自動文摘系統提供重要的指導信息。這一過程就是:首先將輸入文本和參考摘要之間重疊的詞(停用詞除外)做爲 Ground-Truth 關鍵詞,經過多任務學習的方式,共享同一個編碼器對輸入文本進行編碼,訓練關鍵詞提取模型和摘要生成模型,其中關鍵詞提取模型是基於編碼器隱層狀態的序列標註模型,摘要生成模型是基於關鍵詞指導的端到端模型。

關鍵詞提取模型和摘要生成模型均訓練收斂後,利用訓練好的關鍵詞提取模型對訓練集中的文本抽取關鍵詞,利用抽取到的關鍵詞對摘要生成模型進行微調。測試時,利用關鍵詞提取模型對測試集中的文本抽取關鍵詞,最終利用抽取到的關鍵詞和原始測試集文本生成摘要。

這其中的重點動做可總結爲如下幾點:

  1. 經過採用多任務學習框架來提取關鍵詞和生成摘要;
  2. 經過基於關鍵字的選擇性編碼策略,在編碼過程當中獲取重要的信息;
  3. 經過雙重注意力機制,動態地融合了原始輸入句子和關鍵詞的信息;
  4. 經過雙重複制機制,將原始輸入句子和關鍵詞中的單詞複製到輸出摘要中。
  5. 在標準句子摘要數據集上,京東驗證了關鍵詞對句子摘要任務的有效性。

image.png

商品摘要任務的挑戰性在於:一方面,商品給顧客的第一印象來自該商品的外觀,這對顧客的購買決策有着相當重要的影響。所以,商品摘要系統必須可以充分挖掘商品視覺信息,反映商品的外觀特點。另外一方面,不一樣的產品有不一樣的賣點。例如,緊湊型冰箱的優勢是節省空間,而環保型冰箱的優勢是節能。所以,商品摘要應該反映商品最獨特的方面,從而最大限度地促成消費者的購買。

京東 AI 研究院提出的這一電商商品的多模態摘要模型,將商品圖像、產品標題和其餘產品描述做爲輸入,生成商品文本摘要。有效地整合了商品的視覺和文本信息。

image.png

這裏對於文本信息的整合很好理解,那麼這一模型是怎麼理解圖像信息的呢?

京東 AI 研究院提出的這一模型基於指針 - 生成器網絡(Pointer-Generator)。採用了三種策略將商品圖像信息融入模型中,包括使用商品圖片的全局特徵初始化編碼器,使用商品圖片的全局特徵初始化解碼器,以及使用商品圖片的局部特徵,經過注意力機制生成圖片上下文向量參與解碼。

image.png

這使得京東的智能寫做能夠更層次化地理解商品圖像。第一,經過 R-CNN 挖掘有價值的局部特徵,例如冰箱的面板、手機的屏幕,將其融入到文本解碼的每一步中,使模型針對商品有賣點的局部進行描述;第二,經過 ResNet 挖掘商品全局特徵,該特徵和文本全局特徵一塊兒,對編碼器和解碼器初始狀態進行賦值,從而從更多的角度豐富商品的特徵,提升商品的可區分度,生成更加多樣化的文案。

image.png

2019 年 2 月底,在【發現好物】的頻道內實踐智能寫做功能,它幫助了京東零售生成多種風格文案,包括屬性類描述、體驗類描述、官方單品描述、搭配商品描述、社交體等,涵蓋京東 2700 餘個三級類目。文案人工審覈率超過 99%,曝光點擊率高出達人寫做 40%,累計引單金額超過一億。

並且今年京東 618,【發現好貨】的 AI 內容導購,AI 內容是人工創做內容曝光點擊率的 1.4 倍。另外在京小智智能客服,智能生成了數百萬營銷文案,天天至關於超過 500 個文案編輯人員的工做量。

在 NLP 基礎技術研究上,京東將來將強化電商領域語言模型,強化 NLP 應用技術研究,在商品理解和營銷內容理解方面更加深刻營銷場景。

後續,京東「智能寫做」還將覆蓋更多題材的內容營銷導購頻道,將商品營銷內容理解能力、賣點挖掘與賣點包裝能力,更多的賦能商家店鋪裝修、廣告文案創意等場景。同時在這項能力的迭代上,提供千人千面的個性化文案,短文、長文、直播話術等多題材智能創做、營銷內容智能診斷。

點擊"閱讀原文",京東助您下筆若有神!

image.png

相關文章
相關標籤/搜索