渣排版預警!code
出發點
新聞用戶爲何會點:
主觀:用戶興趣/熱點事件
客觀:新聞標題(新聞入口)/新聞內容(更簡單,更有趣)事件
標題分類:
surprise,好奇,負例,數字,你,客觀的描述,問題的形式 。。。。io
咱們這個目標就是創建問題的形式。test
ABtest:
question形式點擊基本爲15%,非question爲13%(雖然abtest感受不太標準。效率
用戶的好奇心。方法
任務 Task
1.原文中直接抽取標題
2.摘要式抽取標題,理解完文本以後,本身生成word
1.句法樹
2.seq2seqco
給輸入的新聞文本,經過seq2seq產生headline數字
解決方法
seq2seq,rnn處理。每一個單元替換成爲lstm,GRU(核心都是經過gate來保留信息)
gru效率比lstm高,並且更簡單,故選擇gru生成
用attention mechanism去作的標題生成
word encoder是BI-Gru處理:正向信息和反向信息
sentence encoder也是一個bi-gru
實驗評價結果 很牛逼