金融科技之量化文本研究框架

            文本系列主要重新聞,投資者討論,研報三個文本源開展量化投資研究。新聞是通常是事實性描述,投資者討論是情緒性文本,而研報更多的是邏輯性文本。算法 1. 探索新聞與股價網絡 數據來源:雪球網上的4000條;財經類網站包括新浪財經,鳳凰財經等。框架 問題的關鍵是爬蟲任務的持續性,天天都要定時爬取事先指定的網站清單。大數據 模型的好處是不須要用戶對新聞進行標註,系統能夠自動實現對新
相關文章
相關標籤/搜索