做者:Esquirrel
連接:https://zhuanlan.zhihu.com/p/24674409
來源:知乎
著做權歸做者全部。商業轉載請聯繫做者得到受權,非商業轉載請註明出處。
筆者是在醫療AI領域奮鬥的博士go,假期一直在信號領域探索前沿,閱讀不少
時間序列/信號處理領域的paper,無論是作股票預測的、仍是音樂推薦、疾病診斷、方法上都有不少相似之處,順手收錄了一些公開的數據集,分享給你們測試本身的算法,歡迎交流、轉發,謝謝。
#UCR Time Series
時間序列界的「Imagnet」,發文章必跑數據集,由某大牛課題組維護 (不過15年以後貌似就沒怎麼維護了)
www.cs.ucr.edu/~eamonn/time_series_data/
Yanping Chen, Eamonn Keogh, Bing Hu, Nurjahan Begum, Anthony Bagnall, Abdullah Mueen and Gustavo Batista (2015). The UCR Time Series Classification Archive. URL
#音樂數據庫
目前我找到的最大的音樂公開數據庫(Million),作音樂推薦、分類的朋友應該會喜歡
http://labrosa.ee.columbia.edu/millionsong/
The Million Song Dataset is a freely-available collection of audio features and metadata for a million contemporary popular music tracks.
http://grh.mur.at/sites/default/files/mir_datasets_0.html
#臨牀監護數據
顱內腦電癲癇數據html
UPenn and Mayo Clinic's Seizure Detection Challenge | Kaggle算法
UPenn and Mayo Clinic's Seizure Detection Challenge數據庫
MIMIC Critical Care Database
MIMIC-II to MIMIC-III
MIMIC is an openly available dataset developed by the MIT Lab for Computational Physiology, comprising deidentified health data associated with ~40,000 critical care patients. It includes demographics, vital signs, laboratory tests, medications, and more.
#股票數據
1990-2016年股票數據:連接:
http://pan.baidu.com/s/1i44IQ3N 密碼:o9hj
以上只是很小很小的一部分,後續不按期更新ing
歡迎轉發!!!
(你們有知道其餘相關數據集能夠評論區留言,萬分感謝)ide
以前發表的【醫學影像開源數據集-持續更新中】知乎專欄
原文:https://zhuanlan.zhihu.com/p/24674409測試