Journals
ACM TKDD http://tkdd.cs.uiuc.edu/
DMKDhttp://www.springerlink.com/content/1573-756X/?p=859c3e83455d41679ef1be783e923d1d&pi=0
IEEE TKDE http://www.ieee.org/organizations/pubs/transactions/tkde.htm
ACM TODS http://www.acm.org/tods/
VLDB Journal http://www.vldb.org/
ACM Tois http://www.acm.org/pubs/tois/
Conferences
SigKDD http://www.sigkdd.org/
ICDM http://www.cs.uvm.edu/~icdm/
SDM http://www.siam.org/meetings/sdm07/
PKDD http://www.ecmlpkdd2007.org/
VLDB http://www.vldb.org/
SigMod http://www.acm.org/sigmod/
ICDE http://www.ipsi.fraunhofer.de/tcde/conf_e.html
WWW http://www.iw3c2.org/conferences
Online Resources
http://www.kdnuggets.com
http://www.chinakdd.com
網址集合 http://www.dmoz.org/Computers/Software/Databases/Data_Mining//
A google co-op search engine for Data Mininghtml
http://www.google.com/coop/cse?cx=006422944775554126616:ixcd3tdxkke
Data Mining, University of Houston算法
http://nas.cl.uh.edu/boetticher/CSCI5931 Data Mining.html
Data Mining Program, University of Central Florida http://dms.stat.ucf.edu/
Data Mining Group, University of Dortmund http://www-ai.cs.uni-dortmund.de/index.html
Data Mining, MIT OCWspring
http://ocw.mit.edu/OcwWeb/Sloan-School-of-Management/15-062Data-MiningSpring2003/CourseHome/
Data Mining Group, Tsinghua http://dbgroup.cs.tsinghua.edu.cn/dmg.html
KDD oral presentations video http://www.videolectures.net
Tools
Weka http://www.cs.waikato.ac.nz/ml/weka/
Rapid Miner(Yale) http://rapid-i.com/content/view/3/76/lang,en/
IlliMine http://illimine.cs.uiuc.edu/
Alpha Miner http://www.eti.hku.hk/alphaminer
Potter's Wheel A-B-C http://control.cs.berkeley.edu/abc/數據庫
一流的:api
數據庫三大頂級會議SIGMOD,VLDB,ICDE,數據挖掘KDD,實際相關的還有機器學習ICML,還有信息檢索的SIGIR;數據庫的理論會議PODS。機器學習
二流的:ide
EDBT,ICDT,CIKM,SDM,ICDM,PKDD,還有ECML歐洲的機器學習會議(這個應該是1.5檔的,比通常的二流好)oop
SIGMOD:97分,數據庫的最高會議,涉及範圍普遍,稍偏應用(由於理論文章有PODS)。沒說的,景仰如滔滔江水。這個會議不只是double-blind review,並且有rebuttal procedure,可謂獨樹一幟,不同凡響。
VLDB:95分,很是好的數據庫會議。與SIGMOD相似,涉及範圍普遍,稍偏應用。
從文章的質量來講,SIGMOD和VLDB難分伯仲,沒有說誰比誰更高。他們的範圍也幾乎同樣。 很多牛人都認爲,今年的rebuttal procedure其實並不怎麼成功。投稿太多,很難作到每一篇都公平公正。不少rebuttal沒人看。post
double-blind是把雙刃劍。這幾年來每一年都有人冒充牛人的風格來投稿,有的還真進去了。 反而VLDB的審稿質量一直很高。每一年的VLDB都有很理論的paper。
通常來講,我感受你們仍是認爲SIGMOD要好那麼一點點。根據我我的讀過的文章,也有這樣的感受。不過這個並不重要了,有差異也是那麼一點。
PODS:95分。是「數據庫理論的最好會議,也是一個很好的理論會議」。每一年老是co-located with SIGMOD。感受其中算法背景的人佔主流(你能夠數數PODS文章中有多少來自Motwani group),也有一部分AI背景的人(畢竟SIGART也是主辦者之一)。它的影響力遠不及SIGMOD,然而其中文章的質量比較整齊,variance小於SIGMOD(以及其餘任何數據庫會議)。有一位牛人說:「PODS never had a really bad paper,」這是它值得驕傲的地方。
KDD::full paper 95分,poster/short paper 90分。數據挖掘的最高會議。因爲歷史積累不足以及領域圈子較小,勿用諱言KDD目前比SIGMOD尚有所不如。我以爲咱們能夠這樣類比:KDD:SIGMOD=CRYPTO:STOC。學習
回顧密碼學的歷史,真正最牛的文章通常發在STOC/FOCS而非CRYPTO/EUROCRYPT,這和今天的數據挖掘何等相似!然而你看看今天的密碼學文章,已經有頂級的密碼學家(恕我不便寫出名字)再也不往STOC/FOCS投稿。我以爲一樣的事情在不久的 未來也會發生在數據挖掘中,讓咱們拭目以待。
這幾年來KDD的質量都很高。其full paper的質量高於SIGMOD/VLDB中數據挖掘方面的paper 的質量。緣由是SIGMOD/VLDB審稿人中數據挖掘的人不多,審稿標準不必定能掌握得很好。
這幾年好幾篇SIGMOD/VLDB的數據挖掘paper都follow一些KDD的paper。而在KDD,要拿一篇full paper真難。去年復旦拿了一篇,實屬難能難得。今年他們又拿了一個SIGMOD demo,說明工做的確很紮實。
據說在不少地方,若是能有一篇SIGMOD/VLDB/KDD,就能博士畢業,能有兩篇就能找到不錯的工做。「革命還沒有成功,同志仍需努力!」
ICDE:92分。很好的數據庫會議,也是一個大雜燴。好處是覆蓋面廣、包容性強,壞處是文 章水平良莠不齊。
EDBT:88分,不錯的數據庫會議,錄取率很低然而歷史積累不足,影響還明顯不及ICDE。
ICDT:88分,PODS的歐洲版,數據庫理論第二會議。
和SIGMOD/VLDB同樣,ICDE和EDBT在質量和影響上都不相上下。 其它的如CIKM,ICDM,SDM,SSDBM,PKDD等等都比以上的會議差一截。
CIKM:85分。
SDM:full paper 90分,poster/short paper 85分。SIAM的數據挖掘會議,與ICDM並列爲數據挖掘領域的第二位,比KDD有明顯差距。好像其中統計背景的人比較多,也有一部分機 器學習背景的人,比較diversified。
ICDM:full paper 90分,poster/short paper 85分。IEEE的數據挖掘會議,與SDM並列爲數據挖掘領域的第二位,比KDD有明顯差距。
PKDD:83分(由於poster/short paper數量不多,因此不予區分)。好像是KDD的歐洲版, 但與KDD差距很大。