面試中一些有用的算法題目講解:php
關於funf的一些東西:html
http://inabox.funf.org/info/python
「結構之法,算法之道」博客linux
http://www.cnblogs.com/v-July-v/archive/2011/06/14/2770530.htmlandroid
1,lda各類語言的開源實現c++
http://www.zhizhihu.com/html/y2010/1465.htmlgit
2,集中開源數據挖掘工具github
numpy tutial :http://wiki.scipy.org/Tentative_NumPy_Tutorialweb
scikit-learn:https://pypi.python.org/pypi/scikit-learn/0.13.1面試
http://scikit-learn.org
其中涉及模型檢驗的部分:
http://scikit-learn.org/stable/modules/model_evaluation.html
http://scikit-learn.org/stable/modules/cross_validation.html
http://scipy-lectures.github.io/advanced/scikit-learn/index.html
http://matplotlib.org/examples/index.html
分類器的評價標準(TPR,FPR,ROC)
http://blog.csdn.net/marising/article/details/6543943
具體實現(包括TPR,FPR,ROC,predition,recall,F_beta的計算):
http://scikit-learn.org/stable/modules/model_evaluation.html#receiver-operating-characteristic-roc
交叉驗證的實現:
http://scikit-learn.org/stable/modules/cross_validation.html
weka:
http://www.cs.waikato.ac.nz/~ml/weka/
關於推薦:
http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html
crab:http://muricoca.github.io/crab/
pip:http://www.saltycrane.com/blog/2010/02/how-install-pip-ubuntu/
介紹機器學習的各類開源網站門戶:http://www.open-open.com/lib/view/open1364432241437.html
weka學習篇:
linux安裝weka:
3,優秀論文集
http://googledata.org/uncategorized/excellent-papers-for-2012/
LDA數學八卦中提到的關於LDA實現的網站:http://code.google.com/p/plda/
4,django網站
http://djangobook.py3k.cn/2.0/chapter01/
http://djangobook.py3k.cn/2.0/
http://djangobook.py3k.cn/2.0/
http://docs.python.org/2/tutorial/
5,一個微博數據爬取工具
6,android開源框架afinal
https://github.com/yangfuhai/afinal
7,MIT關於手機數據挖掘的網站
http://realitycommons.media.mit.edu/
http://www.media.mit.edu/
funf的官方文檔:
http://code.google.com/p/funf-open-sensing-framework/wiki/StoringData
關於行爲建模比賽的一個網址:
http://www.umiacs.umd.edu/conferences/sbp2012/paperaward.html
7,c++的庫函數(至關於api)
http://www.cplusplus.com/reference/
python:
http://docs.python.org/2/library/
8 相關數據集:
http://grouplens.org/datasets/movielens/
9,和電視相關的一些論文的連接
http://www.tandfonline.com/action/showMostCitedArticles?journalCode=hbem20#.UqhkNs9Dt0w
10,一個類似話題檢測的東西
http://blog.csdn.net/liuaigui/article/details/6897314
一些博客收集:
白話經典算法系列(講解排序實現,冒泡、歸併、選擇、插入、快速排序等):http://www.cnblogs.com/morewindows/category/314533.html
算法中的數學原理(svd,lda,lsi等淺顯可是挺妙的解釋):
http://www.cnblogs.com/LeftNotEasy/
recommation:
python實現的一個簡單的推薦系統: http://www.ocelma.net/software/python-recsys/build/html/
其源代碼位置:https://github.com/ocelma/python-recsys
和論文相關的:
http://www.wikicfp.com/cfp/home
http://www.myhuiban.com/index.php?sort=location
一個可視化做圖的網站:
http://www.jasondavies.com/wordcloud
word2vec
https://code.google.com/p/word2vec/
http://blog.csdn.net/zhaoxinfan/article/details/11069485
http://www.douban.com/note/298095260/