Tinghua Data Mining

Learning Resources算法

書籍:服務器

期刊:工具

業界先驅:3d

開闊視野,掌握業界最新動態。orm

工具:blog

數據挖掘是不少學科的綜合體:ci

甭管叫什麼名字,歸根到底都是數據挖掘:it

Comprehensive Learning:數據挖掘

Learning != Listeningio

數據

What is Big Data?

Big Data:

Data Mning

Data Integration & Analasis

The Process of Data Mining

DM Techniques -- Classification

Classification Boundaries

Classification -- Overfitting

Confusion Matrix

Receive Operating Charactics

男人 女人 身高

DM Techniques -- Clusting

Hierrachical Clusting

不一樣層面分組

Association Rule

關聯規則

DM Techniques -- Regression

參數和變量之間是線性的 不是說最終的表達式線性的

Overfitting -- Regression

死記硬背

既沒有那麼簡單 也沒有那麼複雜

Seeing is Knowing

耳聽爲虛 眼見爲實 高維數據直接很難理解 發揮人的知識的儲備 主觀能動性 領域知識的綜合理解能力 可視化 對於用戶來講 挖掘出來的東西給 可解釋性

Performance Dashborad

Tableau

可視化工具軟件

Data Preprocessing

Gabage In Gabage Out

髒數據輸入 必定會髒數據輸出

預處理很重要 準確性 時效性 完整性

原材料要好 打地基 不然外面再modern也是豆腐渣工程

Privacy Protection

Cloud Computation

買 租 服務器

把軟硬件轉換成一種服務

Parrelal Compututing

The Big Picture

數據挖掘三要素:數據,模型,算力(支撐平臺)

No Free Lunch

分類 聚類 告訴我一個哪個算法不就好了 不行 沒有那麼好的事 參數 經驗嘗試

拿到一個問題,先找簡單的,說不定能夠,夠用就好了。沒有必要一味地去追求看起來很複雜或者很高端的算法。

量化交易:克服人內在的性格弱點。更加理性。

Grouping

正相關,負相關,可能存在內在的分組的情形。

看問題要全面

相關文章
相關標籤/搜索