JavaShuo
欄目
標籤
最近遇到的問題,待整理
時間 2019-12-08
標籤
最近
遇到
問題
整理
简体版
原文
原文鏈接
介紹在PE的產篩算法針對本身的項目,上採樣,下采樣若是適用?
本身項目中,Pandas處理樣本數據量(百萬級)
是否熟練適用sql,我回答說大部分是用的mongodb
是否適用過度布式圖計算,大數據平臺
t test 如何解釋
顯著性檢驗,P value 如何解釋
迴歸算法的假設條件
用過哪些基礎算法?(邏輯迴歸,樹模型,模型調參gird_search是默認都會的)
線性迴歸(廣義的線性迴歸瞭解過嗎?)(能夠參考
http://www.javashuo.com/article/p-cjrjvqrm-es.html
爲)
PCA降維的原理(線性代數的本質角度去理解或者按照知乎的文章去理解,此處須要整理)
隨機森林中的feature importance是如何計算出來的(第一條連接解釋的最爲詳細,能夠參考
https://stats.stackexchange.com/questions/162162/relative-variable-importance-for-boosting
,
https://stackoverflow.com/questions/34218245/how-is-the-feature-score-importance-in-the-xgboost-package-calculated
,
http://www.javashuo.com/article/p-undiasof-gt.html
)(
http://www.javashuo.com/article/p-bghajdgy-o.html
,
https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#giniimp
)
GBDT 中的feature importance (
https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/ensemble/gradient_boosting.py
)
有沒有了解過相應的計算方法?(我回答的按照gini係數或者信息增益,實際上是分支的時候的特徵選擇)
隨機森林中的隨機體如今哪些方面?Bootstrap 取樣的方式?
甲乙兩人擲硬幣,誰先擲硬幣的正面誰贏,問甲先擲硬幣贏得機率?
論文中算法的復現能力,主要是code能力
特徵工程(
http://www.cnblogs.com/jasonfreak/p/5448385.html
)
什麼邏輯迴歸模型要使用 sigmoid 函數?
廣義模型推導所得
知足統計的最大熵模型
性質優秀,方便使用(Sigmoid函數是平滑的,並且任意階可導,一階二階導數能夠直接由函數值獲得不用進行求導,這在實現中很實用)
邏輯斯蒂迴歸常見的問題
http://www.javashuo.com/article/p-efupxmyy-bx.html
\[ \begin{array} { l } { \log i t ( \mathrm { x } ) = \ln \left( \frac { P ( \mathrm { y } = 1 | \mathrm { x } ) } { P ( \mathrm { y } = 0 | \mathrm { x } ) } \right) } \\ { = \ln \left( \frac { P ( \mathrm { y } = 1 | \mathrm { x } ) } { 1 - P ( \mathrm { y } = 1 | \mathrm { x } ) } \right) = \theta _ { 0 } + \theta _ { 1 } x _ { 1 } + \theta _ { 2 } x _ { 2 } + \ldots + \theta _ { m } x _ { m } } \end{array} \]
feature importance sklearn GBDT(gradient boosting decision tree 中feature importance 源碼理解)
先計算出每棵decision tree中的特徵重要性
而後特徵在全部樹中的重要性的平均值
計算每一個特徵的相對重要性(歸一化)
相關文章
1.
整理一下最近遇到的ie8兼容問題
2.
最近遇到的編譯器問題
3.
最近面試遇到的問題
4.
最近遇到的qt問題
5.
H5開發遇到的問題整理
6.
jmeter遇到過的問題整理
7.
最近hadoop遇到的issuses
8.
最近在弄ionic3的時候遇到的一些問題(遇到就更新)
9.
最近遇到的一個MongoDB索引順序的問題
10.
最近遇到的還未解決的問題
更多相關文章...
•
PHP imagecolorclosest - 取得與指定的顏色最接近的顏色的索引值
-
PHP參考手冊
•
Redis悲觀鎖解決高併發搶紅包的問題
-
紅包項目實戰
•
PHP Ajax 跨域問題最佳解決方案
•
☆技術問答集錦(13)Java Instrument原理
相關標籤/搜索
遇到的問題
待遇
最新的外企待遇
遇到
安裝Ubuntu 遇到問題
最近
理論問題
處理問題
問題處理
我的整理
NoSQL教程
MySQL教程
SQLite教程
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
部署Hadoop(3.3.0)僞分佈式集羣
2.
從0開始搭建hadoop僞分佈式集羣(三:Zookeeper)
3.
centos7 vmware 搭建集羣
4.
jsp的page指令
5.
Sql Server 2008R2 安裝教程
6.
python:模塊導入import問題總結
7.
Java控制修飾符,子類與父類,組合重載覆蓋等問題
8.
(實測)Discuz修改論壇最後發表的帖子的鏈接爲靜態地址
9.
java參數傳遞時,究竟傳遞的是什麼
10.
Linux---文件查看(4)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
整理一下最近遇到的ie8兼容問題
2.
最近遇到的編譯器問題
3.
最近面試遇到的問題
4.
最近遇到的qt問題
5.
H5開發遇到的問題整理
6.
jmeter遇到過的問題整理
7.
最近hadoop遇到的issuses
8.
最近在弄ionic3的時候遇到的一些問題(遇到就更新)
9.
最近遇到的一個MongoDB索引順序的問題
10.
最近遇到的還未解決的問題
>>更多相關文章<<