2019年3月1日14:30:47html
學習階段可用的數據集:python
Kaggle 網址:https://www.kaggle.com/datasets算法
UCI 數據集網址:http://archive.ics.uci.edu/ml/安全
scikit-learn 網址:http://scikit-learn.org/stable/datasets/index.html#datasets網絡
https://scikit-learn.org/stable/框架
實現代碼量比較少。機器學習
2.安裝 ide
pip3 install Scikit-learn==0.19.1函數
安裝以後檢查是否安裝成功的命令:學習
import sklearn
注:安裝scikit-learn 須要Numpy,Scipy等庫
https://www.jianshu.com/p/ce85f5bd900f
那麼應該怎麼解決呢,其實很簡單, 編輯 /usr/bin/pip
文件,修改代碼
from pip._internal import main
另存爲時,提示沒有權限保存。
sudo chmod 600 ××× (只有全部者有讀和寫的權限)
sudo chmod 644 ××× (全部者有讀和寫的權限,組用戶只有讀的權限)
sudo chmod 700 ××× (只有全部者有讀和寫以及執行的權限)
sudo chmod 666 ××× (每一個人都有讀和寫的權限)
sudo chmod 777 ××× (每一個人都有讀和寫以及執行的權限)
若分配給某個文件全部權限,則利用下面的命令:
sudo chmod -R 777 文件或文件夾的名字(其中sudo是管理員權限)
---------------------
做者:langzi7758521
來源:CSDN
原文:https://blog.csdn.net/langzi7758521/article/details/51190425
版權聲明:本文爲博主原創文章,轉載請附上博文連接!
3.Scikit-learn 包含的內容
2019年3月1日10:53:24
https://www.bilibili.com/video/av39137333?from=search&seid=10652255103060463445
1>.獲取數據
2>.數據處理(數據判斷)
3>.特徵工程(將數據處理成:更能直接被使用的數據 (特徵值))
4>.機器學習算法進行訓練---獲得---模型。
5>.模型評估(若是不合適,從新進行(2)數據處理)
學習機器學習時,重點:
(1)算法是核心,數據與計算是基礎
(算法的改進、數據的積累、數據進行訓練須要硬件設備的支持)
(2)找準定位
大部分複雜模型的算法設計都是算法工程師在作,咱們須要
當前重要的是:掌握一些機器學習算法等技巧,從某個業務領域切入解決問題。
看到這篇博客記錄的挺詳細 https://blog.csdn.net/u010164190/article/details/79114889
https://blog.csdn.net/u013063153/article/details/54728628
簡介: 基於 python 的第三方庫,用於數據挖掘與數據分析,簡單易用,以統計機器學習爲主(深度學習相關框架參考以後的各個框架)。基於 NumPy, SciPy, matplotlib, 免費開源。
開源協議: BSD 2.0
深度學習框架
(1)Google:
二、Tensorflow
(2)FaceBook:
三、Pytorch
四、Caffe2
(3)
theano 能夠看作是TensorFlow的前身
Chainer 能夠看作是pytorch的前身
2019年2月27日10:01:14
https://www.bilibili.com/video/av39137333?from=search&seid=10652255103060463445
達特茅斯會議(1956年8月)-人工智能的起點
在美國漢諾斯小鎮 達特茅斯學院
約翰-麥卡錫(John McCarthy)
馬文-閔斯基(Marvin Minsky,人工智能與認知學專家)
克勞德-香農(Claude Shannon,信息論的創始人)
用機器來模仿人類學習以及其餘方面的智能。
1956年,也就成爲了人工智能元年。
機器學習和人工智能、深度學習的關係:
機器學習的應用場景很是多,滲透到了各個行業領域中,醫療、航空、教育、物流、電商等領域的各類場景。
當前重要的是掌握一些機器學習算法等技巧,從某個業務領域切入解決問題。
機器學習是從數據中自動分析得到模型,並利用模型對未知數據進行預測。
機器識別貓和狗。從數據(大量的貓和狗的圖片)中自動分析得到模型(辨別貓和狗的規律),
從而使機器擁有識別貓和狗的能力。
預測房屋價格。從(房屋的各類信息)中自動分析得到模型(判斷房屋價格的規律),從而使機器擁有預測房屋價格的能力。
從歷史數據當中得到規律? 這些歷史數據是怎樣的格式?
一般把機器學習的數據叫作:數據集。
學習目標
(1)目標值:類別- 分類問題。
貓和狗的區別。就屬於分類問題。
(2)目標值:連續型的數據-迴歸問題。
房屋價格。連續型數據。
(3)當沒有目標值時,=無監督學習。
人物的各個屬性信息。
2019-01-22 19:47
該筆記摘自:慕課網-深度學習的某一篇課程。
深度學習是以神經網絡爲基礎的。
講述神經網絡學習入門。
神經網絡是機器學習的一種算法。
機器學習是將無序數據轉換爲價值的方法。從數據中抽取規律,並預測將來。
訓練數據,定義目標函數(找到要優化的方面),選擇相應的機器學習算法,訓練獲得模型,並應用到線上服務。最後造成循環。
數據處理(採集+去噪)
模型訓練(特徵+模型)
模型評估與優化(MSE、F1-score、AUC+調參)
模型應用(A/B測試)