數據分析:對歷史規律的展示、對將來數據的預測。html
機器學習:機器學習是指從一系列的原始數據中找到規律,提取人們能夠識別的特徵,而後經過學習這些特徵,最終產生一個模型。java
流程:原始數據-->特徵提取-->模型。機器學習偏向於算法。算法
人工智能:Artificial Intelligence, AI,亦稱機器智能,是指利用計算機來對人的意識、思惟信息過程、智能行爲進行模擬(如學習、 推理、 思考、 規劃等)和延伸,使計算機能實現更高層次的應用。人工智能基於機器學習偏向於應用。數據庫
數據挖掘:綜合運用機器學習和人工智能技術來解決生產或生活中的問題,是一個過程,一個解決方案。安全
基礎層(基礎資源):微信
計算資源:學習數據的過程,若是資源不足將致使訓練時間很是的漫長。網絡
數據資源:數據要保證可靠、充分、準確架構
技術層:算法、算法底層支撐的框架、算法運行環境、友好的建模界面框架
應用層:人工智能只是一種技術,不是一個行業,須要和各個行業進行結合,才能發揮價值。所以須要懂技術,還要懂業務。機器學習
從整我的工智能項目要經歷的階段來看
基礎層:數據收集-->數據理解-->數據處理-->
技術層:特徵提取-->模型構建-->模型評估-->模型訓練-->
應用層:模型應用
機器視覺:將被攝目標的形態信息、像素分佈和亮度、顏色等信息,轉變成數字化圖像信號,傳送給圖形處理系統;好比手機的AI攝像頭對照片進行美化。
生物識別:經過計算機,與光學、聲學、生物傳感器、統計學的概念手段結合,利用人體固有的身體特徵、行爲特徵進行我的身份的鑑定。好比人臉、指紋、虹膜等。通常將特徵分爲兩類:靜態特徵 和 行爲特徵(或動態特徵)
專家系統:模擬人類專家解決領域問題的系統。數據庫裏包含含有大量的某個領域專家水平的知識與經驗,跟進用戶的諮詢,進行推理和判斷,模擬人類專家的決策過程。好比智能客服,可以進行自我學習,天貓雙11 80%以上是智能客服完成的。好比券商的智能投顧。
編碼遺傳:AI系統利用遺傳算法和圖靈完備語言開發的程序理論上可以完成任何類型的任務。好比基因改造、基因測序,這一塊屬於較敏感的話題。
機器人學:機器人是一個綜合性的人工智能產品。應用機器的視覺觸覺聽覺等技術、機器人語言和智能控制軟件等,來承擔危險的事務。好比能夠參與到人不可觸及、高危的場景
舉例:生物識別的通用流程
人工智能的核心是機器學習,機器學習的核心是算法。常見的算法能夠分爲兩大陣營:
一、傳統的機器學習算法:主要解決一些簡單的應用場景以及結構化的數據。
二、非傳統的機器學習算法:主要解決一些比較複雜的應用場景以及非結構化的數據或者多樣化的數據。
常見的算法:
有監督學習:有feture和label;業務系統提供的數據源知道緣由又知道結果,根據緣由找結果,此時稱之爲有監督的學習,
非監督學習:只有feture;業務系統提供的數據源不知道會產生什麼結果,此時稱之爲非監督的學習。 百度百科:指在沒有類別信息狀況下,經過對所研究對象的大量樣本的數據分析實現對樣本分類的一種數據處理方法。
半監督學習:二者的結合。
分類算法:看label的類型。若是label離散型變量,二分類/多分類。 好比線性迴歸算法
迴歸算法:連續性變量,好比預測股票價格、交通流量等。好比邏輯迴歸、決策樹、樸素貝葉斯、支持向量機。
隨機森林、K-近鄰、神經網絡便可作迴歸,也可作分類。
強化學習:根據環境來調整學習xiao,反饋機制,每一階段其實仍是傳統算法
房子有不少的屬性,好比面積、樓層、朝向、學區、交通是否便利等等。利用機器學習,基於已經賣掉的房子數據能夠訓練出一個房價和房子衆多屬性之間的關聯函數,之後在房子估價時只須要輸入參數到模型中,就能夠輸出房子能夠賣多少錢。這是一個典型的機器學習的迴歸模型的應用。
根據你每次買蘋果的口味進行決策,最終選出最適合你的口味,這屬於二分類問題,這是一個典型的機器學習決策樹模型的應用。
本章節從業務溝通與業務目標確認、業務問題轉換爲機器學習問題、常規建模流程、模型/業務解釋四個方面進行說明。
甲方:對本身的業務比較瞭解,但建模水平可能還達不到企業的自身要求。
乙方:建模技術、建模經驗比較充分,具備必定的業務,但還須要和甲方進行深刻溝通。
注意:在項目過程當中,任什麼時候候都要注意數據安全和數據隱私。
建模不是調算法,而是須要從業務自己出發,最終目的是爲了業務提高。
數據與目標:有哪些數據?想作什麼?以前是怎麼作的?以前結果有什麼不滿意?
作法與思路:能不能用機器學習方法來作?如何轉換爲機器學習問題以及優先級?
應用於評估:訓練出來的模型怎麼用?指望達到什麼樣的效果(業務角度的效果)?
在用人工智能技術解決真實業務問題以前,須要思考:
溝通需求與業務目標
明確是不是機器學習的範疇以及是哪一種問題
明確人工智能建模流程
預設各階段的開發週期和檢驗標準
肯定最終模型使用方式
明確最終模型的效果評估方式
階段概要說明:
數據收集:ETL
數據理解:數據表明業務
數據處理:數據的準確性、數據的質量。
特徵提取:兩種方式。一:基於人對業務經驗的瞭解,可能存在人爲因素。二:用一些神經網絡的方法,基於數據自己的特徵進行加工和特徵提取,但只能提取通用的規律。各有利弊
模型構建:選擇算法
模型評估:評估模型、優化模型。
模型最終是否能產生價值,還須要業務推進、調整,所以須要和業務進行充分、反覆的溝通,確認目標、確認作工做的方式和效果。
最終必定要轉化爲業務語言,指導業務。
微軟 主要 研究大數據(城市計算)、智慧醫療、知識圖譜(微軟認知服務),NLP(機器翻譯、實時語音翻譯、微軟小英、微軟小冰),計算機視覺等領域。
百度研究院 下設 深度學習實驗室(IDL)、大數據實驗室(BDL)、硅谷人工智能實驗室(SVAIL)、商業智能實驗室(BIL)、機器人與自動駕駛實驗室(RAL)、認知計算實驗室(CCL)、量子計算研究所(IQC);多模態深度語義理解的百度大腦3.0,Apollo平臺;
騰訊AI實驗室 遊戲類AI,圍棋AI(絕藝)、王者榮耀AI(絕悟)等
華爲諾亞方舟實驗室 計算機視覺、推薦與搜索、AI基礎理論、語音和語言處理、決策與推理等
阿里巴巴達摩院 分爲機器智能、數據計算、機器人、金融科技、X實驗室共5大研究領域,14個實驗室。產品:人工智能芯片平頭哥。
一、深度神經網絡:解開神經網絡的工做原理
二、模糊計算:以模糊集理論爲基礎,它能夠模擬人腦非精確、非線性的信息處理能力
三、強化深度學習:與環境交互以解決業務問題
四、生成對抗網絡:配對神經網絡刺激學習,減輕處理負擔
五、混合學習模式:模型融合,提升模型準確性
六、自動化機器學習:自動化建模、讓AI更智能。
星環科技企業級人工智能平臺SOPHON
目的:幫助企業用戶以可視化方式實現人工智能的快速落地
功能:數據導入、數據預處理、特徵工程、模型訓練、模型驗證、模型部署、模型應用等
產品優點:自動建模技術、全場景工具、優化的分佈式算法、多數據融合、微服務部署、全流程圖形化、多用戶協做、流式機器學習、多種計算框架、工做流調度等。
5.1 基於關聯分析的經典案例:沃爾瑪的啤酒尿布
5.2 迴歸預測:好比新冠肺炎疫情的預測
5.3 知識圖譜:好比超級傳播者的識別
5.4 天然語言處理NP:好比垃圾郵件檢測與分類
5.5 神經網絡(深度學習):人臉識別VS豬臉識別
5.6 強化學習(深度學習):好比電子競技-AI dota。AI選手訓練量驚人,至關於天天可打200萬局dota;256塊GPU,12.8萬個CPU核心
5.7 人工智能應用領域
歡迎關注個人我的公衆號「碼大叔」,也能夠加個人我的微信:qiaojs,咱們一塊兒java相關的交流學習!
本文是我觀看星環科技AI工程師公開培訓視頻的學習筆記,拿出來和你們一塊兒分享學習,版權歸星環科技全部。你們也能夠直接去觀看視頻,老師講的更爲詳細。
B站直播地址:https://live.bilibili.com/21878856,免費噢(星環科技最近不定時有不少大數據、雲計算、人工智能相關的分享)
AI講師:孫國庫 星環科技AI架構師&金牌講師
感謝星環科技孫老師的精彩分享!
原文出處:https://www.cnblogs.com/madashu/p/12572184.html