【資源】CV大佬Szeliski-新書《計算機視覺:算法與應用(第二版)》

關注「AI科技時訊web

設爲星標,第一時間獲取更多幹貨算法




Richard Szeliski博士,計算機視覺領域的大師級人物,現爲Facebook研究科學家。Szeliski博士在計算機視覺研究方面有25年以上的豐富經驗,前後任職幹DEC和微軟研究院。1996年,他在微軟研究院任職期間,提出一種基於運動的全景圖像拼接模型,採用L-M算法,經過求圖像間的幾何變換關係來進行圖像匹配。此方法是圖像拼接領域的經典算法,Richard Szeliski也所以成爲圖像拼接領域的奠定人。微信

http://szeliski.org/RichardSzeliski.htm網絡



計算機視覺:算法與應用(第二版)app




地址:http://szeliski.org/Book/機器學習


本書萌芽於2001年,當時,華盛頓大學的Steve Seitz邀我和他一塊兒講一門課,課程名稱是「面向計算機圖形學的計算機視覺」。那個時候,計算機圖形學領域正在愈來愈多地使用計算機視覺技術,用它來建立基於圖像的真實物體的模型,用於產生視覺效果,用於經過計算攝影學技術來合併真實影像。咱們決定聚焦於計算機視覺在若干有趣問題中的應用,例如使用我的照片的圖像拼接和基於照片的3D建模等,這一想法引發了學生們的共鳴。編輯器


  從那時起,華盛頓大學和斯坦福大學就一直使用相似的課程大綱和項目導向的課程結構來進行常規計算機視覺課程的教學(在斯坦福大學,在2003年這門課程由我和David Fleet共同講授)。相似的課程大綱也被其餘不少大學所採用,並被歸入計算攝影學相關的更專業的課程。(有關如何在課程中使用本書的建議,請參見1.4節的表1.1。)性能


  本書還反映了我在企業研究實驗室(DEC劍橋研究實驗室和微軟研究院)這二十年的計算機視覺研究經歷。在從事研究的過程當中,我主要關注在真實世界中具備實際應用的問題和在實踐中行之有效的方法(算法)。所以,本書更強調在真實世界條件下有效的基本方法,而較少關注內在完美但難以實際應用的神祕的數學內容。學習


  本書適用於計算機科學和電子工程專業高年級本科的計算機視覺課程。學生最好已經修過圖像處理或計算機圖形學課程,這樣一來,即可以少花一些時間來學習通常性的數學背景知識,多花一些時間來學習計算機視覺技術。本書也適用於研究生的計算機視覺課程(經過專研更富有挑戰性的應用和算法領域),做爲基本技術和近期研究文獻的參考用書。爲此,我儘可能嘗試引用每一個子領域中最新的研究進展,即使其技術細節過於複雜而沒法在本書中涉及。測試


  在課程教學過程當中,咱們發現,要使學生從容應對真實圖像及其帶來的挑戰,讓他們嘗試實現一些小的課程設計(一般一個創建在另外一個基礎之上),是頗有幫助的。隨後,要求學生分紅組選擇各自的主題,完成最終的課程設計。(有時,這些課程設計甚至能轉換爲會議論文!)本書各章最後的習題包含有關小型中期課程設計題目的不少建議,也包含一些更開放的問題,這些問題的解決仍然是活躍的研究課題。只要有可能,我都會鼓勵學生用他們本身的我的照片來測試他們的算法,由於這能夠更好地激發他們的興趣,每每會產生富有創造性的衍生問題,使他們更熟悉真實影像的多樣性和複雜性。


  在闡述和解決計算機視覺問題的過程當中,我經常發現從三個高層途徑獲取靈感是有幫助的。


  • 科學層面:創建圖像造成過程的詳細模型,爲了恢復感興趣量而構建其逆過程的數學方法(必要時,作簡化假設使其在數學上更容易處理)。

  • 統計層面:使用機率模型來量化產生輸入圖像的未知量先驗似然率和噪聲測量過程,而後推斷所指望量的最可能的估計並分析其結果的不肯定程度。使用的推斷算法每每與用於逆轉(科學的)圖像造成過程的優化方法密切相關。

  • 工程層面:開發出易於描述和實現且己知在實踐中行之有效的方法。測試這些方法,以便於瞭解其不足和失效模態,及其指望的計算代價(運行時的性能)。

    以上這三個途徑相互依存,而且貫穿本書始終。



第二版特別註釋


過去的十年見證了計算機視覺算法在性能和適用性上的一次真正的爆炸,其中大部分是由機器學習算法運用於大量視覺訓練數據而產生的。


深度神經網絡如今在許多視覺算法中扮演着重要的角色,這本書的新版本在早期就將其做爲基礎技術介紹,並在後續章節中普遍使用。


第二版中最顯著的變化包括:


機器學習、深度學習和深度神經網絡在第5章中介紹,由於它們在視覺算法中扮演的角色與在前兩章中介紹的圖像處理、圖形/機率模型和能量最小化等更經典的技術同樣重要。

  • 因爲端到端深度學習系統再也不須要開發構建模塊,如特徵檢測、匹配和分割,所以識別章節已經在書的早些時候移到了第6章。許多選修視覺課程的學生主要對視覺識別感興趣,所以在課程的早期呈現這些資料,可使學生更容易以這些主題爲期末專題的基礎。


目錄內容:



內容節選



下載地址:後臺回覆cv2

【重磅】CV大佬Szeliski-新書《計算機視覺:算法與應用(第二版)》,1206頁pdf

專知  今天


計算機視覺重磅書!






Richard Szeliski博士,計算機視覺領域的大師級人物,現爲Facebook研究科學家。Szeliski博士在計算機視覺研究方面有25年以上的豐富經驗,前後任職幹DEC和微軟研究院。1996年,他在微軟研究院任職期間,提出一種基於運動的全景圖像拼接模型,採用L-M算法,經過求圖像間的幾何變換關係來進行圖像匹配。此方法是圖像拼接領域的經典算法,Richard Szeliski也所以成爲圖像拼接領域的奠定人。

http://szeliski.org/RichardSzeliski.htm



計算機視覺:算法與應用(第二版)




地址:http://szeliski.org/Book/


本書萌芽於2001年,當時,華盛頓大學的Steve Seitz邀我和他一塊兒講一門課,課程名稱是「面向計算機圖形學的計算機視覺」。那個時候,計算機圖形學領域正在愈來愈多地使用計算機視覺技術,用它來建立基於圖像的真實物體的模型,用於產生視覺效果,用於經過計算攝影學技術來合併真實影像。咱們決定聚焦於計算機視覺在若干有趣問題中的應用,例如使用我的照片的圖像拼接和基於照片的3D建模等,這一想法引發了學生們的共鳴。


  從那時起,華盛頓大學和斯坦福大學就一直使用相似的課程大綱和項目導向的課程結構來進行常規計算機視覺課程的教學(在斯坦福大學,在2003年這門課程由我和David Fleet共同講授)。相似的課程大綱也被其餘不少大學所採用,並被歸入計算攝影學相關的更專業的課程。(有關如何在課程中使用本書的建議,請參見1.4節的表1.1。)


  本書還反映了我在企業研究實驗室(DEC劍橋研究實驗室和微軟研究院)這二十年的計算機視覺研究經歷。在從事研究的過程當中,我主要關注在真實世界中具備實際應用的問題和在實踐中行之有效的方法(算法)。所以,本書更強調在真實世界條件下有效的基本方法,而較少關注內在完美但難以實際應用的神祕的數學內容。


  本書適用於計算機科學和電子工程專業高年級本科的計算機視覺課程。學生最好已經修過圖像處理或計算機圖形學課程,這樣一來,即可以少花一些時間來學習通常性的數學背景知識,多花一些時間來學習計算機視覺技術。本書也適用於研究生的計算機視覺課程(經過專研更富有挑戰性的應用和算法領域),做爲基本技術和近期研究文獻的參考用書。爲此,我儘可能嘗試引用每一個子領域中最新的研究進展,即使其技術細節過於複雜而沒法在本書中涉及。


  在課程教學過程當中,咱們發現,要使學生從容應對真實圖像及其帶來的挑戰,讓他們嘗試實現一些小的課程設計(一般一個創建在另外一個基礎之上),是頗有幫助的。隨後,要求學生分紅組選擇各自的主題,完成最終的課程設計。(有時,這些課程設計甚至能轉換爲會議論文!)本書各章最後的習題包含有關小型中期課程設計題目的不少建議,也包含一些更開放的問題,這些問題的解決仍然是活躍的研究課題。只要有可能,我都會鼓勵學生用他們本身的我的照片來測試他們的算法,由於這能夠更好地激發他們的興趣,每每會產生富有創造性的衍生問題,使他們更熟悉真實影像的多樣性和複雜性。


  在闡述和解決計算機視覺問題的過程當中,我經常發現從三個高層途徑獲取靈感是有幫助的。



  • 科學層面:創建圖像造成過程的詳細模型,爲了恢復感興趣量而構建其逆過程的數學方法(必要時,作簡化假設使其在數學上更容易處理)。


  • 統計層面:使用機率模型來量化產生輸入圖像的未知量先驗似然率和噪聲測量過程,而後推斷所指望量的最可能的估計並分析其結果的不肯定程度。使用的推斷算法每每與用於逆轉(科學的)圖像造成過程的優化方法密切相關。


  • 工程層面:開發出易於描述和實現且己知在實踐中行之有效的方法。測試這些方法,以便於瞭解其不足和失效模態,及其指望的計算代價(運行時的性能)。


  以上這三個途徑相互依存,而且貫穿本書始終。


第二版特別註釋


過去的十年見證了計算機視覺算法在性能和適用性上的一次真正的爆炸,其中大部分是由機器學習算法運用於大量視覺訓練數據而產生的。


深度神經網絡如今在許多視覺算法中扮演着重要的角色,這本書的新版本在早期就將其做爲基礎技術介紹,並在後續章節中普遍使用。


第二版中最顯著的變化包括:




  • 機器學習、深度學習和深度神經網絡在第5章中介紹,由於它們在視覺算法中扮演的角色與在前兩章中介紹的圖像處理、圖形/機率模型和能量最小化等更經典的技術同樣重要。





  • 因爲端到端深度學習系統再也不須要開發構建模塊,如特徵檢測、匹配和分割,所以識別章節已經在書的早些時候移到了第6章。許多選修視覺課程的學生主要對視覺識別感興趣,所以在課程的早期呈現這些資料,可使學生更容易以這些主題爲期末專題的基礎。



目錄內容:



內容節選




專知便捷查看

便捷下載,請關注專知公衆號(點擊上方藍色專知關注)

  • 後臺回覆「CVAA」 能夠獲取《【重磅】CV大佬Szeliski-新書《計算機視覺:算法與應用(第二版)》,1206頁pdf》專知下載連接索引

專知,專業可信的人工智能知識分發,讓認知協做更快更好!歡迎註冊登陸專知www.zhuanzhi.ai,獲取5000+AI主題乾貨知識資料!
歡迎微信掃一掃加入專知人工智能知識星球羣,獲取最新AI專業乾貨知識教程資料和與專家交流諮詢
點擊「 閱讀原文 」,瞭解使用 專知 ,查看獲取5000+AI主題知識資源


微信掃一掃
關注該公衆號


今天由於你的點贊,讓我元氣滿滿

本文分享自微信公衆號 - AI科技時訊(aiblog_research)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索