TensorFlow 使用預訓練好的卷積神經網絡和循環神經網絡(lstm)模型處理圖片轉文字(im2txt)git
這是AI大智慧系列文章中的一篇關於圖片轉文字的一篇博文,介紹了若是使用已經訓練好的模型。因爲本模型的訓練很是耗時間,GPU下可能須要 2weeks ,若是是浦東(普通)的筆記本,天呢,估計須要一年的時間(固然誇張了,一個月的時間仍是須要的,根據美國team看 須要的時間大約是gup 時間的 10倍,也就是 20 weeks ,小半年時間了) 。github
外界 ,至少我本人曾經覺得AI可以處理的信息應該是巨大的,整理完這個模型的使用方法和模型自己內部的結構(解剖)就在心裏充滿了失望,悲劇的感情在整個身體流淌 。由於AI確實什麼事情都幹不了,恐怕這個時間要持續五年,十年,五十年 甚至更久遠。單純就從計算機技術來說,區塊鏈在上面提到的時間內更具備核彈威力 ,更通俗下講就是更容易make money ,也更容易出成績 。跟金融,財務 稅收 ,發票 ,更簡單的講 跟fund or money 有關的領域 到能夠用blockchin 。算法
找不到生活的方向,也找不到人生的意義,我抑鬱。小程序
先說明下 什麼是圖片轉文字 ,道理很是簡單 ,就是 根據圖片上的信息 ,有算法 把該信息 提煉出來 轉成文字 打印到平臺上,若是是有能力作成小程序的話 ,也許意義會變的大一點,但是目前不具有這個能力 哼哼 抑鬱網絡
先上代碼 code 地址 : https://github.com/haohaixingyun/im2txt-ethan-tensorflow 工具
在本次實驗中用到的 工具版本以下,區塊鏈
Python 3.6.23d
TF : 1.3.0 ,更高版本1.10.0嘗試過也是能夠的 。code
拿到code 和配置完成環境變量後 直接run run_inference.py 這個script 就 可以獲得你想的結果 。blog
因爲訓練樣本選擇的緣由 ,讓本模型去識別一些不登大雅之堂的圖片是辦不到的 。在家裏的laptop 上試驗過 。其中一個重要的緣由是本模型根本就沒有哪些個特殊的單詞 或是描述 。
兩儀式
上面的圖片預測出來是:
基本上搞不懂預測的是什麼 ,不過好在是一個女孩 作在bed 上是能夠明白的,泰迪熊是怎麼來的 ,不知道
the good result :