實現效果:html
該AI智能小程序目前集成了百度AI開放平臺數十個AI服務產品功能,包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標識別、手勢識別、商標識別、果蔬識別、菜品識別等圖片識別功能,以及黑白圖像上色、圖片風格變換等圖像處理的功能。java
1 系統框架算法
小程序將經常使用功能按Ai技術分爲五大類:文字識別、語音技術、圖像技術、視頻技術和天然語言處理(NLP),而後根據具體功能再進行細分。本文主要介紹百度AI開放平臺計算機視覺方面服務產品的測試過程及效果。經過微信小程序實現API調用。小程序將用戶上傳的圖片提交給百度AI服務,返回識別結果。所有功能都在小程序客戶端完成,不須要服務器,適合我的開發者學習調試使用,同時也爲商業應用提供相應解決方案。json
開發平臺:微信開發者工具 V1.02小程序
開發語言:java script微信小程序
測試環境:Andriod 9.0服務器
2 微信小程序開發過程微信
2.1註冊微信小程序微信開發
註冊地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CNapp
註冊成功後在開發->開發者ID裏找到AppID,這是開發微信小程序所須要的身份標識。而後填寫服務器域名,須要用到的均要填上,以下圖。
2.2 小程序的配置已基本完成,下一步須要下載開發工具了,微信本身開發的IDE,下載地址是:
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html
2.3小程序開發文檔:https://developers.weixin.qq.com/miniprogram/dev/framework/
2.4小程序開發界面
以下圖,標紅處須要填入註冊時得到的APPID。
2.5程序整體結構
Pages下的每一個文件夾對應實現一種AI功能。添加新的AI功能,好比添加駕駛證識別功能,在根目錄的全局配置文件app.json中增長:"pages/ driving_license/ driving_license" ,會自動建立相關頁面文件夾,其內部結構以下:
driving_license.js:功能邏輯模塊
driving_license.wxss:頁面樣式文件
driving_license.wxml:頁面佈局文件
driving_license.json:頁面配置文件
3 程序功能實現說明
想了解微信小程序中百度API接口的調用過程,請參看我以前的帖子:
營業執照識別:https://ai.baidu.com/forum/topic/show/956171
增值稅發票識別:https://ai.baidu.com/forum/topic/show/956168
車牌識別:https://ai.baidu.com/forum/topic/show/956167
手寫文字識別:https://ai.baidu.com/forum/topic/show/956153
圖像風格轉換:https://ai.baidu.com/forum/topic/show/956135
文字識別:https://ai.baidu.com/forum/topic/show/954152
iOCR財會版:https://ai.baidu.com/forum/topic/show/956136
固然,還有更多百度AI服務功能能夠陸續添加,按照以上文章連接所提供的方法稍做修改便可。有興趣的同窗能夠試試。
4 測試效果
如下選取了部分圖片識別的測試效果:
4.1菜品識別
4.2 車型識別
4.3地標識別
4.4動物識別
4.5紅酒識別
4.6 貨幣識別
4.7 植物識別
4.8 黑白圖像上色
4.9 清點人數
4.10 通用物體與場景識別
5 測試結論
5.1識別能力
根據拍攝照片,識別圖片內容,普遍應用於娛樂類APP,自助結算等業務場景中。目前圖像識別具有的識別能力以下:
品牌logo識別 :識別4萬種商品logo,支持定製logo圖庫
植物識別 :識別2萬多種通用植物和近8千種花卉
動物識別 :識別近8千種動物
菜品識別 :識別超過近九千種菜品,支持定製菜品圖庫
地標識別 :識別5萬中外著名地標、景點
果蔬識別 :識別近千種水果和蔬菜
紅酒識別 :識別數十萬中外紅酒名稱及詳細介紹
貨幣識別 :識別國內外常見貨幣,支持正反面、記念鈔
車型識別 :識別3千款常見車型,可返回車型百科信息
營業執照識別 :識別各版式營業執照全部關鍵字段
增值稅發票識別 :識別增值稅普票或專票全部30個字段
駕駛證識別 :識別機動車駕駛證正本全部9個字段
車牌識別 :識別藍牌、綠牌、單/雙行黃牌等類型車牌
手寫文字識別 :識別圖片中的手寫數字、手寫中文
表格文字識別 :識別表頭、表尾及每一個單元格的文字內容
人臉檢測 :返回人臉框與關鍵點,識別多種人臉屬性
手勢識別 :識別24種常見手勢,支持自拍、他人拍攝
5.2 特點優點
1)圖像識別功能豐富
支持多種垂類業務場景的細粒度圖像識別,精準識別超過十萬種物體和場景,基於百度海量數據,持續豐富接口返回內容信息。
2)識別準確性高
基於百度豐富的海量數據,利用深度學習技術及精準的算法迭代模型,不斷提升準確性。
3)工做穩定性好
提供24小時雲端高穩定服務,宕機率低,故障恢復快,單圖毫秒級響應,服務可用性高達99.95%。
4)支持定製化識圖
支持根據不一樣的業務場景定製客戶專屬的AI識圖能力,知足非通用場景下的業務需求。例如品牌logo,菜品識別都可自定義庫。
5)支持獲取百科信息
支持識別結果中返回百度百科的內容,讓客戶業務功能更完善、內容更豐富。
做者:wangwei8638