如何快速將百度大腦AI技術內置智能小程序中

時間 2019-11-26

標籤如何快速百度大腦技術內置智能程序简体版

原文原文鏈接

實現效果：html

該AI智能小程序目前集成了百度AI開放平臺數十個AI服務產品功能，包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標識別、手勢識別、商標識別、果蔬識別、菜品識別等圖片識別功能，以及黑白圖像上色、圖片風格變換等圖像處理的功能。java

1 系統框架算法

小程序將經常使用功能按Ai技術分爲五大類：文字識別、語音技術、圖像技術、視頻技術和天然語言處理（NLP）,而後根據具體功能再進行細分。本文主要介紹百度AI開放平臺計算機視覺方面服務產品的測試過程及效果。經過微信小程序實現API調用。小程序將用戶上傳的圖片提交給百度AI服務，返回識別結果。所有功能都在小程序客戶端完成，不須要服務器，適合我的開發者學習調試使用，同時也爲商業應用提供相應解決方案。json

開發平臺：微信開發者工具 V1.02小程序

開發語言：java script微信小程序

測試環境：Andriod 9.0服務器

2 微信小程序開發過程微信

2.1註冊微信小程序微信開發

註冊地址：https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CNapp

註冊成功後在開發->開發者ID裏找到AppID，這是開發微信小程序所須要的身份標識。而後填寫服務器域名，須要用到的均要填上，以下圖。

2.2 小程序的配置已基本完成，下一步須要下載開發工具了，微信本身開發的IDE，下載地址是：
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

2.3小程序開發文檔：https://developers.weixin.qq.com/miniprogram/dev/framework/

2.4小程序開發界面

以下圖，標紅處須要填入註冊時得到的APPID。

2.5程序整體結構

Pages下的每一個文件夾對應實現一種AI功能。添加新的AI功能，好比添加駕駛證識別功能，在根目錄的全局配置文件app.json中增長："pages/ driving_license/ driving_license" ，會自動建立相關頁面文件夾，其內部結構以下：

driving_license.js：功能邏輯模塊

driving_license.wxss：頁面樣式文件

driving_license.wxml：頁面佈局文件

driving_license.json：頁面配置文件

3 程序功能實現說明

想了解微信小程序中百度API接口的調用過程，請參看我以前的帖子：

營業執照識別：https://ai.baidu.com/forum/topic/show/956171

增值稅發票識別：https://ai.baidu.com/forum/topic/show/956168

車牌識別：https://ai.baidu.com/forum/topic/show/956167

手寫文字識別：https://ai.baidu.com/forum/topic/show/956153

圖像風格轉換：https://ai.baidu.com/forum/topic/show/956135

文字識別：https://ai.baidu.com/forum/topic/show/954152

iOCR財會版：https://ai.baidu.com/forum/topic/show/956136

固然，還有更多百度AI服務功能能夠陸續添加，按照以上文章連接所提供的方法稍做修改便可。有興趣的同窗能夠試試。

4 測試效果

如下選取了部分圖片識別的測試效果：

4.1菜品識別

4.2 車型識別

4.3地標識別

4.4動物識別

4.5紅酒識別

4.6 貨幣識別

4.7 植物識別

4.8 黑白圖像上色

4.9 清點人數

4.10 通用物體與場景識別

5 測試結論

5.1識別能力

根據拍攝照片，識別圖片內容，普遍應用於娛樂類APP，自助結算等業務場景中。目前圖像識別具有的識別能力以下：

品牌logo識別：識別4萬種商品logo，支持定製logo圖庫

植物識別：識別2萬多種通用植物和近8千種花卉

動物識別：識別近8千種動物

菜品識別：識別超過近九千種菜品，支持定製菜品圖庫

地標識別：識別5萬中外著名地標、景點

果蔬識別：識別近千種水果和蔬菜

紅酒識別：識別數十萬中外紅酒名稱及詳細介紹

貨幣識別：識別國內外常見貨幣，支持正反面、記念鈔

車型識別：識別3千款常見車型，可返回車型百科信息

營業執照識別：識別各版式營業執照全部關鍵字段

增值稅發票識別：識別增值稅普票或專票全部30個字段

駕駛證識別：識別機動車駕駛證正本全部9個字段

車牌識別：識別藍牌、綠牌、單/雙行黃牌等類型車牌

手寫文字識別：識別圖片中的手寫數字、手寫中文

表格文字識別：識別表頭、表尾及每一個單元格的文字內容

人臉檢測：返回人臉框與關鍵點，識別多種人臉屬性

手勢識別：識別24種常見手勢，支持自拍、他人拍攝

5.2 特點優點

1）圖像識別功能豐富

支持多種垂類業務場景的細粒度圖像識別，精準識別超過十萬種物體和場景，基於百度海量數據，持續豐富接口返回內容信息。

2）識別準確性高

基於百度豐富的海量數據，利用深度學習技術及精準的算法迭代模型，不斷提升準確性。

3）工做穩定性好

提供24小時雲端高穩定服務，宕機率低，故障恢復快，單圖毫秒級響應，服務可用性高達99.95%。

4）支持定製化識圖

支持根據不一樣的業務場景定製客戶專屬的AI識圖能力，知足非通用場景下的業務需求。例如品牌logo，菜品識別都可自定義庫。

5）支持獲取百科信息

支持識別結果中返回百度百科的內容，讓客戶業務功能更完善、內容更豐富。

做者：wangwei8638

相關文章

相關標籤/搜索

如何快速建鏈

Docker命令大全

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<