一文輕鬆集成華爲HMS ML Kit 表格識別服務

前言

問卷調查收集是最多見的社會調查的一種方法, 一般應於市場調查,信息收集等方面。可是龐大的問卷調查收集完了以後面對如此大量的數據該怎麼錄入,並將內容轉換爲電子文檔呢?今天就爲你們介紹經過集成華爲HMS ML Kit表格識別服務來輕鬆實現表格錄入功能。java

應用場景

華爲HMS ML Kit表格識別服務是利用AI技術從輸入的圖片中識別並返回表格結構信息(包括單元格的行列信息和座標信息)和表格中的文本信息(包括單元格內的文本內容),支持識別中英文文本信息及標點符號。表格識別服務在平常工做場景中有普遍應用。例如,收集到大量紙質表格問卷後,能夠經過該服務將識別到的問卷內容轉換爲電子文檔,減小人工錄入成本,大幅提升工做效率。android

注意事項

  • 支持識別具備表格特徵的表單、問卷等。
  • 暫時不支持圖片中含有多張表格的識別,不支持獲取表頭及表尾信息。
  • 知足如下條件可達到最佳識別效果(以下示圖):
拍攝角度 平面傾斜角度小於5度
表格完整度 完好角、無彎曲表格線、表格線連續未間斷
表格內容 表格中的文字爲橫向,表格中的背景色(底色)和表格線顏色要求有明顯的對比度,僅支持爲純印刷體文本,暫不支持識別表格內的圖片、公式、手寫字、印章、水印等
圖片規格 圖片的長邊和短邊的比例需小於3:1(含),分辨率需大於960*960px,圖片中表格的方向必須正向,表格佔圖片面積60%以上,並在圖片的中間位置

開發步驟

1. 開發準備

詳細的準備步驟能夠參考華爲開發者聯盟:
https://developer.huawei.com/consumer/cn/doc/development/HMSCore-Guides-V5/dev-process-0000001050038076-V5?ha_source=hms1git

這裏列舉關鍵的開發步驟。github

1.1 項目級gradle裏配置Maven倉地址

buildscript {
    repositories {
        google()
        jcenter()
        maven {url 'https://developer.huawei.com/repo/'}
    }
    dependencies {
        ...
        classpath 'com.huawei.agconnect:agcp:1.4.1.300'
    }
}
 
allprojects {
    repositories {
        google()
        jcenter()
        maven {url 'https://developer.huawei.com/repo/'}
    }
}

1.2 文件頭增長配置

集成SDK後,在文件頭添加配置json

apply plugin: 'com.android.application'
apply plugin: 'com.huawei.agconnect'

1.3 應用級gradle裏配置SDK依賴

dependencies{
    // 引入基礎SDK
    implementation 'com.huawei.hms:ml-computer-vision-formrecognition:2.0.4.300'
    // 引入表格識別模型包
    implementation 'com.huawei.hms:ml-computer-vision-formrecognition-model:2.0.4.300'
}

1.4 將如下語句添加到AndroidManifest.xml文件中,用於自動更新機器學習模型

<meta-data
        android:name="com.huawei.hms.ml.DEPENDENCY"
        android:value= "fr"/>

1.5 申請攝像頭權限

<uses-permission android:name="android.permission.CAMERA" />
<uses-feature android:name="android.hardware.camera" />

2. 代碼開發

2.1建立表格識別分析器。

MLFormRecognitionAnalyzerSetting setting = new MLFormRecognitionAnalyzerSetting.Factory().create();
MLFormRecognitionAnalyzer analyzer = MLFormRecognitionAnalyzerFactory.getInstance().getFormRecognitionAnalyzer(setting);

2.2經過android.graphics.Bitmap建立MLFrame對象用於分析器識別表格,支持的圖片格式包括:jpg/jpeg/png,建議圖片尺寸不小於960960像素,不大於19201920像素。

MLFrame mlFrame = MLFrame.fromBitmap(bitmap);

2.3調用asyncAnalyseFrame異步方法或analyseFrame同步方法進行表格識別(JsonObject對象的數據結構定義請參見JsonObject)。

// asyncAnalyseFrame異步調用。
Task<JsonObject> recognizeTask = analyzer.asyncAnalyseFrame(mlFrame);
recognizeTask.addOnSuccessListener(new OnSuccessListener<JsonObject>() {
    @Override
    public void onSuccess(JsonObject recognizeResult) {
        // 識別成功。
    }
}).addOnFailureListener(new OnFailureListener() {
    @Override
    public void onFailure(Exception e) {
        // 識別失敗。
    }
});
 
// analyseFrame同步調用。
SparseArray<JsonObject> recognizeResult = analyzer.analyseFrame(mlFrame);
if (recognizeResult != null && recognizeResult.get(0).get("retCode").getAsInt() == MLFormRecognitionConstant.SUCCESS) {
    // 識別成功。
} else {
    // 識別失敗。
}

2.4檢測完成,中止分析器,釋放檢測資源。

if (analyzer != null) {
    analyzer.stop();
}

在這裏插入圖片描述

總結

華爲機器學習表格識別服務爲開發者提供識別圖片中表格的服務,可普遍應用於問卷調查數據收集等應用場景中,代替人工錄入,減小成本。數據結構

欲瞭解更多詳情,請參閱:app

華爲開發者聯盟官網:https://developer.huawei.com/consumer/cn/hms?ha_source=hms1機器學習

獲取開發指導文檔:https://developer.huawei.com/consumer/cn/doc/development?ha_source=hms1異步

參與開發者討論請到Reddit社區:https://www.reddit.com/r/HMSCore/async

下載demo和示例代碼請到Github:https://github.com/HMS-Core

解決集成問題請到Stack Overflow:https://stackoverflow.com/questions/tagged/huawei-mobile-services?tab=Newest

如您有任何疑問或須要幫助,請與咱們聯繫:mlkit@huawei.com


原文連接:https://developer.huawei.com/consumer/cn/forum/topic/0204429136296960028?fid=18

原做者:timer

相關文章
相關標籤/搜索