案例分享:用 AI 取代「人工審覈」,快速搞定圖像的合規審查

image
不管大企業或小公司,在面向公衆提供的服務中,內容的合規審查都是重中之重。以往這主要依賴人工審覈,耗時長久且成本高昂。html

好在隨着 AI 技術的發展,咱們已經能夠用程序自動檢測識別用戶向平臺上傳的各種內容,檢測其中是否包含不合規內容,進而根據檢測結果酌情采起必要措施。服務器

本文將經過一個真實案例,向你們介紹如何利用 Amazon Rekognition 服務自動檢查圖像內容,實現快速、高效、低成本的圖像合規審查。架構

Amazon Rekognition 是什麼?

Amazon Rekognition 是一項基於機器學習(ML)技術的圖像與視覺分析服務,可幫助用戶識別圖像及視頻中的對象、人物、文本、場景及活動,並同步檢測出是否存在不當內容。Amazon Rekognition 文本檢測功能則可以從圖像及視頻中識別並提取出文本內容。例如,在圖像共享與社交媒體應用中,咱們可使用圖像內文本所包含的關鍵字實現圖像索引以及可視化搜索。在媒體與娛樂類應用中,你們還能夠根據屏幕上的文本,例如廣告、新聞、體育賽事比分以及字幕等等,對視頻內容進行分類。機器學習

如下截屏,展現了一個提取圖像內文本的具體示例。
image分佈式

在本文中,咱們將展現 REA Group 如何經過使用 Amazon Rekognition Text in Image 功能的 DetectText API,爲其房地產列表創建起自動化圖像合規審查解決方案。函數

REA Group簡介

image

REA Group 是一家專門面向房地產與實業資產的跨國數字廣告公司。該公司已經擁有20多年市場發展歷史,業務遍及澳大利亞、馬來西亞、香港、泰國、印度尼西亞、新加坡以及中國。REA Group 在亞洲的業務包括多個領先門戶網站品牌,如 iproperty.com.my、squarefoot.com.hk、thinkofliving.com,同時在新加坡與印度尼西亞持有99 Group的大量股份。REA Group 還在印度持有 Move, Inc 與 PropTiger 公司的可觀股份。他們主要爲消費者提供房地產購買、出售與租賃服務,同時發佈各種房產新聞、裝修技巧以及生活方式層面的內容。天天都有數百萬消費者訪問 REA Group 網站。學習

圖像合規難題

REA Group 提供基於搜索的門戶網站,房地產銷售商經過該門戶上傳在售的房地產圖片,從而向消費者提供普遍的可搜索選擇。但 REA Group 發現,經銷商上傳的圖像每每不符合使用條款要求。其中部分圖片包含商標或聯繫方式,這可能致使潛在的客戶流失問題。爲此,他們曾創建起專門的審覈小組,以人工方式處理圖像中的不當內容。但因爲每日圖像上傳量過大,增長的審覈過程每每令房產資料的發佈時間延後達數天之久。測試

圖像合規解決方案

爲此,REA 團隊開發出一套圖像合規性系統,可自動檢測圖像中存在的各種不合規狀況並及時通知賣方。最初,他們在 Amazon Elastic Compute Cloud(Amazon EC2)上訓練了本身的 ML 模型,檢測商標與聯繫方式。但這套模型出現大量誤報,特別是在聯繫方式細節檢測方面表現不佳。爲了進一步提升模型的準確率,他們須要在模型訓練與優化方面投入大量精力。爲了知足項目目標並以及時間要求,該團隊須要一套易於實施的解決方案,爲業務提供必要的準確率支持。優化

考慮到這一目標,他們決定擴展示有ML模型,並在工做流程中引入 Amazon Rekognition Text in Image,以此提升檢測準確率並減小誤報。他們還添加了更多業務規則,分解到自研模型和 Amazon Rekognition 的各類預測,從而實現決策自動化。網站

爲了進一步優化推理基礎設施的運營成本,REA 團隊還採用一個基於事件驅動的架構來管理商標和聯繫方式檢測模型中的推理引擎,這是利用AWS Lambda來實現的。這種方式不只提升了其基礎設施資源的使用效率,也在知足業務目標的同時顯著節約了運營成本。

具體工做原理

這套解決方案以無服務器棧爲基礎,以下圖所示。其中圖像上傳經 Amazon API Gateway 到面向 Amazon Simple Storage Service(Amazon S3)的上傳 API,上傳事件會觸發以Lambda函數實現的工做流,運行一系列用於自動決策的機器學習模型和業務規則。
image

整個事件驅動工做流以下所示:

  1. 賣方經過 API Gateway 向門戶網站提交帶有圖像的房產列表。
  2. 圖像被上傳至 Amazon S3,繼而觸發 Amazon S3 事件。
  3. 包含 Amazon S3 對象相關元數據的事件,被進一步發佈至分佈式隊列 Amazon Simple Queue Service(Amazon SQS)當中。
  4. 將 Amazon SQS 與 Lambda 相集成,Lambda 會輪詢該隊列直到發現新的可用事件調用 Lambda 函數。隨着發送至 Amazon SQS 事件的持續增長,Lambda 還會自動調用更多函數來應對。
  5. 當函數被調用時,函數內的圖像審覈業務邏輯將被執行,並經過商標及聯繫信息模型與 Amazon Rekognition 共同推理圖像是否存在違規。
  6. 將模型輸出組合起來,便可根據業務規則完成進一步處理,決定後續操做:通知代理、轉發至審覈人員團隊以進行檢查或自動批准。

業務結果

數據科學與工程負責人 Mohammad Alauddin 表示,「隨着業務的增加,提高效率已經成爲影響咱們擴展規模的重要因素。咱們的團隊也開始集思廣益,思考如何在更好地服務於客戶的同時,保持團隊的高效率。經過 AWS Lambda 與 Amazon Rekognition 在 AWS 應用機器學習,咱們增長了平臺上高質量合規列表的數量,同時減小了列表的審覈時間與成本。此外,咱們不只在規定的時間表內完成項目,並將誤報數量減小了超過56%。」

總結

你們能夠在 Amazon Rekognition 控制檯上根據業務要求測試 Amazon Rekognition 的圖像文本識別效果。關於 Amazon Rekognition 文本檢測 API 的更多詳細信息,請參閱 Amazon Rekognition 說明文檔
image

相關文章
相關標籤/搜索