如何從SaaS應用程序查詢和提取數據?

每一個SaaS應用程序背後的數據庫存儲有關員工、供應商、客戶及其餘合做夥伴的業務信息。SaaS應用程序支持諸多工做流程,好比面向銷售和營銷的CRM、面向財務的雲ERP、面向人力資源的勞動力管理以及其餘企業和部門服務。現在,許多公司使用衆多SaaS應用程序:從Salesforce、Slack、Workday和Atlassian之類的主流產品,到許多小型的SaaS工具,不一而足。
如何從SaaS應用程序查詢和提取數據?
SaaS應用程序不會在孤島中運行,大多數企業須要將它們的功能與私有云或公共雲中管理的其餘企業應用程序集成起來。
若是跨多個應用程序的工做流程須要集成應用程序,開發團隊能夠利用SaaS平臺的API來觸發從一個平臺到另外一個平臺的事件。許多應用程序和服務須要集成時,能夠選擇Boomi、SnapLogic或MuleSoft之類的企業集成平臺。若是須要遵循「若是這樣,須要那樣」模式的輕量級集成,IFTTT平臺能夠提供有效的集成。若是開發團隊在開發鏈接到多個SaaS和企業工做流程的新應用程序,還應探究Appian、OutSystems和PowWow之類的低代碼平臺。
利用SaaS數據以知足不一樣的業務需求
若是你須要未來自SaaS平臺的數據與其餘數據源集成起來怎麼辦?可能須要跨SaaS工具集成數據,出於這幾個緣由:
業務分析員想使用該數據來開發報告和儀表板。
數據科學團隊想要用於機器學習實驗的數據。
業務團隊想要集中數據以支持工做流程及其餘類型的應用程序。好比說,營銷團隊經常使用客戶數據平臺或主數據平臺來集中有關客戶、產品和其餘業務實體的數據。
IT團隊應提取備份所需的數據,或將數據遷移到其餘平臺。
法務團隊有時須要對基礎數據執行法律發現。
數據管理員經常想要清理、轉換或豐富基礎數據。
固然,你能夠利用SaaS平臺的API來提取數據,但這可能須要大量的開發工做來學習API、瞭解SaaS平臺的數據模型、爲任何新數據建立數據存儲區、編寫代碼以加載數據,併爲任何轉換開發邏輯。此外,IT團隊要定義託管該應用程序或服務的雲或數據中心基礎架構。最後,任何旨在按計劃或按須要運行的數據集成都須要平常的支持。對於面臨其餘更重要的優先事項的開發團隊和IT部門而言,從頭開始開發集成可能成本高昂。
另外一種方法是考慮數據集成、數據流、ETL(提取轉換和加載)或其餘數據準備平臺。處理頻繁變化的大量數據時,使用數據集成平臺多是最佳方法,由於這種平臺可實現靈活的提取和轉換。然而,在最終用戶訪問和使用信息以前,它們也須要事先開發集成機制。
可能須要查詢和管理SaaS數據的更輕量級的手段。有時,這種方法對於快速實驗、發現和構建原型頗有用。有時,這種方法能夠輕鬆用於運營或生產需求,尤爲在數據量不多且查詢吞吐量不大的狀況下。如下是三種選擇。數據庫

  1. 直接查詢SaaS應用程序的BI平臺
    若是你的主要需求是報告,那麼許多自助式BI和數據可視化平臺能夠直接鏈接到更流行的SaaS應用程序。
    Tableau能夠鏈接到Intuit Quickbook、Google Analytics、LinkedIn Sales Navigator、ServiceNow、Eloqua、Marketo和Salesforce等平臺。
    Microsoft Power BI還與Adobe Analytics、Facebook、GitHub、MailChimp、Stripe、Quick Base和Zendesk等在線服務集成。
    Domo聲稱有1000多個鏈接件,支持的平臺包括HubSpot、Jira、Instagram、Qualtrics、Shopify、SurveyMonkey、Twitter和Workday等。
    至少,這些集成提供了一種查詢和發現基礎SaaS數據源的簡易方法。往好裏說,現成的集成足以使最終用戶建立所需的數據混合、報告和儀表板。
    有幾個方面要考慮。
    當列有匹配的鍵時,這些平臺可支持鏈接和數據混合。若是在集成數據源或將其與其餘數據源混合以前須要大量的數據轉換,它們就變得較難使用。
    評估是否經過實時查詢執行SaaS數據集成,或者數據是提取仍是緩存。
    若是SaaS應用程序含有大量數據、與許多其餘數據源存在複雜的鏈接,或者儀表板將被許多用戶同時使用,性能多是一個因素。
  2. 模擬ODBC、JDBC、OData或其餘驅動程序的平臺
    若是業務須要的不只僅是報告和儀表板,仍須要輕量級的集成方法,那麼一些商業工具可將SaaS API轉換成標準數據庫驅動程序,好比ODBC、JDBC或OData。對於經常使用SaaS平臺的驅動程序而言,兩個選擇是Progress DataDirect和CData Driver Technologies。
    若是數據科學團隊想要在提取數據以供分析以前對SaaS數據庫執行臨時查詢,驅動程序方法可能最有用。對於須要實時查詢SaaS應用程序數據的應用開發人員來講,這也是不錯的選擇。
    開發和數據科學團隊應調查該集成的性能,尤爲是在須要大量查詢、龐大數據集或低延遲的狀況下。此外,許多SaaS應用程序根據API使用狀況來限制客戶或向客戶收費,所以若是須要更高的查詢量或數據量,這多是個因素。
  3. 可將SaaS數據同步到雲數據庫的輕量級ETL平臺最後一個方法是將數據集成從SaaS應用程序搬到貴企業創建和管理的雲數據庫中。該策略增添了一些操做複雜性和成本,若是須要實時查詢SaaS應用程序數據,可能不是理想的選擇。但它確實有幾個優勢:它讓企業能夠更大程度地控制業務用戶、數據科學家(包括平民數據科學家)和應用開發人員使用的數據庫平臺和數據架構。平臺和架構應知足容量、性能和延遲等方面的要求。獨立於SaaS數據庫存儲數據可提供更大的靈活性,可根據下游用戶和應用程序的要求,靈活地轉換、鏈接、清理或聚合數據。若是面向查詢該數據的數據安全、數據隱私或其餘數據治理控制措施有別於SaaS應用程序中的訪問和權利控制措施,那麼可能須要將數據託管在單獨的數據庫中。獨立於SaaS平臺託管數據對於更高的數據量和查詢量需求而言可能更具成本效益。雖然你能夠將該集成與數據集成或準備平臺結合起來,可是仍有一些SaaS數據集成平臺擁有可直接鏈接到許多SaaS應用程序的機制。若是你的目標是將數據從SaaS應用程序流式傳輸到雲數據庫,Talend旗下的Stitch是一款即插即用的解決方案。你能夠選擇要複製的數據和複製頻次,可是它不提供用於轉換或過濾數據的任何工具。Skyvia提供了一款相似的產品,二者都有讓開發團隊能夠試一試集成的免費版本。谷歌雲旗下的Alooma致力於將數據轉移至Google BigQuery、Amazon Redshift和Snowflake之類的大數據平臺,並提供一些數據轉換功能。若是貴公司在使用許多SaaS平臺,那麼一刀切的策略可能行不通。每條集成路徑都支持不一樣的SaaS集成,集成的類型必須與預期的業務需求相一致。比較工具並考慮多種選擇是一條優選實踐,數據集成需求變化時尤其如此。
相關文章
相關標籤/搜索