廈門巨龍信息中標天津公安雲平臺(軟件開發部分:2198.5萬元)

http://www.sohu.com/a/163668318_465914python

天津市公安局雲計算平臺項目分爲:大數據部分、虛擬化部分、數據庫部分,軟件開發部分,預算分別爲:2350萬、3380萬、2350萬、2700萬、合計1.078億元。web

目前數據庫部分中標結果已經公佈,詳情:IBM、華爲、柏科中標天津公安雲平臺(數據庫部分:2098萬)算法

中標供應商:廈門市巨龍信息科技有限公司數據庫

中標金額:2,198.5萬元安全

項目需求書服務器

1、項目背景網絡

(一) 項目背景架構

雲計算是信息技術發展和服務模式創新的集中體現,是信息化發展的重大變革和必然趨勢,雲計算引起了軟件開發部署模式的創新,成爲承載各種應用的關鍵基礎設施,併爲大數據、物聯網、人工智能等新興領域的發展提供基礎支撐。併發

近年來,公安部門主導的城市智能感知網建設飛速發展和雲計算技術的日趨成熟,爲開展雲計算、大數據深度挖掘分析、警務業務系統流程改造打下了基礎。爲了提高公安各級信息中心的總體支撐能力,集約化建設、集中化管理統一的雲基礎設施環境,並在此基礎上開展數據深度應用,公安部統籌規劃了在全國公安系統內建設部省兩級雲計算服務平臺的整體目標。負載均衡

公安部明確指出:按照《公安部關於大力推動基礎信息化建設的意見》(公通字〔2015〕18號)的要求,部、省兩級公安機關信息中心要抓緊建設具備大數據處理能力的公安雲計算設施。省級公安機關科信部門要在公安部科技信息化局指導下,增強頂層設計和統籌規劃,建設覆蓋全省(自治區、直轄市)的公安雲計算設施,面向本級及如下公安機關業務應用提供統一資源和服務。

我局爲了落實公安部要求,按照市局信息化建設頂層設計,自2017年開始,市局再也不批准各警種購置運行於公安網環境的各種硬件設備,由市局信息中心建設的雲計算服務平臺統一提供所需資源。由市局建設一個物理集中建設、邏輯分散應用、管理透明可見的雲計算服務平臺,採用先進的雲計算、大數據、物聯網技術,統籌各種設備資源,增強管理,充分提升設備利用效率,爲各單位開展信息化建設提供支撐服務。

着眼於天津公安將來業務工做的須要,愈來愈迫切的須要一個基於雲計算、大數據技術架構的平臺,以實現全局IT資源的大整合,實現各種數據的大集中,充分利用雲計算和大數據技術的高性能、高可用、高擴展的優點,爲公安打造情報指揮、破案打擊、治安防控、社會管理、執法監督、綜合服務等大數據綜合平臺。

本項目建設的平臺應可以部署在通用X86架構PC服務器集羣,應用部分部署在虛擬服務器環境。網絡環境爲雙萬兆數據互聯、千兆管理互聯。大數據集羣出口帶寬爲萬兆。

(二) 建設目標

經過本項目構建天津市公安局雲計算、大數據技術與服務體系架構,實現網絡、存儲、安全、數據、計算等各種軟硬件資源的整合;構建信息深度共享、業務高效協同的公安大數據信息資源服務體系,強化海量數據的深度挖掘能力,爲情報預警、打擊犯罪、社會治理、服務公衆等業務提供大規模併發數據的雲服務能力,實現全局大數據計算能力共享,大數據計算服務全警覆蓋;構建大數據示範應用平臺,開展基於反恐維穩、打擊犯罪、社區警務等重點業務領域的大數據預警預測分析破題應用,引領公安工做向主動警務、智慧警務發展。

(三) 項目建設內容

按照市局信息化頂層設計,雲計算服務平臺建設主要內容是:

(一)搭建雲計算基礎設施。建設縱向完整的各種網絡、安全、計算、存儲設備等基礎硬件資源池,具有橫向擴展能力。

(二)構建雲操做系統,提供平臺化服務。在基礎設施雲上部署雲操做系統,面向業務系統提供雲安全服務、負載均衡服務、虛擬計算服務、對象存儲服務和大數據計算處理服務。

(三)搭建雲計算數據資源中心。基於雲平臺基礎架構體系,整合構建包含結構化、半結構化和非結構化數據的綜合數據資源中心,完成數據的聚集、清洗、加載,管理數據處理流程,按應用需求完成數據格式轉換,對數據進行預處理,創建各種專題庫。

(四)建設開展雲計算應用中心。運用大數據和雲計算技術,結合公安業務應用需求,普遍開展面向全警的大數據智慧應用。建立五要素標籤應用體系,將各要素進行數字化描述,根據已知推定未知,開展預測預警預防的破題應用。

(五)建設雲計算安全保障體系。根據雲計算平臺的特色,評估雲計算安全風險,明確安全需求,對雲基礎設施、雲計算服務、數據資源、應用服務、用戶等實施分層級、分類別、分受權管理,重點從雲平臺、雲邊界和雲應用三個方面保障雲計算安全。

(六)建設雲計算標準化管理體系。對實時匯聚的海量數據進行標準化處理,並將標準化管理推向數據生產環節。

(七)建設雲計算運維管理體系。包括雲計算服務平臺軟硬件自動運維管理、與現有運維繫統對接,以及運維監測處置。

(八)制定雲平臺相關管理規範。圍繞雲平臺提供的服務內容,逐步造成雲平臺相關管理規範。

*2、驗收要求

項目驗收按照《軟件需求說明書》執行。驗收的內容包括:

  •  系統功能:按照需求書的要求,檢查系統功能是否達到設計要求。

  •  系統性能:按照需求書的性能指標,測試系統指標是否達到設計要求。

  •  文檔資料:檢查系統設計文檔是否齊全、是否合格。

中標供應商所提供的軟件系統須要經採購人承認的具有CNAS資質的第三方評測機構進行軟件測評,費用由投標人承擔。中標供應商所提供的軟件系統的軟件測評結果須達到採購人質量管理標準,經過軟件測評並提交相應測評報告以此做爲該項目最終驗收的依據之一。

3、技術需求

第一包:天津市公安局雲計算服務平臺軟件系統

序號

採購項名稱

技術要求

單位

數量

1

大數據基礎平臺

採用成熟的雲計算技術和大數據技術,實現計算資源、存儲資源、網絡資源等的統一配置和管理,爲雲平臺的高效穩定運行提供核心雲計算服務和大數據計算服務。

詳細需求請詳見「大數據基礎平臺臺技術要求」

1

2

雲平臺應用系統

爲天津市全警提供基於雲計算和大數據技術開展建設的各種業務應用和分析應用,針對當前天津市局的業務需求,本次雲計算服務平臺建設的業務應用包括大數據智慧警務示範應用、專業警種大數據應用以及現有應用上雲(如天地E搜系統,天地E檔系統,天地E控系統)等。

詳細需求請詳見「雲平臺應用系統設計要求」

1

3

雲應用支撐平臺

雲應用支撐平臺是整個雲計算服務平臺的應用支撐系統,經過創建統一的數據、應用服務管理機制,提供豐富的數據及應用服務接口,支持跨系統及全平臺的數據及應用訪問服務,除系統內部的數據應用服務外,其餘數據應用服務都經過服務層管理平臺進行統一調配。同時提供統一的權限管理、身份認證、安全審計、消息服務、PGIS服務等支撐性應用服務。

詳細需求請詳見「雲應用支撐平臺設計要求」

1

4

雲數據庫

雲數據庫負責存儲和管理雲計算服務平臺的數據資源。雲平臺的信息資源規劃和數據庫設計主要內容包括數據接入及處理,數據上雲以及針對數據展開的數據集成和數據管理。

詳細需求請詳見「雲數據庫技術要求」

1


(一) 項目整體設計要求1.1 技術路線要求
附件一:天津市公安局雲計算服務平臺軟件系統詳細技術需求

本次天津市雲計算服務平臺建設採用先進、成熟的技術路線,主要包括:

  • 採用當前主流雲計算和大數據應用技術;

  • 採用多種數據庫相融合的技術架構;

  • 採用SOA(面向服務架構)體系規範設計;

  • 使用JAVA語言按J2EE規範進行系統研發;

  • 採用成熟的數據建模技術設計;

  • 採用組件化模式開發技術;

敏感信息處理設計

因本項目設計大量的公安行業敏感數據,要求投標人詳述針對本次項目採起的敏感信息處理設計方法。

1.3 整體架構設計

天津市公安局雲計算服務平臺整體架構設計遵循面向業務需求的設計思路,以雲計算和大數據技術爲關鍵支撐,以服務實戰應用爲根本目標,構建統一的IT基礎設施資源池,爲天津市警務應用系統提供敏捷、可靠、安全、彈性的IT基礎設施服務,系統架構具有良好的可擴展性,保證雲平臺業務動態擴展和新業務快速上線。

天津市公安局雲計算服務平臺遵循「業務主導、先進實用;統一規劃、分步實施;規範管理、保障安全」的建設原則,以可擴展的融合架構、雲操做系統、大數據技術、分佈式雲數據中心架構,構築雲計算服務平臺的架構、實現對高智慧、高性能、高可用、彈性、敏捷、安全數據中心的支撐。

天津市雲計算服務平臺按照基礎設施層、數據層、支撐層、應用層進行縱向分層設計,輔以雲平臺標準規範體系、安全體系、項目管理體系與運維保障體系提供支撐。

應用層

應用層主要爲天津市全警提供基於雲計算和大數據技術開展建設的各種業務應用和分析應用,針對當前天津市局的業務需求,本次雲計算服務平臺建設的業務應用包括大數據智慧警務示範應用、專業警種大數據應用以及現有應用上雲(如天地E搜系統,天地E檔系統,天地E控系統)等。

支撐層

支撐層是整個平臺的運行和服務支撐,經過創建統一的數據、應用服務管理機制,提供豐富的數據及應用服務接口,支持跨系統及全平臺的數據及應用訪問服務,除系統內部的數據應用服務外,其餘數據應用服務都經過服務層管理平臺進行統一調配。同時提供統一的權限管理、身份認證、安全審計、消息服務、PGIS服務等支撐性應用。

數據層

數據資源是雲平臺的核心資產,數據層的建設內容包括上雲數據的綜合治理(包括數據聚集、同步、整合、管理等),以及圍繞掌握的數據資源建設雲平臺大數據資源庫,大數據專題庫,模型基礎庫,配置庫和數據元庫。

基礎設施層

基礎設施層是雲平臺的基礎設施支撐層,採用成熟的雲計算技術和大數據技術,實現計算資源、存儲資源、網絡資源等的統一配置和管理,爲雲平臺的高效穩定運行提供基礎硬件保障,同時提供核心雲計算服務和大數據計算服務。

項目管理及標準規範體系

圍繞雲平臺建設,標準體系由整體標準、數據標準、信息服務標準、應用支撐標準、網絡基礎設施標準、信息安全標準和管理標準等部分組成。

運行維護和安全保障體系

系統運行維護管理主要包括用戶管理、日誌管理、監控管理、配置管理、運維管理等,經過統一的監控平臺對主機系統、網絡、應用程序和數據庫進行集中管理;安全保障貫穿系統總體結構中的各個層次,包括系統安全、網絡安全、數據安全和應用安全等。

1.4 平臺技術指標要求

1.4.1 雲平臺基礎設施性能指標需求

分佈式文件系統

  • 支持15PB以上的擴展能力,隨需擴展,系統不中斷

  • 系統性能能夠實現線性增加,支持85GB/s系統吞吐

  • 具有單一命名空間和單一存儲池

  • 可實現高密度、靈活的數據保護

  • 數據分級存儲,具有高性價比

NoSQL數據庫

  • 從數據源(如SFTP)導入到HBase,平均每節點的導入速度15 MB/s。

  • 100%隨機讀:平均每節點讀取記錄條數30000條(每條記錄1KB),響應時間<50ms。

  • 100%隨機寫:平均每節點寫入記錄條數35000條(每條記錄1KB),響應時間<50ms。

  • 順序掃描:平均每節點scan記錄條數10000條(每條記錄1KB),響應時間<50ms。

分佈式關係型數據庫

  • 支持單表最多1600字段;支持單字段最大長度1GB;支持表最大分區數32k;支持單分區最大容量128TB。

  • 數據導入單節點60MB/s,數據導出單節點200MB/s,集羣總體導入/導出性能隨節點增長線性增加。

  • 順序表掃描單節點性能1.2GB/s,掃表性能隨節點增長線性增加。

  • 行存壓縮比3:1,列存壓縮比10:1。

  • 600億條記錄(15TB)精確查詢,結果集10萬條記錄1秒內返回(點查詢,索引掃描,隨機IO)。

  • 600億條記錄(15TB)使用50個不一樣條件併發查詢,每一個查詢的結果集1000條記錄1秒內返回。

  • 億級大表與十萬級小表關聯查詢,響應時間<5秒。

分佈式全文索引計算

  • 入庫:單節點 > 8000條每秒;

數據庫資源池

  • 採用64位RISC處理器,同時支持UNIX/Linux操做系統。

  • 能夠實時監測內部主要部件的狀態,包含CPU、內存、PCI槽、分區等信息,支持SNMP協議。

  • 支持虛擬化功能,且各虛擬主機以共享的方式使用CPU、內存、網卡、光纖卡等資源。

  • 各虛擬主機資源能夠動態地調整(增長和減小)。

  • 能夠實現分區在不停機的狀況下動態從一臺物理服務器遷移到另外一臺物理服務器。

1.4.2 雲平臺應用系統性能指標需求

大數據同步指標

  • 數據從Oracle同步到Mpp數據庫和HBase,抽取效率≥300GB/小時。

大數據資源服務總線運行指標

  • 單總線節點能夠知足1000萬/日的請求訪問;

  • 單節點最大支持1000/s的併發訪問;

  • 請求響應時間(服務總線自身計算時間)<=1秒;

  • 正常運行率>99%;

  • 總線節點支持集羣部署;

併發性指標

  • 搜索和分析操做,併發數達到1000;

穩定性指標

  • 搜索和分析各30次操做,準確率99.9%;

搜索查詢指標

  • 搜索查詢併發<1000時,響應時間<2秒;搜索查詢併發<2000時,響應時間<3秒;

比對分析指標

  • 1000萬條與1000萬條數據比對碰撞,響應時間≤1秒;

  • 1億條與1億條數據比對碰撞,響應時間≤3秒;

  • 單人關係網絡分析(肯定關係模型),2層展示,響應時間≤2秒;

  • 兩人六度關係挖掘(肯定關係模型),最大4層間接關係,響應時間≤3秒;

項目詳細設計要求

大數據基礎平臺技術要求:本項要求投標人提供成熟產品

一、大數據平臺集羣及管理節點(282節點):

序號

指標項

參數要求

1

開放兼容

廠商大數據平臺軟件需提供Apache開源社區Hadoop 2.7及以上版本,需提供廠商平臺組件版本號,提供證實材料。

提供很多於HDFS、MapReduce、Hive、Spark、Solr、HBase、Hive,Storm等組件,組件內核與Apache Hadoop開源社區版本保持兼容性,不使用私有架構和組件
廠商的大數據平臺提供Spark組件,而且保持開放性。

2

基本功能

分佈式數據庫:大數據平臺可以提供NoSQL能力,支持聚簇表/聚簇索引,支持將現有數據庫中的多個具備類似功能或者存在業務關聯的數據表聚簇到一個大表中,從存儲層面確保在關鍵場景下的跨表關聯查詢的高性能,提供詳細的技術實現方式。

分佈式文件系統:文件系統應提供海量文件存儲能力,支持億級文件和PB級數據容量。支持POSIX/REST/FTP接口訪問。支持多副本,支持跨機房容災,支持在某個時間點建立文件系統快照,支持文件系統元數據週期自動備份,支持磁盤異構,支持分級存儲。

離線計算:大數據平臺提供批處理計算能力,可以對結構化/半結構化數據進行批量分析彙總完成數據計算。支持REST/SQL/類SQL接口

內存計算:提供分佈式內存計算框架,大數據平臺的Spark組件支持1.5及以上版本,幫助開發人員能夠較快的分析出Job的執行流程是否合理,從而快速進行優化,支持python調用Spark Core、Spark Streaming、MLLib的接口來編寫和提交應用。支持web界面上直接查看日誌的功能,使運維更方便。

全文檢索能力:提供全文檢索能力,支持面向結構化數據、半結構化數據以及非結構化數據的全文索引能力。支持豐富的全文檢索語法-支持精確、模糊、通配的搜索方式。融合HBase、Solr組件,對應用層暴露單一API(DDI、DMI、Solr API、HBase API等)),提供詳細的技術實現方式。

SQL能力:大數據平臺提供基於Hadoop的SQL引擎,完成SQL的解析、計劃、優化、執行,數據的並行查詢,支持JDBC、ODBC標準接口,兼容Hive的ORC文件存儲格式,徹底兼容標準SQL 2003語法,並提供基於hadoop平臺SQL組件(Hive、Spark等)的統一接入能力

分析挖掘算法:大數據平臺具有數據可視化、特徵工程、數據建模以及機器算法學習庫的功能,支持數據管理、數據探索、特徵工程和管理、模型構建和管理、模型應用的全流程分析,支持使用拖拽式、交互式和嚮導式方式進行數據分析,同時對外提供大數據關係業務建模和關係分析服務能力

3

可靠性

大數據平臺的全部業務組件的管理節點均實現雙機HA,業務無單點故障,提供數據跨機房存放能力,提供對集羣內服務器硬盤故障自動容錯處理,具有硬盤熱插拔,故障硬盤的業務恢復時間<2分鐘,具有在系統總體掉電恢復後,可以正常恢復業務,並確保關鍵數據不丟失

4

安全性

大數據平臺可以支持按照用戶須要對HBase和Hive中的數據進行列加密。便可對全部數據進行加密,也可只對部分關鍵數據進行加密

支持基於角色的用戶權限管理和基於WebUI的統一的用戶管理界面,用戶訪問平臺的各個組件的WebUI時支持單點登陸,只須要登陸認證一次,便可訪問其它組件的WebUI

大數據平臺支持多租戶管理,提供大數據統一租戶管理平臺,實現租戶資源的動態配置和管理,資源隔離,資源使用統計等功能

5

易用性

提供大數據平臺的接口文檔、二次開發樣例和二次開發指南,能指導開發人員完成應用開發;提供一鍵式軟件依賴環境準備,在標準Linux已經安裝完成的基礎上,提供一鍵式工具完成大數據平臺的OS依賴包的自動安裝、磁盤自動格式化與分區掛載、NTP/Kerberos/LDAP基礎服務自動配置。

 

 

提供自研的圖形化大數據集成工具,支持在HDFS/HBase與關係型數據庫、文件服務器間進行雙向數據導入或者導出,同時在數據導入導出過程當中,支持對文件進行合併、過濾、編解碼格式轉換等功能,數據集成工具應支持從SFTP、FTP向HDFS或HBase導入數據,並支持從HDFS或HBase向SFTP、FTP導出數據。

6

可管理性

大數據平臺提供多租戶管理,提供大數據統一租戶管理平臺,實現租戶資源的動態配置和管理,資源隔離,資源使用統計等功能,可以提供模版式的一鍵安裝功能,提供可視化、便捷的監控告警功能,爲用戶提供界面化的系統運行環境自動檢查服務,幫助用戶實現一鍵式系統運行健康度巡檢和審計,保障系統的正常運行,下降系統運維成本。用戶查看檢查結果後,還可導出檢查報告用於存檔及問題分析,提供多租戶管理方案及功能介紹。

7

加強特性

要求支持Hive的數據與其餘關係型數據庫數據進行跨庫Join的功能,經過指定格式的建表語句在Hive建立關聯關係型數據庫的外表,提供這張表可執行Hive的查詢功能。

要求支持Hive on Spark,Hive生成的任務,除MapReduce任務外,還支持生成Spark任務,經過Spark來執行,從而縮短HQL的執行時間。

要求提供統一的API同時訪問HBase數據和Solr數據的能力,並將Solr的索引數據應用到HBase的查詢中,加速HBase數據的查詢。提供更方便的SQL接口訪問HBase數據,自動解析SQL的Where條件使用Solr的索引以HBase數據進行過濾加速。要求支持敏感詞過濾。每一個索引集能夠關聯對應的敏感詞集合,在查詢的過程當中,Solr服務能夠對返回結果進行處理,過濾掉其中的敏感詞。

要求提供大數據統一SQL的客戶端,實現大數據平臺SQL組件統一接入的能力。支持統一接入Hive,SparkSQL,Phoenix(HBase SQL層),以及可自定義對接符合JDBC接口的其它組件。支持鏈接統一管理,同一個鏈接內切換不一樣的組件運行。實現Hadoop單進程內進程內使用同一個組件驅動不一樣版本,避免多版本組件並行。提供統一的客戶端工具。

要求支持異構集羣部署,在集羣中存在不一樣硬件類型的服務器,容許在CPU類型,硬盤容量,硬盤類型,網卡類型,位置上有差別。支持數據存儲時,智能感知硬件信息,磁盤可用容量,自動均衡,達到性能合理利用;同時給管理員提供自定義存儲數據存儲位置的能力,以支持更加個性化的異構存儲策略。

支持服務資源週期調整,在共享大數據集羣中,多種服務共享使用集羣資源,各服務都存在着的繁忙時間段和空閒的時間段。該特性支持在不一樣的時間段設置不一樣的服務資源比例,達到集羣資源的合理利用。

支持將不一樣類型的業務數據存儲在RAM_DISK、DISK、ARCHIVE、SSD等存儲介質。

支持在Spark中直接經過SQL方式訪問HBase,方便用戶在Spark應用中對HBase中數據的交互處理。

提供高性能、具備持續化能力的Flume Channel,提供圖形化Flume配置界面,讓用戶易於配置Flume的source、channel、sink。支持Flume工做線程自恢復,提高Flume工做的穩定性。

提供機架組感知的副本放置策略,支持指定數據中心存儲數據。當部分數據中心故障,存在可靠的數據中心保障系統的高可用性。

8

開發服務

要求提供至少90人/天的開發支持服務。包括服務組件樣例指導、組件接口調用指導、數據導入指導以及表設計的指導。

9

配置及服務

*本次實際配置282個節點軟件受權永久許可,3年軟件維保服務

二、大數據流處理集羣

序號

指標項

參數要求

1

基本功能

提供內存數據庫Redis,版本不低於3.0

提供消息訂閱分發組件Kafka。

提供圖形化的安裝維護管理系統,支持嚮導式的集羣安裝

2

可靠性

包括集羣管理系統在內的全部業務組件的管理節點均實現雙機HA,業務無單點故障,且集羣總體掉電恢復後,可以正常恢復業務,並確保關鍵數據不丟失。提供相關技術文檔。

支持業務平面和管理平面隔離組網,保證業務可靠性

3

安全

全部組件均提供權限控制和接入認證能力

4

品牌要求

*與大數據平臺集羣爲同一品牌

5

配置及服務

*本次實際配置15個節點軟件永久受權許可,3年軟件維保服務

三、MPP數據庫集羣

序號

指標項

技術規格

1

技術架構

採用列存儲技術和MPP+Shared Nothing架構,全部節點無共享,對等計算能力;

採用自適應壓縮算法,根據不一樣分佈方式和數據類型自動選擇最優算法。支持三級壓縮選項,壓縮比可達1:20;

採用全自動維護的智能索引技術,無需人工創建索引;

2

基本功能

符合 SQL 92 標準,支持 CREATE、ALTER、DROP 等 DDL 語法,支持 SELECT、 INSERT、 UPDATE、 DELETE 等 DML 語法,支持單表,多表聯合查詢;

提供數據庫,表空間, 表,索引,視圖,存儲過程,自定義函數等經常使用數據庫對象的建立,修改和刪除操做,支持數據庫用戶的建立,刪除操做,以及用戶權限的分配與回收;

採用自動高效的並行 SQL 執行計劃,充分利用多核 CPU 資源,並行處理海量數據,具備智能的算法適配功能,針對不一樣的數據分佈及特徵,會智能地選擇不一樣算法進行處理;

提供豐富的集羣和數據庫管理,監控工具;

支持全文檢索:1.支持內置(中/英文)全文搜索引擎(支持按詞索引、按字索引、字詞混合索引的建立);2.支持全文數據和行列存表關聯查詢

要求至少支持百TB級的有效存儲容量

3

系統性能

採用基於策略的數據加載模式,集羣總體加載速度可達 2TB/h;

系統可以經過增長服務器節點對計算和存儲能力進行擴容,支持在線擴展,不中斷當前系統的運行,性能線性提高。可擴展節點數量達到百個節點以上規模;

4

配置及服務

*本次實際配置8個節點軟件永久受權許可,3年軟件維保服務

相關文章
相關標籤/搜索