apache項目概覽

igtop 是一個 Apache Hadoop 生態系統的開發、打包和測試系統 Avro是一個數據序列化系統,設計用於支持大 批量數據交換的應用。 HttpComponents也就是之前的httpclient項目,能夠用來提供高效的、最新的、功能豐富的支持 HTTP 協議的客戶端/服務器編程工具包,而且它支持 HTTP 協議最新的版本和建議 Hama 是個計算框架,基於BSP (Bulk Synchronous Parallel大容量同步並行)計算技術,主要針對大規模科學的計算 Apache Giraph 是一個可伸縮的分佈式迭代圖處理系統 Apache Forrest是一個把來自各類不一樣的輸入數據源轉換成用一種或多種輸出格式(好比HTML,PDF等)來統一顯示的發佈系統。 Flume 是一個分佈式、可靠和高可用的服務,用於收集、聚合以及移動大量日誌數據,使用一個簡單靈活的架構,就流數據模型。這是一個可靠、容錯的服務。 Apache 臨牀的文本分析和知識提取系統 (cTAKES) 是一個開源的天然語言處理系統,用於從臨牀電子病歷自由文本中抽取信息。可處理臨牀筆記抽取出統一的醫學語言系統(UMLS)——藥物,疾病/障礙,標誌/症狀,解剖網站和程序等。  Apache Crunch(孵化器項目)是基於Google的FlumeJava庫編寫的Java庫,用於建立MapReduce流水線。與其餘用來建立MapReduce做業的高層工具(如Apache Hive、Apache Pig和Cascading等)相似,Crunch提供了用於實現如鏈接數據、執行聚合和排序記錄等常見任務的模式庫。而與其餘工具不一樣的是,Crunch並不強制全部輸入遵循同一數據類型。相反,Crunch使用了一種定製的類型系統,很是靈活,可以直接處理複雜數據類型,如時間序列、HDF5文件、Apache HBase表和序列化對象(像protocol buffer或Avro記錄)等 Apache Cordova是一套設備API,容許移動應用的開發者使用JavaScript來訪問本地設備的功能,好比攝像頭、加速計。它能夠與UI框架(如jQuery Mobile或Dojo Mobile或Sencha Touch)等相結合使用,這些UI框架可使用HTML、CSS和JavaScript開發智能手機應用。 Apache Continuum是一個企業級持續集成服務器。提供的特性包括:自動構建、發佈管理、基於角色的權限管理、源碼控制系統、與其它流行構建工具相集成。無論你是否須要集中構建,仍是開發人員手動控制發佈。Continuum都可以幫助你改進質量和維護一個協調的構建環境。 Apache Commons包含了不少開源的工具,用於解決平時編程常常會遇到的問題,減小重複勞動 Cocoon的目標是幫助分離內容格式、邏輯和對基於XML的網站管理功能。 Apache James 簡稱 James, 是 Java Apache Mail Enterprise Server的縮寫。James 是100%基於Java的電子郵件服務器。它是一種獨立的郵件服務器,並提供了一個完整的電子郵件解決方案,用來收、發電子郵件。 JMeter是一款純Java編寫的壓力測試和性能測量工具。 Apache Kafka 看上去一個很不錯的分佈式消息通信框架 Apache Lenya 是java的開源內容管理系統(CMS)。它基於一些標準的技術好比XML 與 XSLT。它其中的代碼核心來自於另一個開源項目Cocoon. Lucene Apache通用日誌工具commons-logging和Log4j Apache Lucy 是一個全文搜索引擎庫,使用 C 語言編寫,主要面向一些動態語言,目前提供 Perl 語言的綁定。至關因而 C 語言版的 Lucene Apache MINA是一個網絡應用程序框架,用來幫助用戶簡單地開發高性能和高可靠性的網絡應用程序。它提供了一個經過Java NIO在不一樣的傳輸例如TCP/IP和UDP/IP上抽象的事件驅動的異步API。 MRUnit是由Couldera公司開發的專門針對Hadoop中 編寫MapReduce單元測試的框架,基本原理是JUnit4和 EasyMock OFBiz是一個很是著名的電子商務平臺 OpenNLP 是一個機器學習工具包,用於處理天然語言文本。支持大多數經常使用的 NLP 任務,例如:標識化、句子切分、部分詞性標註、名稱抽取、組塊、解析等。 PDFBox是Java實現的PDF文檔協做類庫,提供PDF文檔的建立、處理以及文檔內容提取功能,也包含了一些命令行實用工具。 Pig是一個基於Hadoop的大規模數據分析平臺,它提供的SQL-LIKE語言叫Pig Latin,該語言的編譯器會把類SQL的數據分析請求轉換爲一系列通過優化處理的MapReduce運算。Pig爲複雜的海量數據並行計算提供了一個簡單的操做和編程接口。 Portals:與門戶(Portal)技術相關的幾個項目集合 Apache Roller是一個功能豐富、多用戶、博客羣服務器,適合大小不一的博客站點。 Santuario:發展 XML 安全性方面的項目 SpamAssassin是Apache發佈的計算機程序許可證2.0,用於垃圾郵件過濾,基於內容的匹配規則。如今由Apache基金會維護。 Apache Stanbol 是一個爲語義內容管理設計的模塊化的軟件堆棧和可重用組件 Apache Tika 利用現有的解析類庫,從不一樣格式的文檔中(例如HTML, PDF, Doc),偵測和提取出元數據和結構化內容。 Tomcat: 一個運行 Java Servlet 與 JavaServer Pages(JSP)的容器。 Apache VCL 是一個自服務的系統,爲最終用戶提供專用計算環境的遠程訪問環境。典型的使用場景是數據中心,也能夠是物理刀片服務器、傳統機架服務器或者虛擬機。VCL 也能夠提供獨立機器的代理訪問。 Apache UIMA 是UIMA定義的Apache開源實現。UIMA是一個用於分析非結構化內容(好比文本、視頻和音頻)的組件架構和軟件框架實現。這個框架的目的是爲非結構化分析提供一個通用的平臺,從而提供可以減小重複開發的可重用分析組件。 UIMA 架構容許您輕鬆插入定製的分析組件,並將它們與其餘組件合併。您的 UIMA 應用程序不須要知道分析組件共同合做生成結果的細節。集成和組織多個分析組件是 UIMA 框架的工做。 UIMA 應用程序可能分析純文本並識別人員、位置和組織;它也可能識別關係,好比爲誰工做或在什麼地方工做。應用程序一般能夠拆分紅組件。例如 「語言識別」 => 「特定於語言的部分」 => 「句子範圍檢測」 => 「實體檢測(人員/位置的名稱等等)」。 而 VCL 的目的就是讓用戶經過 Web 界面來有限時間的使用這些計算資源。經過調度 API 可用於自動化管理服務器集羣和 HPC 集羣。 Xalan:XML 轉換處理器 Xerces-J 是 Java 版的 Xerces。Xerces是由Apache組織所推進的一項XML文檔解析開源項目,它目前有多種語言版本包括JAVA、C++、PERL、COM等。     HTTP Server: 能夠在UNIX,MS-Windows,Macintosh和Netware操做系統下運行的HTTP服務器的項目     Ant: 基於 Java 語言的構建工具,相似於 C語言 的Make工具。     AXIS2: Web服務(SOAP, WSDL)的處理器,基於AXIS1.X從新構建。     APR:(也就是:Apache Portable Runtime)C語言實現的便攜運行庫的管理工具。     Beehive:爲了簡單構建 J2EE 應用的對象模型。     Cocoon:一個基於組件技術和 XML 和 Web 應用開發框架。     DB:關於數據庫管理系統的幾個開源項目集合     Derby:一個純JAVA的數據庫管理系統     Directory:基於 JAVA 語言的目錄服務器,支持 LDAP 等目錄訪問協議。     Excalibur:Apache Avalon 項目的前身。     Forrest:一個發佈系統框架的項目。     Geronimo:J2EE 服務器     Gump:整合管理器     Hadoop:並行運算編程工具和分佈式文件系統。     Harmony:一個兼容 JAVA 標準的 JAVA 語言的開源實現。     HiveMind:一個服務(Services)與配置(configuration)的微內核     iBATIS:一個基於 JAVA 語言的數據持久化框架     Incubator:爲了幫助那些但願獲取Apache軟件基金會支持的計劃進入Apache軟件基金會的審覈項目     Jackrabbit:內容倉庫API標準(Content Repository for Java Technology API,即 JSR-170)的一個開源實現項目。     Jakarta: 在ASF中,基於 Java 語言的一組開源子項目的集合,如今包含的子項目有:BCEL,BSF,Cactus,Commons,ECS,HttpComponents,JCS,JMeter,ORO,Regexp,Slide,Taglibs,Turbine,Velocity     James:JAVA 語言實現的郵件新聞服務器     Labs:爲基金會成員提供最新變動的思惟的計劃     Lenya:內容管理系統     Logging: 一個開發能夠在C++、Java、Perl、PHP、.NET 計算機語言下運行的通用日誌工具項目集合。     Lucene: 高性能的,基於 Java 語言的全文檢索項目。     Maven:項目集成構建工具     MyFaces: 一個JavaServer Faces(JSF)的實現框架。     mod_perl:爲 Apache 服務器提供 Perl 語言整合的項目     POI:提供API以供JAVA程式對Microsoft Office格式檔案的讀/寫。     Portals:與門戶(Portal)技術相關的幾個項目集合     Santuario:發展 XML 安全性方面的項目     Shale:在 Struts 以後,發展起來基於 JAVA 語言Web應用框架     SpamAssassin:垃圾郵件過濾器     Struts: 一個基於 J2EE 平臺的 MVC 設計模式的Web應用框架     Tapestry: 另外一個 J2EE 平臺的、能產生動態、高性能 Web 應用的框架。     TCL:爲 Apache 服務器提供 Tcl 語言整合的項目     Tomcat: 一個運行 Java Servlet 與 JavaServer Pages(JSP)的容器。     Web Services:與 Web Services 技術相關的項目集合     Xalan:XML 轉換處理器     Xerces: 一組能夠在Java,C++,Perl 計算機語言下使用的 XML 解析器項目。     Apache XML:XML 解決方案     XMLBeans:基於 JAVA 語言XML對象綁定工具     XML Graphics:發展 XML 與圖形進行轉換的計劃項目
相關文章
相關標籤/搜索