URL

Bookmarks

 

書籤欄

 

公司

 

大數據

 

大數據

 

Kafka

 

apache kafka技術分享系列(目錄索引) - 李志濤的專欄 - 博客頻道 - CSDN.NET
Apache Kafka
KafkaProducer (clients 0.8.2.0 API)
Kafka使用入門教程 - 簡單介紹_服務器應用_Linux公社-Linux系統門戶網站
users@kafka.apache.org Archives
kafka配置
GitHub - yahoo/kafka-manager: A tool for managing Apache Kafka.

 

hadoop

 

Hadoop 2.X 徹底分佈式部署安裝_百度經驗
hadoop2.3.0安裝及eclipse開發環境配置-jingwei269-ITPUB博客

 

HBase

 

HBase 0.98發佈,安全和性能提高 - 數據庫 - ITeye資訊
Apache HBase ™ Reference Guide
HBase – Project Mailing Lists
Deprecated List (HBase 2.0.0-SNAPSHOT API)
HBase 經常使用Shell命令 - 殘雪餘香 - 博客園
HBase源碼分析_百度文庫
HBase -ROOT-和.META.表結構 - greatwqs : Where amazing happens ... - ITeye技術網站
查看HBase表在HDFS中的文件結構 - 51CTO.COM
HBase修改壓縮格式及Snappy壓縮實測分享 - 石頭兒 - 博客園
HBase的Compact和Split源碼分析與應用--基於0.94.5 - anhuidelinger的專欄 - 博客頻道 - CSDN.NET
HBase compact 總結 及 調優配置 - CSDN博客
dev@hbase.apache.org Archives
Apache HBase
org.apache.hadoop.hbase.coprocessor.AggregateImplementation 來統計表的行數 - xiao_jun_0820的專欄 - 博客頻道 - CSDN.NET
Hbase - 記錄分享每一點進步和成長 - 博客頻道 - CSDN.NET
hbase region split 源碼分析 - - ITeye技術網站
HBase配置性能調優(轉) - ggjucheng - 博客園
HBase - 文章 - 伯樂在線
Newest 'hbase' Questions - Stack Overflow
【甘道夫】HBase隨機宕機事件處理 & JVM GC回顧 - 甘道夫的大數據進化論 - 博客頻道 - CSDN.NET
HBase 在HDFS 上的目錄樹 - 殘雪餘香 - 博客園
【甘道夫】HBase隨機宕機事件處理 & JVM GC回顧 - 甘道夫的大數據進化論 - 博客頻道 - CSDN.NET
分佈式數據庫 Hbase 的高可用管理和監控

 

Spark

 

Spark亞太研究院系列叢書——Spark實戰高手之路 從零開始_讀書頻道_51CTO.COM_領先的中文IT技術網站
Spark 1.0.2 ScalaDoc - spark - Spark 1.0.2 ScalaDoc - org.apache.spark
Tachyon:Spark生態系統中的分佈式內存文件系統-CSDN.NET
大數據 - 隨筆分類 - bourneli - 博客園
spark1.2api
Spark 緩存管理-CacheManger完全解密源碼 - 在雲端-Spark,Hadoop,Scala,Workflow,blabla - ITeye技術網站
user@spark.apache.org Archives
Spark入門實戰系列--6.SparkSQL(上)--SparkSQL簡介 - shishanyuan - 博客園
Spark入門實戰系列--10.分佈式內存文件系統Tachyon介紹及安裝部署 - shishanyuan - 博客園
Documentation | Apache Spark
Frequent 'apache-spark' Questions - Stack Overflow
本地開發spark代碼上傳spark集羣服務並運行(基於spark官網文檔) - stark_summer的專欄 - 博客頻道 - CSDN.NET
Spark 調優 - 技術翻譯 - 開源中國社區

 

Zookeeper

 

ZooKeeper原理及使用 - 就是你的博客 - 博客頻道 - CSDN.NET
zookeeper使用和原理探究(一) - BucketLi - BlogJava
ZooKeeper常見問題(轉) - 天上盡是飛機 - 博客頻道 - CSDN.NET
zookeeper超時--minSessionTimeout與maxSessionTimeout - xiaolang85的專欄 - 博客頻道 - CSDN.NET
Apache Curator Examples –
ZooKeeper/FAQ - Hadoop Wiki
ZooKeeper: Because Coordinating Distributed Systems is a Zoo
zookeeper項目使用幾點小結 - <starhu> - 博客園

 

ES

 

Java API
Elasticsearch: The Definitive Guide [2.x] | Elastic
TooManyClauses[maxClauseCount is set to 1024] - Elasticsearch - Discuss the Elastic Stack
Query DSL: Allow to control (globally) the max clause count for `bool` query (defaults to 1024) · Issue #482 · elastic/elasticsearch · GitHub
Elasticsearch的[monitor.jvm]垃圾回收日誌 - Jeffrey Zhou 的專欄 - 博客頻道 - CSDN.NET

 

LDA漫遊指南_正版電子書在線閱讀_百度閱讀
Apache Solr查詢語法(轉) - ct - 博客園
94-搜索引擎_elasticSearch - 隨筆分類 - MR-fox - 博客園
elasticsearch - july_2的專欄 - 博客頻道 - CSDN.NET
wait_for - Waits for a condition before continuing. — Ansible Documentation
【HDFS】FusionInsight-HDFS-FAQ - 論壇 - 華爲企業互動社區
[Elasticsearch] 多字段搜索 (六) - 自定義_all字段,跨域查詢及精確值字段 - dm_vincent的專欄 - 博客頻道 - CSDN.NET
InfoQ - 促進軟件開發領域知識與創新的傳播

 

技術

 

數據庫

 

PostgreSQL新手教程_百度經驗
PostgreSQL建立用戶,數據庫,表 - Zhong Weicheng Study Notes - 博客頻道 - CSDN.NET
PostgreSQL服務器啓動和關閉方法介紹 - Socrates的專欄 - 博客頻道 - CSDN.NET
PostgreSQL新手入門 - 阮一峯的網絡日誌

 

UML

 

UML類圖實例 - Hello World - 博客頻道 - CSDN.NET
uml各種圖 - wangkangluo1 - 博客園
深刻淺出UML類圖(一) - 劉偉技術博客 - 博客頻道 - CSDN.NET
UML類圖幾種關係的總結 - OPEN 開發經驗庫
UML 中關係詳解以及在visio中的表示 - kittywei - 博客園

 

序列化

 

java內置的序列化方式性能 protostuff - john521 - ITeye技術網站
Unity手遊之路<二>Java版服務端使用protostuff簡化protobuf開發 - 遊戲自由之路 - 博客頻道 - CSDN.NET
Google 開源技術protobuf - guisu,程序人生。 逆水行舟,不進則退。 - 博客頻道 - CSDN.NET

 

單元測試

 

java的mock測試框架(轉載) - 妙妙的我的空間 - 51Testing軟件測試網 51Testing軟件測試網-中國軟件測試人的精神家園

 

Scala

 

Scala之旅-class和object詳解 - jiangpeng59的專欄 - 博客頻道 - CSDN.NET

 

開發

 

idea打包jar的多種方式 - byhieg - 博客園

 

運維

 

記一次 superblock 損壞致使服務器沒法啓動的故障修復 - Dancefire 的技術博客 - C++博客

 

WebService

 

使用Eclipse自帶的Axis1插件生成Web Service服務端/客戶端 - 懷揣夢想,努力前行 - 博客頻道 - CSDN.NET

 

監控和性能優化

 

JVM調優總結(十)-調優方法 - 和你在一塊兒 - ITeye技術網站
使用 VisualVM 進行性能分析及調優
JVM性能調優 - 老碼農的專欄 - 博客頻道 - CSDN.NET
如何使用JVisualVM進行性能分析 - 加俊 - ITeye技術網站
Java jvisualvm簡要說明 - 懷揣夢想,努力前行 - 博客頻道 - CSDN.NET
成爲JavaGC專家Part II — 如何監控Java垃圾回收機制 - ImportNew

 

Java SE - Downloads | Oracle Technology Network | Oracle
Java XML - helloworldhellobbboy的專欄 - 博客頻道 - CSDN.NET
Apache CXF_所有文檔 - OPEN開源文檔
CXF WebService開發指南、技術文檔.docx - Apache CXF - OPEN開源文檔
Java操做Hbase進行建表、刪表以及對數據進行增刪改查,條件查詢 - JavaCrazyer的ItEye(codewu.com)技術博客 - ITeye技術網站
cron表達式詳解 - Ruthless - 博客園
Apache CXF實戰之二:集成Sping與Web容器 - 51CTO.COM
如何修改Maven的JDK版本_百度經驗
Maven錯誤信息:Missing artifact jdk.tools:jdk.tools:jar:1.6 - 沉底的石頭 - 博客頻道 - CSDN.NET
RSync實現文件備份同步 - iTech - 博客園
Learn UML with JUDE - Mr. David 專欄 - 博客頻道 - CSDN.NET
Linux中變量$#,$@,$0,$1,$2,$*,$$,$?的含義 - jihite - 博客園
alternatives命令用法 - chszs的專欄 - 博客頻道 - CSDN.NET
使用HttpUrlConnection進行post請求上傳文件 - 努力,讓生活變得更美好 - ITeye技術網站
Linux上的free命令詳解 - coldplayerest - 博客園
Linux IO實時監控iostat命令詳解 - ggjucheng - 博客園
Linux下定時執行腳本 - Decode360's Blog - BlogJava
NFS服務器設置及mount命令掛載 - kevinhg的博客 - 博客頻道 - CSDN.NET
多臺CentOS服務器時間同步(NTP時間同步) - Be the best myself - 博客頻道 - CSDN.NET
設計模式之單例模式(線程安全) - 旭東的博客 - 博客園
Index of release/org/springframework/spring
Ansible Documentation

 

技術網站

 

CSDN.NET - 全球最大中文IT社區,爲IT專業技術人員提供最全面的信息傳播和服務平臺
InfoQ - 促進軟件開發領域知識與創新的傳播
Maven Repository: Search/Browse/Explore
IBM developerWorks 中國 : IBM developerWorks : 技術主題
GitHub · Where software is built
Available Mailing Lists
博客園 - 開發者的網上家園
stackoverflow.com
apache - Wiki

 

其它

 

eclipse 配置黑色主題 - csulennon - 博客園
[雲計算] IntellijIDEA14.1.4Scala開發環境搭建 | 軟件世界網
JAVA IDE IntelliJ IDEA使用簡介(二)—之基本操做 - 一步一步學習C/C++;一步一步深刻了解linux - 博客頻道 - CSDN.NET
深刻理解Hadoop (豆瓣)
深刻理解Hadoop - 圖書 - 亞馬遜
Google Translate
做爲程序員的你,經常使用的工具軟件有哪些? - 編程 - 知乎

 

tmp

 

新建文件夾

 

多網卡綁定_百度搜索
linux多網卡綁定bonding-yue306-ChinaUnix博客
如何配置多網卡綁定_百度經驗
HBase實戰系列2—Region監控 - 爲程序員服務
HBase深刻分析之RegionServer - 推酷
hbase region split策略 - kuyuyingzi的專欄 - 博客頻道 - CSDN.NET
JVM虛擬機選項:Xms Xmx PermSize MaxPermSize區別 - Smart Knight - BlogJava
JVM調優總結(十)-調優方法 - 和你在一塊兒 - ITeye技術網站
IntelliJ IDEA 使用心得與經常使用快捷鍵 - 碼農往事 - BlogJava
ASP.NET中JSON的序列化和反序列化 - Asharp - 博客園
HBase性能優化2—使用Coprocessor進行RowCount統計 | Binospace
Zookeeper從入門到精通 - HelloWorld
HBaseClient源碼分析 - luyee2010的專欄 - 博客頻道 - CSDN.NET
Hadoop - wangdi_ao的專欄 - 博客頻道 - CSDN.NET
hbase HTable之Put、delete、get等源碼分析-Hbase-about雲開發
zookeeper - Rebalancing issue while reading messages in Kafka - Stack Overflow
hbase region split 源碼分析 - - ITeye技術網站
HBase 學習筆記---守護進程及內存調優 - 其餘綜合 - 紅黑聯盟
HBase RegionServer宕機處理恢復 - emailed - 推酷
java - HBase: /hbase/meta-region-server node does not exist - Stack Overflow
hbase日誌出現Session expired異常排查方法 - fanbells的日誌 about雲開發
itindex.net/detail/49632-hbase-性能調優
hbase性能調優 | IT癮
HBase 默認配置 - 小菜鳥的成長之路 - ITeye技術網站
zookeeper - Rebalancing issue while reading messages in Kafka - Stack Overflow
hbase region split 源碼分析 - - ITeye技術網站
Kafka學習之broker配置(0.8.1版) - 推酷
apache kafka系列之kafka.common.ConsumerRebalanceFailedException異常解決辦法 - strawbingo的專欄 - 博客頻道 - CSDN.NET
zookeeper超時--minSessionTimeout與maxSessionTimeout - xiaolang85的專欄 - 博客頻道 - CSDN.NET
處理Zookeeper的session過時問題 - xylz,imxylz - BlogJava
實時系統HBase讀寫優化--大量寫入無障礙 - MrTitan的專欄 - 博客頻道 - CSDN.NET
HBase性能優化方法總結 | 量子恆道官方博客
HBase一次慢查詢請求的問題排查與解決過程 - 大圓那些事 - 博客園
HBase compact 總結 及 調優配置 - CSDN博客
HBase解決Region Server Compact過程佔用大量網絡出口帶寬的問題 - 大圓那些事 - 博客園
[KAFKA-1387] Kafka getting stuck creating ephemeral node it has already created when two zookeeper sessions are established in a very short period of time - ASF JIRA
往hdfs上追加數據【hadoop寫數據】-HDFS-about雲開發

 

Hbase總結(八)Hbase中的Coprocessor - 記錄分享每一點進步和成長 - 博客頻道 - CSDN.NET
Hbase總結(十)Hhase性能調優 - 記錄分享每一點進步和成長 - 博客頻道 - CSDN.NET
Spark入門實戰系列--6.SparkSQL(上)--SparkSQL簡介 - shishanyuan - 博客園

160220

 

Apache Ignite(一):簡介以及和Coherence、Gemfire、Redis等的比較 - 李玉珏的技術博客 - 開源中國社區
《Spark/Tachyon:基於內存的分佈式存儲系統》-史鳴飛(英特爾亞太研發有限公司大數據軟件部工程師) | 七牛雲存儲
JAVA IDE IntelliJ IDEA使用簡介(三)—之你不能忘記的快捷鍵 - 一步一步學習C/C++;一步一步深刻了解linux - 博客頻道 - CSDN.NET
Tachyon 0.7.0僞分佈式集羣安裝與測試 – 過往記憶
敢說 Apache Ignite 比 Tachyon 好?刪帖! - 開源中國社區
spark tachyon 搭建 配置 - - ITeye技術網站
tachyon與hdfs,以及spark整合 - stark_summer - ITeye技術網站
tachyon與hdfs,以及spark整合 - stark_summer的專欄 - 博客頻道 - CSDN.NET

 

0305

 

Scala 強大的集合數據操做示例 - 志旺的博客 - 博客頻道 - CSDN.NET
JAVA IDE IntelliJ IDEA使用簡介(三)—之你不能忘記的快捷鍵 - 一步一步學習C/C++;一步一步深刻了解linux - 博客頻道 - CSDN.NET
Re: how to debug ExecutorLostFailure
Spark使用總結與分享 - bourneli - 博客園
spark 使用中會遇到的一些問題及解決思路 - xiao_jun_0820的專欄 - 博客頻道 - CSDN.NET
Spark:RDD理解
jvm - datastax : Spark job fails : Removing BlockManager with no recent heart beats - Stack Overflow
Spark使用總結與分享 - bourneli - 博客園

 

0311

 

spring 定時任務的 執行時間設置規則 - grous的專欄 - 博客頻道 - CSDN.NET
Spring定時任務的幾種實現 - - ITeye技術網站
新手淺談Future - 文醬 - 博客園

 

新建文件夾423

 

Spark使用總結與分享 - bourneli - 博客園
Matei Zaharia:Spark的現狀和將來_圖文_百度文庫
Scala學習筆記5 (集合 Collections) - lyrebing的專欄 - 博客頻道 - CSDN.NET

 

新建文件夾0429

 

Overview - Spark 1.5.2 Documentation
Frequent 'apache-spark' Questions - Stack Overflow
Frequent 'apache-spark' Questions - Stack Overflow
scala - How to convert rdd object to dataframe in spark - Stack Overflow
hadoop 常見錯誤 - hello - 博客頻道 - CSDN.NET
【年度案例】大數據盤點之Spark篇-高可用架構-微頭條(wtoutiao.com)
校長:技術成長四個階段須要的架構知識-高可用架構-微頭條(wtoutiao.com)
Spark技術內幕:Executor分配詳解-博客-雲棲社區-阿里雲
spark 使用中會遇到的一些問題及解決思路 - xiao_jun_0820的專欄 - 博客頻道 - CSDN.NET
HeapDumpOnOutOfMemoryError堆轉儲實踐和一些分析 - Iteye博客 - ITeye技術網站

 

0507

 

新建文件夾

 

Spark Release 1.6.0 | Apache Spark
ElasticSearch在linux上的安裝部署全程記錄 - 天際霄鷹 - 博客園
使用Java調用ElasticSearch提供的相關API進行數據搜索完整實例演示 - 推酷
大數據下的日誌--ElasticSearch部分(二)--結合Java基本操做 - 許恕 - 博客頻道 - CSDN.NET
Elasticsearch基礎教程 - - 博客頻道 - CSDN.NET
ElasticSearch首頁、文檔和下載 - 分佈式搜索引擎 - 開源中國社區
elasticsearch的javaAPI之query - 推酷
分佈式搜索Elasticsearch——QueryBuilders.matchPhraseQuery | 學步園
使用java訪問elasticsearch建立索引 - - ITeye技術網站
ElasticSearch的基本用法與集羣搭建 - 阿凡盧 - 博客園
elasticsearch-查詢基礎篇 - Danny Chen - 博客園
Docs
elasticsearch java or_百度搜索
ElasticSearch Java api 詳解_V1.0-布布扣-bubuko.com
[Elasticsearch] 全文搜索 (二) - 多詞查詢及查詢的合併 - dm_vincent的專欄 - 博客頻道 - CSDN.NET
ElasticSearch 查詢語法 - 蟈蟈俊 - 推酷
ElasticSearch Java api 詳解_V1.0-布布扣-bubuko.com
使用Java調用ElasticSearch提供的相關API進行數據搜索完整實例演示 - 推酷

 

513

 

kill掉yarn正在運行的job - canglingye的專欄 - 博客頻道 - CSDN.NET
elasticsearch 查詢(match和term) - 軒脈刃 - 博客園
怎麼解決java.lang.NoClassDefFoundError錯誤 - jamesjxin的專欄 - 博客頻道 - CSDN.NET
elasticsearch-查詢基礎篇 - Danny Chen - 博客園
使用Java調用ElasticSearch提供的相關API進行數據搜索完整實例演示 - 推酷
Index API

 

0604

 

kafka不消費 - 君涯的專欄 - 博客頻道 - CSDN.NET
Shell調試篇 - perlman - 博客園
linux中shell變量$#,$@,$0,$1,$2的含義解釋 - fhefh - 博客園
linux shell自定義函數(定義、返回值、變量做用域)介紹_linux shell_腳本之家
bash編程 奇怪的錯誤 腳本空行報錯 數組沒法正常工做 - Linux/Unix - $r: command not found - bash - Linux - shell - Unix - 使用 - 如何 - 字符串 - 定義 - 執行 - 報錯 - 數組 - 空白 - 空行 - 編程 - 腳本 - 運行 - DigDeeply's Blog | 我的博客 | 技術博客

 

0618

 

用Jersey開發RESTful服務 -解道Jdon
hbase平常操做以及平常維護 - 北遊運維 - 開源中國社區
Wiztools RESTclient 使用說明_百度文庫
使用 soapUI 測試 REST 服務
測試rest接口的兩個工具使用詳解(restclient+soapUI) - Alexia(minmin) - 博客園
Hadoop HDFS 升級到2.0 筆記
hadoop 常見錯誤 - hello - 博客頻道 - CSDN.NET
elasticSearch學習筆記 - 自由出土文物 - 博客園
Elasticsearch入門介紹 - xingoo - 博客園
elasticsearch 集羣 - 軒脈刃 - 博客園
使用assembly將maven項目pom.xml中的jar包打包 - Pasier - 博客園

 

0708

 

hadoop集羣崩潰恢復記錄 - lskyne的專欄 - 博客頻道 - CSDN.NET
Hadoop常見問題及解決方案 - zhaozheng7758的專欄 - 博客頻道 - CSDN.NET
關於Hadoop數據塊Miss在頁面提示的問題 - dajuezhao的專欄 - 博客頻道 - CSDN.NET
Hadoop :實踐環節–故意形成數據塊丟失 - 晨雪無痕 - 博客頻道 - CSDN.NET
模擬namenode宕機:數據塊損壞,該如何修復-大數據學習-about雲開發
HADOOP NAMENODE 崩潰恢復記錄【轉】_刀刀_新浪博客
linux文件系統問題:wrong fs type, bad option, bad superblock-lurou-ITPUB博客
HBase隨機宕機事件處理 & JVM GC回顧-Hbase-about雲開發
成爲JavaGC專家Part I -- 深刻淺出Java垃圾回收機制 - ImportNew

新建文件夾

 

linux shell數據重定向(輸入重定向與輸出重定向)詳細分析 - 程默 - 博客園
shell 輸出重定向(> >> 2>&1) - feng27156的專欄 - 博客頻道 - CSDN.NET
【原創】kafka server源代碼分析(一)
kafka在zookeeper中存儲結構 - 推酷

 

0716

 

Hadoop性能調優小結(一) - 研發管理
HBase - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
hbase的coprocessor使用 - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
提高HBase寫性能 - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
HLog代碼分析 - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
Hadoop優化與調整 – 過往記憶
爲何(hadoop基準測試中)HDFS寫入速度如此之慢? - Hadoop - 知乎
優化hbase的查詢提高讀寫速率優化案例及性能提高的幾種方法-大數據學習-about雲開發

 

0722

 

你若不離不棄,我必生死相依 - 面向對象 - 伯樂在線
ElasticSearch搜索實例含高亮顯示及搜索的特殊字符過濾_服務器應用_Linux公社-Linux系統門戶網站
Elasticsearch——Templates 模板 - july_2的專欄 - 博客頻道 - CSDN.NET
HBase - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
HBase 維護--查看HLog和HFile - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
提高HBase寫性能 - Hadoop、HBase、ElasticSearch、Storm、Kafka、Spark - 博客頻道 - CSDN.NET
elasticsearch更改mapping(不停服務重建索引) - 推酷
[Elasticsearch] 多字段搜索 (六) - 自定義_all字段,跨域查詢及精確值字段 - dm_vincent的專欄 - 博客頻道 - CSDN.NET
(轉)ElasticSearch學習 - Danny Chen - 博客園
ElasticSearch的_all域 - Jeffrey Zhou 的專欄 - 博客頻道 - CSDN.NET
Logs for container_1469178292162_0003_01_000002

 

0806

 

Linux exec與重定向 - 編程的數學原理 - 博客頻道 - CSDN.NET
Java之美[從菜鳥到高手演變]之設計模式二 - 智慧演繹,無處不在 - 博客頻道 - CSDN.NET
[Elasticsearch] 過濾查詢以及聚合(Filtering Queries and Aggregations) - dm_vincent的專欄 - 博客頻道 - CSDN.NET
[Elasticsearch] 聚合 - 時間數據處理(Looking at Time) - dm_vincent的專欄 - 博客頻道 - CSDN.NET

 

0902

 

[Elasticsearch] 多字段搜索 (六) - 自定義_all字段,跨域查詢及精確值字段 - dm_vincent的專欄 - 博客頻道 - CSDN.NET
Elasticsearch: The Definitive Guide [2.x] | Elastic
視頻雲結構化服務器
Spark技術社區-CSDN.NET

新建文件夾

 

修改SecureCRT終端的Home和End功能鍵。 - 相濡以沫 - 51CTO技術博客
Elasticsearch重要文章之三:重要配置項的修改 - Andy - 開源中國社區
QuartZ Cron表達式 - sunjie - 博客園
quartz Cron表達式 每週執行一次要怎樣寫??? - 開源中國社區
[BAT][JAVA]定時任務之-Quartz使用篇 - 王德封-逐浪 - 博客頻道 - CSDN.NET
【HDFS】FusionInsight-HDFS-FAQ - 論壇 - 華爲企業互動社區

 

0910

 

[Elasticsearch] 過濾查詢以及聚合(Filtering Queries and Aggregations) - dm_vincent的專欄 - 博客頻道 - CSDN.NET
Elasticsearch java API (17)Aggregations 聚合 函數 - u012116196的專欄 - 博客頻道 - CSDN.NET
[轉載]Elasticsearch Java API總彙 - wmx3ng - 博客園
Java總結篇系列:Java泛型 - Windstep - 博客園
[Elasticsearch] 過濾查詢以及聚合(Filtering Queries and Aggregations) - dm_vincent的專欄 - 博客頻道 - CSDN.NET
ElasticSearch測試小例子 - 八荒六合惟我獨尊 - 博客頻道 - CSDN.NET
Elasticsearch 2.2.0 JAVA開發篇:搜索操做 - 賽克藍德的我的頁面 - 開源中國社區
elasticsearch JAVA客戶端操做---搜索的過濾、分組高亮,elasticsearchjava_雲計算 | 幫客之家
java - ElasticSearch - Using FilterBuilders - Stack Overflow
elasticsearch__5__java操做之FilterBuilders構建過濾器Query - GourdErwa - 博客頻道 - CSDN.NET
ElasticSearch的基本用法與集羣搭建 - 阿凡盧 - 博客園

 

0930

 

Apache Kafka
KafkaConsumer (clients 0.9.0.1 API)
Kafka使用入門教程 - 簡單介紹_服務器應用_Linux公社-Linux系統門戶網站
Elasticsearch寫入性能優化 - jamesjxin的專欄 - 博客頻道 - CSDN.NET
java定時調度器(Quartz)使用實例_java_腳本之家

 

1011

 

lftp用法手冊 - huxuanhui的空間 - 開源中國社區
linux下使用lftp的小結 - 酷酷的小魚兒 - 博客園
lftp使用方法以及配置 - 雨點的日誌 - 網易博客
Linux之ftp命令使用 - longxibendi的專欄 - 博客頻道 - CSDN.NET

 

0120

 

Running Spark on YARN - Spark 1.5.2 Documentation
併發隊列ConcurrentLinkedQueue和阻塞隊列LinkedBlockingQueue用法 - Ruthless - 博客園
Maven解決類包依賴衝突 - z69183787的專欄 - 博客頻道 - CSDN.NET
IntelliJ IDEA查尋依賴關係,解決jar包衝突 - 開源軟件

 

0210

 

HTTPS(SSL加密)webservice客戶端訪問總結 - FISH的專欄 - 博客頻道 - CSDN.NET
經過 https 鏈接webservice示例 - 羅羅的專欄 - 博客頻道 - CSDN.NET
如何經過HTTPS(SSL加密)方式訪問webservice - 周澤輝的CSDN博客... - 博客頻道 - CSDN.NET
4.3 大數據預研組 - 海康威視研究院 - 海康威視-企業wiki平臺
GC調優在Spark應用中的實踐-CSDN.NET

 

0218

 

Module ngx_http_ssl_module
完美配置Tomcat的HTTPS - huaishuming的專欄 - 博客頻道 - CSDN.NET
配置Tomcat使用https協議(配置SSL協議) - jimmy609的專欄 - 博客頻道 - CSDN.NET
Nginx 配置 SSL 證書 + 搭建 HTTPS 網站教程 - Chen Jian - 博客園
nginx配置HTTPS - 劉勇的博客 - 博客頻道 - CSDN.NET
spark 錯誤id意義_精品文庫_IThao123 - IT行業第一站

 

170224

 

hbase region 分配方式 - 爪哇攻城師 - 博客園
ZooKeeper/FAQ - Hadoop Wiki
Curator框架 - - 博客頻道 - CSDN.NET
Apache Curator Examples –
ASF Git Repos - curator.git/blob - curator-examples/src/main/java/framework/CreateClientExamples.java
zookeeper學習之三(Curator客戶端) - - ITeye技術網站
Spring—Quartz定時調度CronTrigger時間配置格式說明與實例 - 天天=生命的最後一天 - 博客頻道 - CSDN.NET
java日誌文件log4j.properties配置詳解 - 穆乙 - 博客園
log4j.properties 詳解與配置步驟 - edward0830ly的專欄 - 博客頻道 - CSDN.NET
zookeeper 大量鏈接斷開重連緣由排查 - hengyunabc的專欄 - 博客頻道 - CSDN.NET

 

新建文件夾

 

Overview - Spark 2.1.0 Documentation
Newest 'apache-spark' Questions - Stack Overflow
hbase meta表修復 - - ITeye技術網站
Zookeeper-Zookeeper leader選舉 - 橫刀天笑 - 博客園
ZooKeeper原理及使用 - 就是你的博客 - 博客頻道 - CSDN.NET
ZooKeeper入門簡介 - houzengjiang的專欄 - 博客頻道 - CSDN.NET
Zookeeper的功能以及工做原理 - FelixZh - 博客園
Hadoop及HBase使用過程當中的一些問題集-FreeOA
Hadoop常見問題及解決方案 - zhaozheng7758的專欄 - 博客頻道 - CSDN.NET
關於Hadoop數據塊Miss在頁面提示的問題 - dajuezhao的專欄 - 博客頻道 - CSDN.NET
Apache HBase ™ Reference Guide
HBase最佳實踐-讀性能優化策略 – 有態度的HBase/Spark/BigData

 

0324

 

新建文件夾

 

Spark - 大數據挖掘SparkExpert的博客 - 博客頻道 - CSDN.NET
hbase meta表修復 - u010316405的專欄 - 博客頻道 - CSDN.NET
HBase hbck——檢察HBase集羣的一致性 - xiao_jun_0820的專欄 - 博客頻道 - CSDN.NET
Hadoop:HDFS負載均衡 - 個人oracle學習之路 - 博客園
hadoop的dfs.replication和備份數問題 - lskyne的專欄 - 博客頻道 - CSDN.NET
刪除hbase表region塊腳本 - hua840812的專欄 - 博客頻道 - CSDN.NET
Java多線程-工具篇-BlockingQueue - jack.yujun - 博客園
JAVA進階----ThreadPoolExecutor機制 - 無量的IT生活 - ITeye技術網站
ThreadPoolExecutor使用介紹 - wangwenhui11的專欄 - 博客頻道 - CSDN.NET
阻塞隊列BlockingQueue - linghu_java的專欄 - 博客頻道 - CSDN.NET
JDK源碼分析—— ArrayBlockingQueue 和 LinkedBlockingQueue - Hama White 的博客 - 博客頻道 - CSDN.NET
併發隊列ConcurrentLinkedQueue和阻塞隊列LinkedBlockingQueue用法 - Ruthless - 博客園
Spark算子:RDD基本轉換操做(6)–zip、zipPartitions - MingFei的專欄 - 博客頻道 - CSDN.NET
Spark函數詳解系列之RDD基本轉換 - MOBIN - 博客園
Scala異常處理 - Scala教程
Spark高級 - 奇點的明天 - 博客園
SparkInternals/markdown at master · JerryLead/SparkInternals · GitHub
SparkInternals/readme.md at master · JerryLead/SparkInternals · GitHub
SparkInternals/5-Architecture.md at master · JerryLead/SparkInternals · GitHub
hadoop2集羣怎麼規劃-大數據-about雲開發
大數據架構系統部署應用介紹
大數據方案介紹_圖文_百度文庫
spark - 亞信聯創大數據平臺Li - 博客頻道 - CSDN.NET
grep 排除關鍵字_百度搜索
grep 搜索不包含關鍵字的行 - StepByStepTo的專欄 - 博客頻道 - CSDN.NET
replication factor: 3 larger than available brokers: 1 - 博客頻道 - CSDN.NET

 

0408

 

JVM調優總結(十)-調優方法 - 和你在一塊兒 - ITeye技術網站
JVM(Java虛擬機)優化大全和案例實戰 - 碧荷故鄉_胡奇的專欄 - 博客頻道 - CSDN.NET

 

170421

 

JVM調優總結(十)-調優方法 - 和你在一塊兒 - ITeye技術網站
JVM(Java虛擬機)優化大全和案例實戰 - 碧荷故鄉_胡奇的專欄 - 博客頻道 - CSDN.NET
CoolplaySpark/1.2 DStream 生成 RDD 實例詳解.md at master · lw-lin/CoolplaySpark

 

170519

 

kafka擴容節點和partitions遷移
如何移動Kafka部分分區的數據 – 過往記憶
HADOOP HDFS BALANCER介紹及經驗總結-大數據學習-about雲開發
kafka擴容節點和partitions遷移
java jvm 參數 -Xms -Xmx -Xmn -Xss 調優總結 - 學習筆記 - 51CTO技術博客
JVM調優總結 -Xms -Xmx -Xmn -Xss - unixboy - ITeye技術網站
JVM:垃圾回收機制和調優手段 - 一名java從業者的專欄 - 博客頻道 - CSDN.NET
JVM內存模型及垃圾回收算法 - 孤劍 - 博客園
視頻編解碼技術簡介_通識 - 研究院培訓中心 - 海康威視-企業wiki平臺
經常使用命令集合 - 海康威視研究院 - 海康威視-企業wiki平臺

 

tmp

 

解決CentOS開機進度條卡死centos
CentOS啓動卡在開機進度條certmonger解決方法centos
Elasticsearch建立Index--java實現 - ZK_小小世界的專欄 - 博客頻道 - CSDN.NET
HDFS的dfs.replication不一樣驗證 - 一個IT男的歷程 - ITeye技術網站
maven scope含義的說明 - 雨中漫步 - 51CTO技術博客
JUnit單元測試--IntelliJ IDEA - 華行天下 - 博客園

0414

 

JVM調優之jstack找出最耗cpu的線程並定位代碼 - 成風魄郎 - 博客園
Java自帶的性能監測工具用法簡介——jstack、jconsole、jinfo、jmap、jdb、jsta、jvisualvm - feihong247的專欄 - 博客頻道 - CSDN.NET
JAVA線程dump的分析 --- jstack pid - 無線&移動互聯網技術研發 - BlogJava
Kafka errors NotLeaderForPartitionException, TimeoutException: Batch containing * record(s) expired - Nothing is impossible - 博客頻道 - CSDN.NET
exception handling - Can I ignore org.apache.kafka.common.errors.NotLeaderForPartitionExceptions? - Stack Overflow
[Kafka-users] Fwd: kafka.common.NotLeaderForPartitionException when 1 broker of 2 is down - Grokbase
Spark Shuffle Write階段磁盤文件分析 - 簡書
簡單帥氣的甘特圖軟件有推薦的麼? - 知乎
spark 查看 job history 日誌 - stark_summer的專欄 - 博客頻道 - CSDN.NET
Kafka consumer fetching metadata for topics failed - Stack Overflow

Spark checkpointphp

http://blog.csdn.net/ljp812184246/article/details/53897613html

 

緩存有可能丟失,或者存儲存儲於內存的數據因爲內存不足而被刪除。經過基於RDD的一系列轉換,丟失的數據會被重算,因爲RDD的各個Partition是相對獨立的,所以只須要計算丟失的部分便可,並不須要重算所有Partition。
可是,屢次迭代後數據丟失的從新計算,會影響這個效率。所以,RDD的緩存容錯機制保證了即便緩存丟失也能保證快速的恢復,而不是從新計算。java

checkpoint保存的目錄是在HDFS目錄中,保證了存儲的可靠性。node

sc.setCheckpointDir("hdfs://master:9000/..")//會在..目錄建立一個文件夾 //對象面的rdd設置checkpoint rdd.checkpoint rdd.collect

checkpoint和cache同樣,是transformation
當遇到action時,checkpoint會啓動另外一個任務,將數據切割拆分,保存到設置的checkpoint目錄中。linux

在Spark的checkpoint源碼中提到,ios

    1. 當使用了checkpoint後,數據被保存到HDFS,此RDD的依賴關係也會丟掉,由於數據已經持久化到硬盤,不須要從新計算。
    2. 強烈推薦先將數據持久化到內存中(cache操做),不然直接使用checkpoint會開啓一個計算,浪費資源。
相關文章
相關標籤/搜索