搜索及數據處理 | Lucene | S | |
Solr | S | ||
Hadoop/Spark | S | ||
Nutch | A | ||
Tika | B | ||
Heritrix | C | ||
JAVA | JAVA SE | A | |
算法 | 基礎算法、搜索相關實用算法 | A | |
Java Web | JSP/Servlet、SSH、WS、Maven | B | |
Linux | Shell、管理 | B | |
雲計算 | 雲計算 | B | |
計算機基礎 | 軟件工程、設計模式、操做系統 | C | 設計模式爲B |
移動開發 | Android | C | |
前端 | HTML/CSS、JS、Ajax | C | |
數據庫 | Oracle、MySql | C | |
項目管理 | PMP、ITIL、SOA | C |
二、代碼大全html
三、數據處理相關1【未定】前端
四、JAVA核心技術java
五、人月神話/軟件工程web
六、鳥哥的Liunx私房菜算法
七、操做系統原理數據庫
八、數據處理相關2【未定】apache
九、雲計算相關【未定】設計模式
十、高效能人士的七個習慣
api
(1)書籍:Lucene in Action(基於3.0版本,有點舊)、解密搜索引擎技術(Lucene & Java精華版)oracle
(2)官方材料:http://lucene.apache.org/core/
(3)視頻:孔浩老師lucene視頻教程(基於3.5版本,講得還不錯,有部分Tika, Solr等內容)
(1)官方材料
快速入門:http://lucene.apache.org/solr/4_9_0/tutorial.html,以自帶的example項目快速介紹發Solr的基礎使用。
API:http://lucene.apache.org/solr/4_9_0/index.html
reference:PDF格式,apache-solr-ref-guide-4.9.pdf
(2)書籍
Solr in Action,基於4.7版本,極力推薦,此書適合用於學習,而官方的ref文檔適合於做爲參考手冊。
Apache Solr 4 Cookbook.pdf,基於4.0版本
(3)視頻
孔浩老師lucene視頻教程中有入門內容,另有Solr視頻,比較雜亂
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:Web Crawling and Data Mining with Apache Nutch
(2)官方資料:http://nutch.apache.org/ http://wiki.apache.org/nutch/大量的官方資料,如eclipse的安裝,如何Index等
(3)視頻:Nutch相關框架視頻教程_楊尚川
(1)書籍:Tika.in.Action(基於1.0版本,目前版本爲1.5)
(2)官方材料:http://tika.apache.org/
(3)視頻:孔浩老師lucene視頻教程中有入門內容
(1)書籍:開發本身的搜索引擎——Lucene+Heritrix(第2版)
(2)官方材料:Heritrix developer_manual.pdf Heritrix user_manual.pdf E:\0S 搜索引擎\0 重要資料\1 官方文檔\Heritrix\Heritrix1.14.4\heritrix-1.14.4\docs https://webarchive.jira.com/wiki/display/Heritrix/Heritrix【牆外,沒法訪問】
(3)視頻:
(1)書籍:Core Java, Thinking in Java
(2)官方API:http://docs.oracle.com/javase/8/docs/api/
(3)論壇:StackOverflow.com
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇:
(1)書籍:
(2)官方API:
(3)論壇: