Whoosh 原理與實戰1--Python 搜索框架 Whoosh 簡介

       Whoosh 是一個純 Python 編寫的搜索框架,相似於Lucene。比較簡單,能夠快速構建站內搜索。也能夠在此基礎上構建搜索引擎,但須要本身擴展 爬蟲Spider 和 中文分詞組件。 框架

Whoosh詳細能夠查看 http://www.oschina.net/p/whoosh ide

      最近構思了一個我的網站,準備採用 Python 開發,主要看重 Python 快速構建能力(固然,我不太會 Python,這也算一個 Python的學習做品,開發不必定快哈)。網站初步包括新聞、博客、社區,這三個版塊須要站內搜索;同時有一個資訊版塊,須要構建一個主題搜索引擎。這裏都採用 Whoosh 做爲基礎,而後本身實現 Spider、中文分詞完成。 學習

下面將逐步介紹: 網站

1. Whoosh 原理與實戰 搜索引擎

2. Python 中文分詞設計與開發 spa

3. Spider 設計與開發 .net

因爲須要邊學習邊寫做,這隻能算做個人 Python學習筆記。可能一些內容不太準確、合理,但願你們指正。 設計

相關文章
相關標籤/搜索