SQL Server 全文索引介紹（轉載）

概述

全文引擎使用全文索引中的信息來編譯可快速搜索表中的特定詞或詞組的全文查詢。全文索引將有關重要的詞及其位置的信息存儲在數據庫表的一列或多列中。全文索引是一種特殊類型的基於標記的功能性索引，它是由 SQL Server 全文引擎生成和維護的。生成全文索引的過程不一樣於生成其餘類型的索引。全文引擎並不是基於特定行中存儲的值來構造 B 樹結構，而是基於要編制索引的文本中的各個標記來生成倒排、堆積且壓縮的索引結構。在 SQL Server 2008 中，全文索引大小僅受運行 SQL Server 實例的計算機的可用內存資源限制。javascript

最近遇到一個需求，須要在一個100萬的表中經過關鍵字對一個大型字符字段進行檢索，相似於百度搜索引擎的搜索，查詢出全部包含關鍵字的數據並進行分頁處理，而且將匹配度最高的數據排在第一位，要求查詢響應時間控制在1秒左右。html

測試環境：SQL Server 2008 r2java

全文索引概念

全文索引是針對數據表，只能對錶建立全文索引，不能對數據庫建立全文索引。
每一個數據庫能夠不包含全文目錄或包含多個全文目錄，一個全文目錄能夠包含多個全文索引，但一個全文索引只能用於構成一個全文目錄。
一個數據表只能建立一個全文索引，一個全文索引能夠包含多個字段。
建立全文索引的表必需要有一個惟一的非空索引，而且這個惟一的非空的索引只能是一個字段，不能是組合字段。
每一個表只容許有一個全文索引。若要對某個表建立全文索引，該表必須具備一個惟一且非 Null 的列。您能夠對如下類型的列建立全文索引：char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 和 varbinary(max)，從而可對這些列進行全文搜索。對數據類型爲 varbinary、varbinary(max)、image 或 xml 的列建立全文索引須要您指定類型列。類型列是用來存儲每行中文檔的文件擴展名（.doc、.pdf、xls 等）的表列。

全文搜索由全文引擎提供支持。全文引擎有兩個角色：索引支持和查詢支持。git

全文搜索體系結構：sql

從 SQL Server 2008 開始，全文搜索體系結構包括如下進程：數據庫

SQL Server 進程 (sqlservr.exe)
篩選器後臺程序宿主進程 (fdhost.exe)。

SQL Server 進程組件：服務器

用戶表這些表包含要進行全文索引的數據。
全文收集器全文收集器使用全文爬網線程。它負責計劃和驅動對全文索引的填充，並負責監視全文目錄。
同義詞庫文件這些文件包含搜索項的同義詞。
非索引字表對象非索引字表對象包含對搜索無用的常見詞列表。
SQL Server 查詢處理器查詢處理器編譯並執行 SQL 查詢。若是 SQL 查詢包含全文搜索查詢，則在編譯和執行期間該查詢都會發送到全文引擎。查詢結果將與全文索引相匹配。
全文引擎 SQL Server 中的全文引擎現已與查詢處理器徹底集成。全文引擎編譯和執行全文查詢。做爲查詢執行的一部分，全文引擎可能會接收來自同義詞庫和非索引字表的輸入。在 SQL Server 2008 和更高版本中，SQL Server 的全文引擎在 SQL Server 查詢處理器內部運行。
索引編寫器（索引器）索引編寫器生成用於存儲索引標記的結構。
篩選器後臺程序管理器篩選器後臺程序管理器負責監視全文引擎篩選器後臺程序宿主的狀態。

篩選器後臺程序宿主組件：函數

篩選器後臺程序宿主是一個由全文引擎啓動的進程。它運行下列全文搜索組件，這些組件負責對錶中的數據進行訪問、篩選和斷字，同時還負責對查詢輸入進行斷字和提取詞幹：工具

篩選器後臺程序宿主的組件以下：post

協議處理程序此組件從內存中取出數據，以進行進一步的處理，並訪問指定數據庫的用戶表中的數據。其職責之一是從全文索引列中收集數據，並將所收集的數據傳遞給篩選器後臺程序宿主，從而由該宿主根據須要應用篩選和斷字符。
篩選器某些數據類型須要篩選，而後才能爲文檔中的數據（包括 varbinary、varbinary(max)、image 或 xml 列中的數據）建立全文索引。給定文檔採用何種篩選器取決於文檔類型。例如，Microsoft Word (.doc) 文檔、Microsoft Excel (.xls) 文檔和 XML (.xml) 文檔分別使用不一樣的篩選器。而後，篩選器從文檔中提取文本塊區，刪除嵌入的格式並保留文本，若有可能的話也會保留有關文本位置的信息。結果將以文本化信息流的形式出現。
斷字符和詞幹分析器斷字符是特定於語言的組件，它根據給定語言的詞彙規則查找詞邊界（「斷字」）。每一個斷字符都與用於組合動詞及執行變形擴展的特定於語言的詞幹分析器組件相關聯。在建立索引時，篩選器後臺程序宿主使用斷字符和詞幹分析器來對給定表列中的文本數據執行語言分析。與全文索引中的表列相關的語言將決定爲列建立索引時要使用的斷字符和詞幹分析器。

建立全文索引

啓動服務

在SQL Server配置管理工具中，找到'SQL Full-text Filter Daemon Launcher'服務用本地用戶啓動。

建立全文目錄

打開須要建立全文目錄的數據庫-存儲-全文目錄-右鍵新建全文目錄

用語句建立全文目錄

CREATE FULLTEXT CATALOG [FD_HouseSearch]WITH ACCENT_SENSITIVITY = ON
AS DEFAULT
AUTHORIZATION [dbo]

此外還能夠經過存儲過程建立全文目錄，而且能夠指定全文目錄文件所在磁盤上的位置，以下所示：

USE [pratice]
GO

Sql Full-Text Filter

SQL Server 全文索引介紹（轉載）

概述

目錄

全文索引概念

建立全文索引

啓動服務

建立全文目錄

建立全文索引

全文謂詞

需求

總結