Mysql全文搜索match against的用法

全文檢索在 MySQL 中就是一個 FULLTEXT 類型索引。FULLTEXT 索引用於 MyISAM 表,能夠在 CREATE TABLE 時或以後使用 ALTER TABLE 或 CREATE INDEX 在 CHAR、 VARCHAR 或 TEXT 列上建立
 
對於大的數據庫,將數據裝載到一個沒有 FULLTEXT 索引的表中,而後再使用 ALTER TABLE   (或 CREATE INDEX) 建立索引,這將是很是快的。將數據裝載到一個已經有 FULLTEXT 索引的表中,將是很是慢的。
1.使用Mysql全文檢索fulltext的先決條件
    表的類型必須是MyISAM
創建全文檢索的字段類型必須是char,varchar,text

2.創建全文檢索先期配置
因爲Mysql的默認配置是索引的詞的長度是4,因此要支持中文單字的話,首先更改這個.
*Unix用戶要修改my.cnf,通常此文件在/etc/my.cnf,若是沒有找到,先查找一下find / -name 'my.cnf'
在 [mysqld] 位置內加入:  
       ft_min_word_len     = 2
其它屬性還有
       ft_wordlist_charset = gbk
       ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt
       ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt
稍微解釋一下:
       ft_wordlist_charset 表示詞典的字符集, 目前支持良好的有(UTF-8, gbk, gb2312, big5)
       ft_wordlist_file 是詞表文件, 每行包括一個詞及其詞頻(用若干製表符或空格分開,消岐專用)
       ft_stopword_file 表示過濾掉不索引的詞表, 一行一個.
       ft_min_word_len     加入索引的詞的最小長度, 缺省是 4, 爲了支持中文單字故改成 2

3.創建全文檢索
在建表中用FullText關鍵字標識字段,已存在的表用 ALTER TABLE (或 CREATE INDEX) 建立索引
CREATE fulltext INDEX index_name ON table_name(colum_name);

4.使用全文檢索
    在SELECT的WHERE字句中用MATCH函數,索引的關鍵詞用AGAINST標識,IN BOOLEAN MODE是隻有含有關鍵字就行,不用在意位置,是否是起啓位置.
SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅遊' IN BOOLEAN MODE);

5.詳細的說明請參數Mysql官方網站
http://dev.mysql.com/doc/refman/5.1/zh/functions.html#fulltext-search
這是Mysql 5.1的,不過4.X也能夠作爲參考,基本一置.我用的就是Mysql 4.1.

 

MySQL支持全文索引(Full-Text) 已經好久了,目前,fulltext是一種只適用於MyISAM表的一個索引類型,並且對定義索引列的數據類型也有限制,只能是如下三種的組合char、 varchar、text。fulltext能夠在建立表的同時就一塊兒定義好,或者在表建立完成以後,經過語句alter table或create index來追加索引,總之前後的效果是同樣的,可是二者的效率倒是存在很大差別的,大量的實驗證實,對於大數量的表來講,先加載數據再來定義全文索引的 速度要遠遠優於在一個已經定義好全文索引的表裏面插入大量數據的速度。必定會問:這是問什麼呢?其實,道理很簡單,前者只須要一次性對你的索引列表進行操 做,排序比較都是在內存中完成,而後寫入硬盤;後者則要一條一條去硬盤中讀取索引表而後再進行比較最後寫入,天然這樣速度就會很慢。MySQL是 經過match()和against()這兩個函數來實現它的全文索引查詢的功能。match()中的字段名稱要和fulltext中定義的字段一致,如 果採用boolean模式搜索,也容許只包括fulltext中的某個字段,不須要所有列出。against()中定義的是所要搜索的字符串以及要求數據 庫經過哪一種模式去執行全文索引的搜索查詢。下面經過一個例子分別介紹一下fulltext所支持的3中搜索模式。php

MySQL全文索引與中文分詞總結及通常的關鍵詞搜索流程
http://www.tzlink.com/info/show.php?aid=4532html

mysql 全文檢索 中文分詞
http://hi.baidu.com/agg230/blog/item/33d3d50eada260e337d1225b.htmlmysql

支持中文的MySQL 5.1+ 全文檢索分詞插件
http://hi.baidu.com/start_and_end/blog/item/6d6ab918b7d3800334fa412e.htmlsql

家用一下搜索引擎就會發現,分詞的狀況只是出如今當整詞命中爲0的狀況下。
而具體怎樣分詞,你們能夠參考一下baidu搜索試驗結果:

·若是搜「徐祖寧寧」,結果爲「徐祖」+「寧寧」。(搜人名的狀況下,它可能有一個百家姓詞典,自動將姓後第一個字歸前)
·搜「徐寧願」,結果爲「徐寧願」。(說明「寧願」歸「徐」全部。同上。由於徐是姓。)
·搜「徐祖寧願」,結果爲「徐祖」+「寧願」。(由於「寧願」是詞,故「徐」只帶「祖」。)
·搜「徐祖寧高」,結果爲「徐祖寧」。(由於「寧高」不是關鍵字,因此「寧」歸前詞全部。而「高」可能由於是單字,爲提升前詞搜索效率故被省略。)數據庫

相關文章
相關標籤/搜索