OpenResty之replace-filter-nginx-module

原文: openresty/replace-filter-nginx-modulecss

1. 概要

location /t {
    default_type text/html;
    echo abc;
    replace_filter 'ab|abc' X;
}

location / {
    # proxy_pass/fastcgi_pass/...

    # caseless global substitution:
    replace_filter '\d+' 'blah blah' 'ig';
    replace_filter_types text/plain text/css;
}

location /a {
    # proxy_pass/fastcgi_pass/root/...

    # remove line-leading spaces and line-trailing spaces,
    # as well as blank lines:
    replace_filter '^\s+|\s+$' '' g;
}

location /b {
    # proxy_pass/fastcgi_pass/root/...

    # only remove line-leading spaces and line-trailing spaces:
    replace_filter '^[ \f\t]+|[ \f\t]+$' '' g;
}

location ~ '\.cpp$' {
    # proxy_pass/fastcgi_pass/root/...

    replace_filter_types text/plain;

    # skip C/C++ string literals:
    replace_filter "'(?:\\\\[^\n]|[^'\n])*'" $& g;
    replace_filter '"(?:\\\\[^\n]|[^"\n])*"' $& g;

    # remove all those ugly C/C++ comments:
    replace_filter '/\*.*?\*/|//[^\n]*' '' g;
}

2. 描述

該 Nginx 輸出過濾模塊嘗試儘量以非緩存模式執行正則表達式替換。html

該模塊沒有使用像 PCRE 這樣的傳統回溯正則表達式 engines,而是使用由做者實現的新的 sregex 庫,它從一開始就考慮了流處理。nginx

sregex 支持 Perl 5 正則表達式的一個很好的公共子集。關於完整的功能列表,可查看 sregex 的文檔: sregex Syntax Supported.git

響應體數據僅在絕對必要時才進行緩存,例如面對屬於數據塊邊界附近可能匹配的不完整捕獲。github

3. 指令

3.1 replace_filter

syntax: replace_filter <regex> <replace>

syntax: replace_filter <regex> <replace> <options>

defaultL no

context: http, server, location, location if

phase: output body filter

經過可選地正則標誌指定正則模式和要被替換爲的文本。正則表達式

By default, the filter topped matching after the first match is found. This behavior can be changed by specifying the g regex option.後端

支持以下正則選項:緩存

  • g:全局搜索和替換(默認關閉該功能)
  • i:不區分大小寫(默認關閉)

在一個單獨的字符串參數中能夠聯合多個選項,以下:服務器

replace_filter hello hiya ig;

Nginx 變量能夠插入到要替換的文本中,以下:less

replace_filter \w+ "[$foo,$bar]";

若是要使用 '$' 字符,則使用 '$$',例如:

replace_filter \w "$$";

支持使用子匹配捕獲變量,如 $&, $1, $2 等等,以下示例:

replace_filter [bc]|d [$&-$1-$2] g;

子匹配捕獲變量的語義與 Perl 5 語言徹底相同。

在同一範圍下支持多個 replace_filter 指令,全部的 pattern 將在 tokenizer 中同時應用。不會使用最長的 token 匹配語義,而是根據配置文件中的順序對 pattern 進行優先級排序。

以下示例是從 C/C++ 源文件中刪除全部的 C/C++ 註釋:

replace_filter "'(?:\\\\[^\n]|[^'\n])*'" $& g;
replace_filter '"(?:\\\\[^\n]|[^"\n])*"' $& g;
replace_filter '/\*.*?\*/|//[^\n]*' '' g;

Content-Encoding 響應頭部不爲空(相似 gzip)時,響應主體將始終保持不變。所以,若是是 ngx_proxy 模塊的話,一般須要在 nginx.conf 中添加以下行,以在後端服務器響應中禁用 gzip 壓縮:

proxy_set_header Accept-Encoding '';

響應仍然能夠在 Nginx 服務器級別上進行 gzip 壓縮。

3.2 replace_filter_types

syntax: replace_filter_types <mime-type> ...

default: replace_filter_types text/html

context: http, server, location, location if

phase: output body filter

指定要被處理的一個或多個 MIME 類型(在 Content-Type 響應頭部中)。

默認狀況下,僅處理 text/html 類型的響應。

3.3 replace_filter_max_buffered_size

syntax: replace_filter_max_buffered_size <size>

default: replace_filter_max_buffered_size 8k

context: http, server, location, location if

phase: output body filter

限制模塊在運行時緩衝的數據的總大小,默認爲 8k。

當達到限制值時,replace_filter 將當即中止處理,並保留全部剩餘的響應正文數據。

3.4 replace_filter_last_modified

syntax: replace_filter_last_modified keep | clear

default: replace_filter_last_modified clear

context: http, server, location, location if

phase: output body filter

控制如何去處理現有的 Last-Modified 響應頭。

默認狀況下,該模塊將清除 Last-Modified 響應頭(若是有)。能夠經過指定以下行來保留原始的 Last-Modified 響應頭:

replace_filter_last_modified keep;

3.5 replace_filter_skip

syntax: replace_filter_skip $var

default: no

context: http, server, location, location if

phase: output header filter

該指令控制是否基於每一個請求跳過全部的 replace_filter 規則。

該指令支持常量值或者包含 Nginx 變量的字符串。

當在請求輸出 header 階段將值評估爲空值("")或者值 "0" 時,將不會跳過當前請求的 replace_filter 規則。不然,將會跳過當前請求的全部 replace_filter 規則。

以下一個簡單的示例:

set $skip '';
location /t {
    content_by_lua '
        ngx.var.skip = 1
        ngx.say("abcabd")
    ';
    replace_filter_skip $skip;
    replace_filter abcabd X;
}

4. 安裝

首先安裝 sregex 庫: https://github.com/agentzh/sregex

而後從新編譯 Nginx:

./configure --add-module=/path/to/replace-filter-nginx-module

若是 sregex 不是安裝在默認前綴路徑下(如 /usr/local),則能夠在執行 ./configure 腳本前,經過 SREGEX_INCSREGEX_LIB 環境變量來指定 sregex 的安裝位置。

export SREGEX_INC=/opt/sregex/include
export SREGEX_LIB=/opt/sregex/lib

從 Nginx 1.9.11 版本以上,能夠在 ./configure 命令行上經過使用 --add-dynamic-module=PATH 選項來代替 --add-module=PATH ,從而將該模塊編譯爲動態模塊,而後在 ngxin.conf 上經過 load_module 指令顯示加載該模塊。

load_module /path/to/modules/ngx_http_replace_filter_module.so;
相關文章
相關標籤/搜索