JSON.stringify()
在瀏覽器端或服務端,JSON.stringify()
都是咱們很經常使用的方法:html
在一些性能敏感的場合下(例如服務端處理大量併發),或面對大量 stringify 的操做時,咱們會但願它的性能更好,速度更快。這也催生了一些優化的 stringify 方案/庫,下圖是它們與原生方法的性能對比:git
綠色部分時原生JSON.stringify()
,可見性能相較這些庫都要低不少。那麼,在大幅的性能提高背後的技術原理是什麼呢?github
stringify
更快的 stringify
因爲 JavaScript 是動態性很強的語言,因此對於一個 Object 類型的變量,其包含的鍵名、鍵值、鍵值類型最終只能在運行時肯定。所以,執行JSON.stringify()
時會有不少工做要作。在一無所知的狀況下,咱們想要大幅優化顯然無能爲力。正則表達式
那麼若是咱們知道這個 Object 中的鍵名、鍵值信息呢 —— 也就是知道它的結構信息,這會有幫助麼?json
看個例子:數組
下面這個 Object,瀏覽器
const obj = { name: 'alienzhou', status: 6, working: true };
咱們對它應用JSON.stringify()
,獲得結果爲安全
JSON.stringify(obj); // {"name":"alienzhou","status":6,"working":true}
如今若是咱們知道這個obj
的結構是固定的:併發
那麼其實,我能夠建立一個「定製化」的 stringify 方法app
function myStringify(o) { return ( '{"name":"' + o.name + '","status":' + o.status + ',"isWorking":' + o.working + '}' ); }
看看咱們的myStringify
方法的輸出:
myStringify({ name: 'alienzhou', status: 6, working: true }); // {"name":"alienzhou","status":6,"isWorking":true} myStringify({ name: 'mengshou', status: 3, working: false }); // {"name":"mengshou","status":3,"isWorking":false}
能夠獲得正確的結果,但只用到了類型轉換和字符串拼接,因此「定製化」方法可讓「stringify」更快。
總結來看,如何獲得比 stringify
更快的 stringify
方法呢?
stringify
方法,其內部實際是經過字符串拼接生成結果的;這也是大多數 stringify 加速庫的套路,轉化爲代碼就是相似:
import faster from 'some_library_faster_stringify'; // 1. 經過相應規則,定義你的對象結構 const theObjectScheme = { // …… }; // 2. 根據結構,獲得一個定製化的方法 const stringify = faster(theObjectScheme); // 3. 調用方法,快速 stringify const target = { // …… }; stringify(target);
根據上面的分析,核心功能在於,根據其結構信息,爲該類對象建立「定製化」的stringify方法,其內部實際是簡單的屬性訪問與字符串拼接。
爲了瞭解具體的實現方式,下面我以兩個實現上略有差別的開源庫爲例來簡單介紹一下。
下圖是根據 fast-json-stringify 提供的 benchmark 結果,整理出來的性能對比。
能夠看到,在大多數場景下具有2-5倍的性能提高。
fast-json-stringify 使用了 JSON Schema Validation 來定義(JSON)對象的數據格式。其 scheme 定義的結構自己也是 JSON 格式的,例如對象
{ name: 'alienzhou', status: 6, working: true }
對應的 scheme 就是:
{ title: 'Example Schema', type: 'object', properties: { name: { type: 'string' }, status: { type: 'integer' }, working: { type: 'boolean' } } }
其 scheme 定義規則豐富,具體使用能夠參考 Ajv 這個 JSON 校驗庫。
fast-json-stringify 會根據剛纔定義的 scheme,拼接生成出實際的函數代碼字符串,而後使用 Function 構造函數在運行時動態生成對應的 stringify 函數。
在代碼生成上,首先它會注入預先定義好的各種工具方法,這一部分不一樣的 scheme 都是同樣的:
var code = ` 'use strict' ` code += ` ${$asString.toString()} ${$asStringNullable.toString()} ${$asStringSmall.toString()} ${$asNumber.toString()} ${$asNumberNullable.toString()} ${$asIntegerNullable.toString()} ${$asNull.toString()} ${$asBoolean.toString()} ${$asBooleanNullable.toString()} `
其次,就會根據 scheme 定義的具體內容生成 stringify 函數的具體代碼。而生成的方式也比較簡單:經過遍歷 scheme。
遍歷 scheme 時,根據定義的類型,在對應代碼處插入相應的工具函數用於鍵值轉換。例如上面例子中name
這個屬性:
var accessor = key.indexOf('[') === 0 ? sanitizeKey(key) : `['${sanitizeKey(key)}']` switch (type) { case 'null': code += ` json += $asNull() ` break case 'string': code += nullable ? `json += obj${accessor} === null ? null : $asString(obj${accessor})` : `json += $asString(obj${accessor})` break case 'integer': code += nullable ? `json += obj${accessor} === null ? null : $asInteger(obj${accessor})` : `json += $asInteger(obj${accessor})` break ……
上面代碼中的code
變量保存的就是最後生成的函數體的代碼串。因爲在 scheme 定義中,name
爲string
類型,且不爲空,因此會在code
中添加以下一段代碼字符串:
"json += $asString(obj['name'])"
因爲還須要處理數組、及聯對象等複雜狀況,實際的代碼省略了不少。
而後,生成的完整的code
字符串大體以下:
function $asString(str) { // …… } function $asStringNullable(str) { // …… } function $asStringSmall(str) { // …… } function $asNumber(i) { // …… } function $asNumberNullable(i) { // …… } /* 以上是一系列通用的鍵值轉換方法 */ /* $main 就是 stringify 的主體函數 */ function $main(input) { var obj = typeof input.toJSON === 'function' ? input.toJSON() : input var json = '{' var addComma = false if (obj['name'] !== undefined) { if (addComma) { json += ',' } addComma = true json += '"name":' json += $asString(obj['name']) } // …… 其餘屬性(status、working)的拼接 json += '}' return json } return $main
最後,將code
字符串傳入 Function 構造函數來建立相應的 stringify 函數。
// dependencies 主要用於處理包含 anyOf 與 if 語法的狀況 dependenciesName.push(code) return (Function.apply(null, dependenciesName).apply(null, dependencies))
slow-json-stringify 雖然名字叫 "slow",但實際上是一個 "fast" 的 stringify 庫(命名很調皮)。
The slowest stringifier in the known universe. Just kidding, it's the fastest (:
它的實現比前面提到的 fast-json-stringify 更輕量級,思路也很巧妙。同時它在不少場景下效率會比 fast-json-stringify 更快。
slow-json-stringify 的 scheme 定義更天然與簡單,主要就是將鍵值替換爲類型描述。仍是上面這個對象的例子,scheme 會變爲
{ name: 'string', status: 'number', working: 'boolean' }
確實很是直觀。
不知道你注意到沒有
// scheme { name: 'string', status: 'number', working: 'boolean' } // 目標對象 { name: 'alienzhou', status: 6, working: true }
scheme 和原對象的結構是否是很像?
這種 scheme 的巧妙之處在於,這樣定義以後,咱們能夠先把 scheme JSON.stringify
一下,而後「扣去」全部類型值,最後等着咱們的就是把實際的值直接填充到 scheme 對應的類型聲明處。
具體如何操做呢?
首先,能夠直接對 scheme 調用JSON.stringify()
來生成基礎模版,同時借用JSON.stringify()
的第二個參數來做爲遍歷方法收集屬性的訪問路徑:
let map = {}; const str = JSON.stringify(schema, (prop, value) => { const isArray = Array.isArray(value); if (typeof value !== 'object' || isArray) { if (isArray) { const current = value[0]; arrais.set(prop, current); } _validator(value); map[prop] = _deepPath(schema, prop); props += `"${prop}"|`; } return value; });
此時,map
裏收集全部屬性的訪問路徑。同時生成的props
能夠拼接爲匹配相應類型字符還的正則表達式,例如咱們這個例子裏的正則表達式爲/name|status|working"(string|number|boolean|undef)"|\\[(.*?)\\]/
。
而後,根據正則表達式來順序匹配這些屬性,替換掉屬性類型的字符串,換成統一的佔位字符串"__par__"
,並基於"__par__"
拆分字符串:
const queue = []; const chunks = str .replace(regex, (type) => { switch (type) { case '"string"': case '"undefined"': return '"__par__"'; case '"number"': case '"boolean"': case '["array-simple"]': case '[null]': return '__par__'; default: const prop = type.match(/(?<=\").+?(?=\")/)[0]; queue.push(prop); return type; } }) .split('__par__');
這樣你就會獲得chunks
和props
兩個數組。chunks
裏包含了被分割的 JSON 字符串。以例子來講,兩個數組分別以下
// chunks [ '{"name":"', '","status":"', '","working":"', '"}' ] // props [ 'name', 'status', 'working' ]
最後,因爲 map 中保存了屬性名與訪問路徑的映射,所以能夠根據 prop 訪問到對象中某個屬性的值,循環遍歷數組,將其與對應的 chunks 拼接便可。
從代碼量和實現方式來看,這個方案會更輕便與巧妙,同時也不須要經過 Function、eval 等方式動態生成或執行函數。
雖然不一樣庫的實現有差別,但從總體思路上來講,實現高性能 stringify 的方式都是同樣的:
歸根到底,它本質上是經過靜態的結構信息將優化與分析前置了。
最後,仍是想提一下