編程珠璣 - 算法優化 - 過濾敏感詞 - 第二步:效率問題

就像上一步說的那樣,當敏感詞超過了必定量時候,效率將會急劇降低java

假設發佈內容「再頂」,敏感詞達到了1000個,按照快速實現的方法,循環1000次,顯然不是最優方法。優化

由於「再」,「頂」並無出如今"辦證、氣槍、裸聊"的第一個字集合"辦、氣、裸"中,因此咱們能夠考慮當蒐集全部敏感詞第一個字集合來快速判斷髮布內容是否含有敏感詞。
spa

package test;

import static util.PrintUtil.print;

import java.util.ArrayList;

public class Test {
	static String[] keys = {"辦證", "氣槍", "裸聊"};
	static String tContent = "再頂";
	static ArrayList<String> list = new ArrayList<String>();
	static {
		for (String k : keys) {
			if (!list.contains(k.substring(0, 1))) {
				list.add(k.substring(0, 1));
			}
		}
	}
	
	/**
	 * 快速實現的方法
	 */
	public final static String test1(String content) {
		for (String k : keys) {
			if (content.indexOf(k) > -1)
				return k;
		}
		return null;
	}
	
	/**
	 * 優化一
	 */
	public final static String test2(String content) {
		boolean bFirst = false;
		int length = content.length();
		for (int i = 0; i < length; i ++) {
			if (list.contains(content.substring(i, i + 1))) {
				bFirst = true;
				break;
			}
		}
		return bFirst ? test1(content) : null;
	}
	
	public static void main(String[] args) {
		long time1 = System.currentTimeMillis();
		print(test2(tContent));
		print("test2 time:" + (System.currentTimeMillis() - time1));
	}
}
相關文章
相關標籤/搜索