基於PHP/CURL/codeIgniter的Spider Webbot爬蟲[5]-經常使用字符串處理函數式

stristr(haystack,needle) 區分大小寫 乾草堆和縫衣針//判斷haystack中是否存在needle。輸出bool真假
strstr不區分大小寫函數

strip_tags($string) 移除其中的HTML和PHP標記
str_replace("\t","",$string)//移除定位符號
str_replace(" ","",$string)//移除連續的空白
str_replace("\n","",$string)//移除換行符號code

similar_text($a,$b);統計兩個string的相同字符數
echo similar_text('first', 'second',$persent);
echo $persent;//輸出類似的百分比ip

自建函數
str_compare($a,$b)
//若是$b被$a徹底包含,則類似度會輸出100%
//是用similar_text的話,會輸出一個較低的百分比string

/*
//str_compare($a,$b);
//加強版的similar_text,能夠對徹底包容的字符進行容錯,若是$2被$1徹底包含,則輸出100%
function str_compare($str1, $str2) {
$count = 0;io

$str1 = preg_replace("[^a-z]", ' ', strtolower($str1));
while(strstr($str1, '  ')) {
    $str1 = str_replace('  ', ' ', $str1);
}
$str1 = explode(' ', $str1);

$str2 = preg_replace("[^a-z]", ' ', strtolower($str2));
while(strstr($str2, '  ')) {
    $str2 = str_replace('  ', ' ', $str2);
}
$str2 = explode(' ', $str2);

if(count($str1)<count($str2)) {
    $tmp = $str1;
    $str1 = $str2;
    $str2 = $tmp;
    unset($tmp);
}

for($i=0; $i<count($str1); $i++) {
    if(in_array($str1[$i], $str2)) {
        $count++;
    }
}

return $count/count($str2)*100;

}
*/function

相關文章
相關標籤/搜索