php-數據分析 餘弦類似度實現

<?php
/**
 * 數據分析引擎
 * 分析向量的元素 必須和基準向量的元素一致,取最大個數,分析向量不足元素以0填補。
 * 求出分析向量與基準向量的餘弦值
 * @author Foyon
 */


/**
 * 得到向量的模
 * @param unknown_type $array 傳入分析數據的基準點的N維向量。|eg:array(1,1,1,1,1);
 */
function getMarkMod($arrParam){
$strModDouble = 0;
foreach($arrParam as $val){
$strModDouble += $val * $val;
}
$strMod = sqrt($strModDouble);
//是否須要保留小數點後幾位
return $strMod;
}

/**
 * 獲取標杆的元素個數
 * @param unknown_type $arrParam
 * @return number
 */
function getMarkLenth($arrParam){
$intLenth = count($arrParam);
return $intLenth;
}
/**
 * 對傳入數組進行索引分配,基準點的索引必須爲k,求夾角的向量索引必須爲 'j'.
 * @param unknown_type $arrParam
 * @param unknown_type $index
 * @ruturn $arrBack
 */
function handIndex($arrParam, $index = 'k'){
foreach($arrParam as $key => $val){
$in = $index.$key;
$arrBack[$in] = $val; 
}
return $arrBack;
}

/**
 * 
 * @param unknown_type $arrMark標杆向量數組(索引被處理過)
 * @param unknown_type $arrAnaly 分析向量數組 (索引被處理過) |array('j0'=>1,'j1'=>2....)
 * @param unknown_type $strMarkMod標杆向量的模
 * @param unknown_type $intLenth 向量的長度
 */
function getCosine($arrMark, $arrAnaly, $strMarkMod ,$intLenth){
$strVector = 0;
$strCosine = 0;
for($i = 0; $i < $intLenth; $i++){
$strMarkVal = $arrMark['k'.$i];
$strAnalyVal = $arrAnaly['j'.$i];
$strVector += $strMarkVal * $strAnalyVal;
}
$arrAnalyMod = getMarkMod($arrAnaly); //求分析向量的模
$strFenzi = $strVector;
$strFenMu = $arrAnalyMod * $strMarkMod;
$strCosine = $strFenzi / $strFenMu;
if(0 !== (int)$strFenMu){
$strCosine = $strFenzi / $strFenMu;
}
return $strCosine;
}
?>
相關文章
相關標籤/搜索