基於互信息和左右信息熵的短語提取

1 互信息和信息熵的概念 2 算法流程 3 代碼實現算法 1 互信息和信息熵的概念 1.1 互信息 互信息體現了兩個變量之間的相互依賴程度。二元互信息是指兩個事件相關性的量, 計算公式以下:blog image.png 互信息值越高, 代表X和Y相關性越高, 則X和Y 組成短語的可能性越大; 反之, 互信息值越低,X 和Y之間相關性越低, 則X 和Y之間存在短語邊界的可能性越大。排序 公式中的X和
相關文章
相關標籤/搜索