以前在業務中應用了許多Faiss，也看了幾篇關於Faiss的論文，簡單記錄下Faiss的一些屬性和應用。Faiss是Facebook的AI團隊開源的一套用於作聚類或者類似性搜索的軟件庫，底層是用C++實現。Faiss由於超級優越的性能，被普遍應用於推薦相關的業務當中。接下來分Faiss在推薦業務應用和Faiss的基本原理兩部分進行介紹。git

1 Faiss在推薦業務中的應用

在個人認知裏，基本上50%以上的手機APP的推薦業務會應用到Faiss服務，可見應用之廣。那Faiss到底是在哪一個模塊使用呢，經過下方這個圖給你們介紹：github

你們都知道推薦業務包含排序和召回兩個模塊，Faiss比較多的應用在召回模塊。召回業務中有不少是向量生成類的算法，好比Graph Embedding、ALS Embedding、FM Embedding等。ALS就是經典的矩陣分解算法，它能夠將User和Item的行爲數據利用矩陣分解的方式生成User向量和Item向量，這些向量分別表明User和Item的屬性（工科研究生矩陣論課程學過矩陣分解，不懂的同窗要補課了）。算法

當咱們拿到了User和Item的向量，只要計算出哪些Item和User的向量距離較短（最簡單的解法是算歐式距離），就能夠得出User偏心的Item。可是當User和Item的數量巨大的時候，設想下某短視頻平臺，天天有上百萬User登陸，有存量的上千萬的Item短視頻，怎麼能快速的計算出向量距離，就成了一個亟待解決的技術難點，由於推薦業務的召回模塊須要在50ms之內拿到結果。這也就是Faiss的價值所在，Faiss幾乎能夠在10ms內完成百萬*百萬以上的向量距離計算，它是怎麼實現的呢？性能