算法基石-實時數據質量如何保障?

優酷視頻搜索是文娛分發場最核心的入口之一,數據源多、業務邏輯複雜,尤其實時系統的質量保障是一個巨大挑戰。如何保障數據質量,如何衡量數據變化對業務的影響?本文會做詳細解答。 一、現狀分析 搜索數據流程如下圖所示,從內容生產到生成索引經歷了複雜的數據處理流程,中間表多達千餘張,實時數據消費即消失,難以追蹤和復現。 從上圖可以看出,整個系統以實時流模式爲數據流通主體,業務層面按實體類型打平,入口統一分層
相關文章
相關標籤/搜索