Automated Directed Fairness Testing

Aeqitas有效地生成輸入,以發現所有主題分類器中的存在的歧視性,並使用生成的測試輸入系統地提高各個模型的公平性。主要創新在於提出了一種新的搜索方法,擴充了原始的訓練集。    這篇論文主要是設計可擴展的技術,促進快速發現歧視性的輸入。主要思想是首先對輸入空間進行隨機採樣,以發現歧視性輸入的存在。然後,我們搜索這些輸入的鄰域,一般是設置向上和向下的一個單位爲基準進行搜索,以發現更多帶有歧視性輸入
相關文章
相關標籤/搜索