自然語言處理實戰:機器學習常見工具與技術

許多自然語言處理都涉及機器學習,所以理解機器學習的一些基本工具和技術是有益處的。有些工具已經在前幾章中討論過,有些還沒有,但這裏我們會討論所有這些工具。 D.1 數據選擇和避免偏見 數據選擇和特徵工程會帶來偏見的風險(用人類的話來說)。一旦我們把自己的偏見融入算法中,通過選擇一組特定的特徵,模型就會適應這些偏見併產生帶有偏差的結果。如果我們足夠幸運能在投入生產之前發現這種偏見,那麼也需要投入大量的
相關文章
相關標籤/搜索