GradNorm：Gradient Normalization for Adaptive Loss Balancing in Deep Multitask Networks，梯度歸一化

時間 2020-08-08

標籤 gradnorm gradient normalization adaptive loss balancing deep multitask networks 梯度歸一简体版

原文原文鏈接

文章目錄引言 gradnorm gradnorm論文地址：https://arxiv.org/abs/1711.02257html gradnorm是一種優化方法，在多任務學習（Multi-Task Learning）中，解決 1. 不一樣任務loss梯度的量級（magnitude）不一樣，形成有的task在梯度反向傳播中占主導地位，模型過度學習該任務而忽視其它任務；2. 不一樣任務收斂

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。