AllenNLP實踐——fine-tune

AllenNLP的commands命令中有一個fine-tune命令,可以在新的數據集上訓練模型,或者在原來的模型上繼續訓練。 fine-tune命令跳過配置文件的model部分,即網絡結構是要固定下來的,其他參數可以變。 比如可以在配置文件設置trainer的no_grad,凍結一些層,讓他們不進行參數更新,而其他層的參數正常更新。 以qanet.jsonnet爲例 在windows中首先要去掉
相關文章
相關標籤/搜索