java生成tfrecord文件

最近在做一個ner識別模型,用算法標註了一億出頭的數據,剛剛開始用python生成tfrecord文件,這一步非常的費時間,一億條數據每一千萬生成一個文件差不多要兩個半小時的時間才能生成完成,左思右想想找一種快的方法,前幾天看到美團公衆號發了一篇文章關於ctr模型,其中有一句話印象深刻用spark生成tfrecord文件,雖然一筆帶過,受到啓發,既然是jvm系的,java一定可以,然後就查了點資料
相關文章
相關標籤/搜索