https://mp.weixin.qq.com/s/mqD0Iu4HePvQBS8J03OXLA算法
By 超神經 場景描述:利用機器學習、深度學習和大數據、雲計算等技術,實現版權監測、登記及維權,打擊盜版行爲,終結盜版時代。 關鍵詞:機器學習 深度學習 大數據 天然語言處理 打擊盜版
今天,思否 CEO 的一篇文章,讓 CSDN 陷入輿論中心。 網絡
原由是,思否的一些做者發現,在CSDN 的下載頻道,本身的付費課程被盜版。做爲知名的IT 技術社區交流平臺,CSDN 下載頻道佔據了 30 % 的流量,但在內容監管中,卻並不給力。 機器學習
思否 CEO 今日發表的文章(部分截圖)ide
文章裏,做者指出了 CSDN 的侵權和盜版事件絕非個案,而網絡上的這種侵權和盜版事件彷佛也沒有高效的遏制辦法。函數
相似的內容盜版行爲,在音樂、影視行業也家常便飯。好比今年春節檔的科幻大片「流浪地球」,在上映次日就被爆出盜版資源,以幾元的價格在線售賣。並且不是一般所見「盜錄」的模糊「槍版」,大部分仍是高清片源。 實在猖獗。工具
盜版和假冒僞劣產品屢禁不止的緣由,在於這些產品每每是免費或者低價的形式分享,在互聯網時代,它們的傳播更加難以遏制。學習
在利益驅動下,盜版屢禁不止 大數據
除了網絡環境複雜經常難以發現,還有一個緣由在於懲治不力。網站
根據目前相關規定,即便泄露片源,賠償金額也不過是合同原價的雙倍,甚至更低;此外,針對盜版等侵權行爲雖有行政處罰,但缺少強制措施,威懾力不足。 ui
若是不是多方做者發現並揭露這件事,也許不少人還矇在鼓裏。
從如下數字咱們能夠看到盜版橫行的市場有多大。Frontier Economics 2017 年的一項研究代表,到 2022 年,假冒和盜版商品的總價值可能上漲到 2.81 萬億美圓(19.11 萬億人民幣。其中,中國佔全球仿冒和盜版商品總額的 46%。該研究還估計,到 2022 年,與假冒和盜版有關的淨失業人數可能高達 540 萬。
面對如此猖獗的盜版產業,彷佛必須藉助人工智能來打擊了。
一家位於巴塞羅那的知識產權和品牌保護創業公司 Red Points ,正在利用技術解決這個全球性的問題。
Red Points 提供品牌保護、反盜版服務
公司基於 SaaS 的雲解決方案系統會表明客戶,在網上搜尋假冒僞劣產品或盜版內容,並自動將其刪除,以此爲企業進行在線 IP 侵權檢測、自動化移除假貨信息和盜版內容。
該公司 CEO Urquizu 認爲,機器學習工具,如計算機視覺和天然語言處理,能夠幫助品牌更快地搜索信息和檢測假貨,從而實現知識產權保護的自動執行。
「與基於服務的方法相反,只有可擴展的技術解決方案,才能顯著應對由知識產權侵權引起的挑戰,」Urquizu 說。
該公司反盜版的方法具體分爲如下步驟:
跟蹤:經過關鍵字監控系統檢測並消除在線 IP 侵權,這些系統由客戶經過簡單的平臺進行管理。此外,版權保護專家會天天識別和更新盜版來源,機器學習也會使用檢測記錄來添加新的搜索規則,不斷進行自我提升。
刪除:自動執行版權並跟進來源。一旦發現違規行爲,使用自動化規則當即發送刪除和接觸索引請求,並採起庭外行動制止進一步侵權行爲。
報告:發現侵權行爲後,客戶可收到定製報告,查看本身知識產權保護範圍,平臺還會識別其餘侵權事件趨勢並追蹤侵權者來源,
反盜版中的追蹤環節
另外,經過使用機器學習和深度學習技術,公司能夠經過線上系統,獲取客戶的帳戶歷史信息,不斷更新,從而可以不斷刪除新的侵權威脅。若是檢測到潛在的侵權威脅,會及時預警客戶。
「當品牌保護和反盜版實現自動化時,從檢測到侵權事件,到移除侵權內容,平均須要花費四個半小時,而手動完成這個過程一般須要數天或數週,」Urquizu 說。「在有效打擊在線假冒產品方面,速度和準確性相當重要,而這隻能經過智能技術實現。」
天天,Red Points 的專有軟件都會從互聯網上刪除 100,000 多起非法產品和相關內容。其技術目前幫助 400 多家客戶在全球 100 多個市場上處理虛假內容,成功率達 96%。
國內也有這樣的公司,正在藉助人工智能武器和盜版進行對抗。
因爲自 2010 年起,版權問題在國內日益受到重視,吳冠勇在 2011 年便創辦了冠勇科技,依託雲計算、大數據和人工智能技術,打造版權監測、登記及維權的大數據平臺。
該平臺可以 7 * 24 小時地監測全球的中文和英文網站,爲全球版權全部人服務
還有一家位於杭州的公司刀豆網絡,經過自研的全品類全網監測對比技術以及基於機器學習的人工智能算法,爲超過 5 萬名的我的創做者和超過 150 家企業,提供包括版權監測取證、登記確權、維權保護以及受權管理等內容版權與數據服務。
近年來,國人版權意識在逐漸增強,可是盜版、侵權依然橫行,權利人深受其害。
咱們期待,接下來,人工智能反盜版的技術可以更多地爲我的和企業所用,同時,國家在相關法律法規上不斷進行完善,讓盜版和侵權無處遁形,讓盜版時代完全終結。
非均等代價 Unequal cost
非均等代價是指賦予每一個類別形成的損失代價不一樣的狀況。
在一些情形中,不一樣的預測結果可能形成的損失程度不一樣,給這樣的分類賦予一樣的代價函數不切合實際,此時能夠根據分類的類別重要程度,爲錯誤賦予「非均等代價」。
非均等代價下,考慮的不是有話錯誤的次數,而是最小化「整體代價」。
考慮非均等代價狀況時,常規的度量方式 ROC 曲線不能表現學習器的狀況,一般採用「代價曲線」來講明學習器的指望整體代價。