談談爬蟲背後的法律風險

最近的IT公司違法案件愈來愈多,看了不少由於爬蟲,數字貨幣,博彩網站外包等被抓的事情,
程序員

給你們提個醒,打工注意不能違法,寫代碼背後也有法律風險。安全

1、爬蟲背後的法律風險

程序員被關監獄456天,只因外包賭博軟件網絡

只因寫了一段爬蟲,公司200多人被抓工具

你們都說技術無罪,可是也要看場景,聽說如今國內作我的信用評測的,都是要用戶受權各類帳號,而後爬取信息。網站

先來看一些法律法規裏對我的信息使用的規定:搜索引擎

《中華人民共和國網絡安全法》

2016年11月7日發佈的《中華人民共和國網絡安全法》明確「我的信息」是指是指以電子或者其餘方式記錄的可以單獨或者與其餘信息結合識別天然人我的身份的各類信息,包括但不限於天然人的姓名、出生日期、身份證件號碼、我的生物識別信息、住址、電話號碼等,就網絡服務中的我的信息保護問題做出系統規定以下:spa

一、保護我的信息:
網絡產品、服務具備收集用戶信息功能的,其提供者應當向用戶明示並取得贊成;涉及用戶我的信息的,還應當遵照本法和有關法律、行政法規關於我的信息保護的規定。索引

二、合法收集使用我的信息:
網絡運營者收集、使用我的信息,應當遵循合法、正當、必要的原則,公開收集、使用規則,明示收集、使用信息的目的、方式和範圍,並經被收集者贊成。不得收集與其提供的服務無關的我的信息,不得違反法律、行政法規的規定和雙方的約定收集、使用我的信息,並應當依照法律、行政法規的規定和與用戶的約定,處理其保存的我的信息。網絡安全

三、不得向他人提供我的信息:
網絡運營者不得泄露、篡改、毀損其收集的我的信息,未經被收集者贊成,不得向他人提供我的信息,但通過處理沒法識別特定我的且不能復原的除外。get

 

《規範互聯網信息服務市場秩序若干規定》

《規範互聯網信息服務市場秩序若干規定》(工業和信息化部令第20號,如下簡稱「20號文」)就互聯網信息服務提供者信息蒐集規定以下方面:

一、蒐集須經許可:未經用戶贊成,不得蒐集與用戶相關、可以單獨或者與其餘信息結合識別用戶的信息(「用戶我的信息」),但法律法規另有規定除外;
二、限定蒐集範圍和用途:經用戶贊成蒐集用戶我的信息的,應當明確告知蒐集和處理用戶我的信息的方式、內容和用途,不得收集其提供服務所必需之外的信息,不得將用戶我的信息用於其提供服務以外的目的;
三、用戶我的信息保障:互聯網信息服務提供者應當增強系統安全防禦,妥善保管用戶我的信息,未經用戶贊成,不得向他人提供用戶上載信息,可是法律法規另有規定的除外。

爬蟲本質是一種工具,一種用機器人代替人手操做、蒐集信息提升效率的工具。工具無罪,有罪的是如何使用。

對於涉及法律風險的數據爬取要求,程序員最好在採集前和老闆深聊一下,明確法律風險,或者事先和公司簽署一份免責協議。

 

2、網絡爬蟲怎麼作比較好

 若是經過竊取或者其餘方法非法獲取公民我的信息等我的信息、商業機密,情節嚴重(刑九之後 5000 元入罪)則構成侵犯公民我的信息罪,量刑分三年如下和三至七年兩檔,運氣好的緩刑走起,固然民事責任依然是免不了的。

因此,面對領導危險的爬蟲請求,程序員們該好好衡量下了。

咱們都知道,互聯網搜索引擎要遵照Robots 協議,若是遵照Robots 協議,沒有任何越權的行爲,獲取的也是公開能夠查詢的非隱私級的信息,那麼,違反法律的風險會比較小。

除了遵照「Robots 協議」,還有如下的幾條:

一、若是你爬蟲獲取信息,是爲了證實被爬公司的數據造假,其獲取的數據也都是經過公開渠道能夠查詢的,那麼,在獲取信息後公佈於衆的行爲並不違法,也不侵犯被爬公司的民事權益。可是,若是你爬取公開免費的信息,是用來進行違法操做,好比造假、誹謗等,就有隱患了。

二、若是你利用爬蟲獲取其餘公司的公開信息數據,用於自身公司的經營。而被爬公司的信息是投入了大量人力、財力,通過常年積累得到的,而且被爬公司自己也採起了反爬措施。這種狀況下,雖然信息是公開的,但信息自己具備較高的商業價值,可以給使用者帶來商業利益,此時的爬蟲也是違法的。

三、若是你未經平臺受權,強行突破反爬措施,致使被爬網站的運行受到嚴重影響,這種行爲明顯是違法的,這裏涉及的就是咱們上一個技術篇講到的破解犯罪了。

四、若是你是第三方應用,想要經過開放平臺獲取用戶信息時,更要注意受權問題。從用戶對平臺的受權、平臺對第三方的受權、再到用戶對第三方的受權,三重關卡都要經過才合法。

 

3、總結一下

  • 接外包項目要謹慎
  • 互聯網金融從業有風險
  • 對於危險的爬蟲任務,勇於說不
相關文章
相關標籤/搜索