大數(shù)據(jù)公司又被查,爬蟲程序員在內(nèi)20余人被抓!

2021-02-04    分類: 網(wǎng)站建設(shè)

技術(shù)領(lǐng)導(dǎo)力社區(qū)來源:

警方發(fā)現(xiàn),在廣州諾涵科技公司,公民個人信息被稱為“流量”,公司自己開發(fā)有“樂花管家”等多個小貸平臺,在自身購買公民個人信息用于推銷貸款、軟暴力催收的同時,也和其他公司相互交換公民個人信息,還開發(fā)有爬蟲云等軟件,通過技術(shù)手段爬取其他小貸公司的公民個人信息,用于公司放貸和非法出售牟利。


鎖定相關(guān)犯罪證據(jù)后,淮安警方在長沙、深圳分別將湖南九象公司的法定代表人和技術(shù)主管抓獲。

審訊得知,九象公司黑爬蟲網(wǎng)站的“身份核驗返照”業(yè)務(wù)端口來自北京黑格科技有限公司,而黑格公司是從北京考拉征信服務(wù)有限公司等四家公司購買的查詢接口。

隨即,警方將北京黑格公司和考拉征信服務(wù)有限公司的法定代表人、董事長、銷售、技術(shù)等 20 余名涉案人員抓獲,并于今年 4 月在北京將他們上游公司的 5 名涉案人員抓獲。

經(jīng)查,北京考拉征信服務(wù)有限公司從上游公司獲取接口后又違規(guī)將查詢接口出賣,并非法緩存公民個人身份信息,供下游公司查詢牟利,從而造成公民身份信息包括身份證照片的大量泄露。

違規(guī)緩存相當于把公民個人信息復(fù)制了一份,存在那邊,下游公司再向它通過數(shù)據(jù)接口調(diào)取數(shù)據(jù)的時候,它就不需要再向上游調(diào)取,也是節(jié)省了開支,這個是違法的。

(圖片文字來自新浪網(wǎng))

案例三:用爬蟲技術(shù)擾亂對方網(wǎng)站經(jīng)營規(guī)則,且牟利。比如這個:

(圖片文字來自中國永嘉公號)

圖上描述做搜索引擎排名的技術(shù),其實就是利用爬蟲技術(shù)規(guī)?;脑L問網(wǎng)頁。

在我們通常的認知里,因為互聯(lián)網(wǎng)推崇分享精神,所以認為只要是網(wǎng)絡(luò)公開數(shù)據(jù)就可以抓取,但是通過上面的案例來看,有幾個禁忌,抓取的數(shù)據(jù)最好不要直接商用,涉及社交信息/用戶信息要謹慎。

老板交代你抓取敏感任務(wù)時,讓老板先看下刑法第285條。公司從事違法業(yè)務(wù),不代表個人行為就沒事,只是還沒入有關(guān)部門的法眼。

03.程序員如何避免,面向監(jiān)獄編程?

爬哪些數(shù)據(jù)會觸犯法律?

第一、著作權(quán)法保護的所有作品數(shù)據(jù)

比如一些網(wǎng)站發(fā)表的內(nèi)容,如文章、評論等都是有著作權(quán)的,如果只是單純的通過瀏覽器查看是不會觸犯法律的。

但是,對于有著作權(quán)的作品,如果未經(jīng)著作權(quán)人許可,以盈利為目的,對其作品用任何手段進行復(fù)制是犯法的。

如果是使用了爬蟲技術(shù)手段爬取數(shù)據(jù)之后將其保存下來或者傳播,并且進行盈利,這種都是屬于犯罪的。

第二、網(wǎng)站用戶的個人信息或者隱私信息

網(wǎng)站上的個人用戶的個人信息,即使是用戶自己放到一些網(wǎng)站上進行公開或者部分公開,如微博、微信等,不代表這些數(shù)據(jù)就可以被其他人隨便獲取,這個要特別注意。

所以,如果爬取的數(shù)據(jù)涉及到個人信息或隱私信息,都是違法的!

還有些爬蟲企圖繞過權(quán)限校驗等,爬取用戶未公開的信息,如個人私密相冊照片等,都是屬于侵犯用戶的個人隱私的,不要覺得自己技術(shù)玩得溜,這些可都是違法行為。

第三、反不正當競爭法中明確保護的數(shù)據(jù)

許多網(wǎng)站中的數(shù)據(jù)系由用戶生成,且該等數(shù)據(jù)和內(nèi)容系原告網(wǎng)站的主要競爭力來源。如“XX點評”、“X團”上面的店鋪評價、評論等信息,“X程網(wǎng)”上面的關(guān)于酒店的評價評論等信息等。

那么,未經(jīng)允許,爬取其他網(wǎng)站的核心數(shù)據(jù),很明顯并沒有遵守《反不正當競爭法》中規(guī)定的自愿、平等、公平、誠實信用的原則。

在“XX點評”訴“X度”不正當競爭案件、以及“X浪微博”訴“X脈脈”不正當競爭等案件中,法院都認定被告未經(jīng)許可抓取、使用原告網(wǎng)站中的數(shù)據(jù)的行為,違反了誠實信用原則及公認的道德,損害了互聯(lián)網(wǎng)的市場競爭秩序,損害了原告的競爭優(yōu)勢,從而構(gòu)成不正當競爭。

因此,如果抓取XX點評、X博、X瓣電影、X乎等UGC模式的網(wǎng)站上用戶發(fā)布的信息,并在自己的產(chǎn)品或者服務(wù)中發(fā)布、使用該等信息,則有較大的風(fēng)險構(gòu)成不正當競爭。

怎么爬數(shù)據(jù)算犯法?

如果是爬取公開的數(shù)據(jù),通常不會被認為是侵權(quán)。Google、百度等搜索引擎都是這么爬取的。

那么,到底怎么爬數(shù)據(jù)是有可能觸犯法律的呢,主要考慮是否涉及以下兩種行為:

沒有遵守網(wǎng)站Robots協(xié)議

Robots協(xié)議是技術(shù)界為了解決爬取方和被爬取方之間通過計算機程序完成關(guān)于爬取的意愿溝通而產(chǎn)生的一種機制。

通過技術(shù)手段,繞過防護措施,抓取數(shù)據(jù)

由于爬蟲的批量訪問會給網(wǎng)站帶來巨大的壓力和負擔,因此許多網(wǎng)站經(jīng)營者會采取技術(shù)手段,以阻止爬蟲批量獲取自己網(wǎng)站信息。

所以,很多爬蟲工具為了爬取數(shù)據(jù),會想辦法通過各種手段繞過防護措施,但是,這種行為也是會觸犯法律的。

抓回來的數(shù)據(jù)怎么用會犯法?

很多公司開發(fā)的爬蟲遵守了Robots協(xié)議,也沒有爬取不該爬取的數(shù)據(jù),難道這樣獲取到的數(shù)據(jù)就可以隨便使用了嗎?其實也不是,如果使用不當,也會觸犯法律的。

比如通過爬蟲抓取到的數(shù)據(jù)進行盈利、損害他人利益、造假、誹謗等都是可能觸犯法律的。

此外,未經(jīng)被收集者同意,即使是將合法收集的公民個人信息向他人提供的,也屬于刑法第二百五十三條之一規(guī)定的“提供公民個人信息”,可能構(gòu)成犯罪。

04.我們?nèi)绾畏乐箓€人信息被泄露?

在科技飛速發(fā)展的今天,人們開始追求各種方便快捷的方式生活,但是,在方便快捷的背后,個人信息安全也不能忽視。瀏覽器、社交平臺等等都有可能出現(xiàn)隱私泄露。

個人隱私泄露有著很嚴重的安全隱患!如何防止個人信息泄露?快來看防范小妙招:

  1. 盡量不使用公共場所的 WiFi。
  2. 盡量訪問具備安全協(xié)議的網(wǎng)址。建議盡量登錄網(wǎng)址前綴中帶有“https:”字樣的網(wǎng)站,具備這種安全協(xié)議的網(wǎng)址的安全性較高。
  3. 不同軟件盡量不要使用同一組賬號密碼。
  4. 妥善處置快遞單等包含個人信息的單據(jù)。對于含有姓名、電話、住址等信息的單據(jù)憑證要及時銷毀,不經(jīng)意扔掉也可能導(dǎo)致個人信息泄露。
  5. 身份證、戶口本等有個人信息的證件,一定要保存好。
  6. 手機、電腦等都需要安裝安全軟件,每天至少進行一次對木馬程序的掃描,尤其在使用重要賬號密碼前。每周定期進行一次病毒查殺,并及時更新安全軟件。
  7. 不少人熱衷于曬地點、曬自拍照,還有家長喜歡曬孩子照片等。這種手機簽到可能被別有用心的人盯上??蓞⒖肌?1歲日本女星慘遭猥褻,只因自拍瞳孔倒影暴露住址?| 一張照片是怎么出賣你的!》
  8. 一方面暴露了個人隱私,比如姓名、工作單位、家庭住址等,另一方面可能招致犯罪,在網(wǎng)上使用手機簽到時,需要謹慎。

當前題目:大數(shù)據(jù)公司又被查,爬蟲程序員在內(nèi)20余人被抓!
網(wǎng)頁URL:http://www.muchs.cn/news32/99182.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計服務(wù)器托管、全網(wǎng)營銷推廣網(wǎng)站導(dǎo)航、企業(yè)建站、網(wǎng)站收錄

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護公司