你的身份信息和余額寶金額都能買到 僅需3.8元!
- 來源:南方都市報
- 作者:NT
- 編輯:newtype2001
預(yù)充值越高價格越低,甚至到幾角錢
那么,這些細(xì)致無比的數(shù)據(jù)從何而來?
11月10日,南都記者實地走訪這家公司,相關(guān)工作人員以負(fù)責(zé)人出差為由拒絕采訪,只是強調(diào)數(shù)據(jù)是經(jīng)過爬蟲技術(shù)獲取而來的,并經(jīng)過用戶授權(quán)。
據(jù)南都記者了解,爬蟲技術(shù)是一項被廣泛應(yīng)用于互聯(lián)網(wǎng)行業(yè)的技術(shù)。
在現(xiàn)金貸領(lǐng)域的應(yīng)用,爬蟲技術(shù)常見于抓取用戶相關(guān)的運營商數(shù)據(jù)、電商數(shù)據(jù)等信息,作為人工智能風(fēng)控技術(shù)的數(shù)據(jù)補充。以往為了反欺詐和確定放款額,現(xiàn)金貸平臺通常需要幾天時間對借款人進(jìn)行信審工作?,F(xiàn)在依托爬蟲技術(shù)所爬取的大數(shù)據(jù),則可能實現(xiàn)秒貸。有業(yè)內(nèi)人士稱,如果借款人有借唄、京東白條、微粒貸額度,平臺就直接放貸了。
此外,一些數(shù)據(jù)公司還專門面向現(xiàn)金貸領(lǐng)域推出同業(yè)爬蟲產(chǎn)品,可以爬取到借款人在其他平臺的貸款情況,如放款額、放款時間等結(jié)果數(shù)據(jù)。
這對發(fā)愁數(shù)據(jù)源和風(fēng)控系統(tǒng)的現(xiàn)金貸公司來說,無疑是一項貼心的服務(wù),可在風(fēng)控環(huán)節(jié)省去不少力氣,甚至直接使用別人的風(fēng)控成果。李永慶對南都記者表示,這在一定程度上也降低了用戶的實際借款利息。因為借助機器,從申請、審核到放貸的效率提高了,花在風(fēng)控上的人工成本也就減少了。
一家剛起步的數(shù)據(jù)公司產(chǎn)品經(jīng)理向南都記者透露,使用自家產(chǎn)品預(yù)充值越高,每份報告的價格就越低。如果預(yù)充值是1萬元的話,運營商和電商報告售價不足兩元,預(yù)充值達(dá)10萬元的話,包括簡單的多頭黑名單等報告,幾角錢即可買到。并且一提交申請即可秒出。
基于如此強大的數(shù)據(jù)分析和低廉的價格,這些爬蟲產(chǎn)品受到市場的歡迎。但是通過爬蟲技術(shù)獲取各大網(wǎng)絡(luò)平臺的數(shù)據(jù)也存在不小爭議。
今年3月,58同城被爆出簡歷信息泄露。有賣家在淘寶上出售該平臺的個人信息爬蟲服務(wù)。只要支付700元就能購買一款爬蟲軟件,在登錄賣家提供的賬號后,每小時可采集全國430多個城市,以及464個職業(yè)的簡歷數(shù)據(jù)上千份。
除了自行爬取外,賣家還可出售經(jīng)過簡單清洗的信息數(shù)據(jù),將姓名、手機號、求職方向、年齡等簡歷信息自動錄入到excel表格中,具體價格1000條50元。58集團對外回應(yīng)稱,這屬于惡意抓取,將追查并加固信息安全系統(tǒng),提升防爬蟲技術(shù)手段。
對于互聯(lián)網(wǎng)企業(yè)來說,最重要的資產(chǎn)是價值堪比石油的數(shù)據(jù)。誰也不愿自家積累的數(shù)據(jù)就這樣被白白爬取,因此也都紛紛推出相應(yīng)的反爬蟲措施。
“主動把自家的鑰匙給了一個路人”
盡管如此,爬蟲有時仍防不勝防。因為一句用戶授權(quán),似乎讓其有了合理的說辭。
支付寶相關(guān)負(fù)責(zé)人對南都記者表示,探知數(shù)據(jù)并非其開放平臺的合作伙伴,也沒有對其開放數(shù)據(jù)接口。對方平臺通過用戶給他們的授權(quán),以用戶的名義登錄支付寶后,就可以看到該用戶的信息。“簡單來說,這相當(dāng)于你主動把自家的鑰匙給了一個路人,然后這個路人用這把鑰匙開了你的家門。”
據(jù)南都記者了解,現(xiàn)金貸平臺要求借款人進(jìn)行電商和運營商等認(rèn)證時,通常由借款人提供賬號和密碼,審核員人工登錄運營商和電商網(wǎng)站,然后截圖打印。
“這樣問題更多,因為密碼泄露了。”李永慶告訴南都記者。一名網(wǎng)貸行業(yè)資深人士表示,“過后我們會要求借款人修改密碼。”
現(xiàn)在借助爬蟲,道理其實相似。網(wǎng)貸公司先接入數(shù)據(jù)公司的A P I接口,出現(xiàn)數(shù)據(jù)公司的一個授權(quán)頁面,讓用戶通過掃描二維碼等方式,輸入賬號和密碼。然后數(shù)據(jù)公司在自家服務(wù)器上通過爬蟲模擬用戶行為,登錄相關(guān)網(wǎng)站獲取數(shù)據(jù)。
針對爬蟲問題,上述支付寶相關(guān)負(fù)責(zé)人表示,其公司已開發(fā)并在不斷完善人機識別系統(tǒng),以此判斷是否有平臺以用戶的名義登錄,并用腳本機器的爬取請求。一經(jīng)發(fā)現(xiàn),便會進(jìn)行攔截或者需要用戶校驗通過才能繼續(xù)操作。同時,對用戶的敏感信息進(jìn)行脫敏處理,比如把身份證和綁定的銀行卡號作打星處理等。
“我們一直在做安全教育。從根本上講,希望用戶不要把自己的支付寶賬號密碼告訴其他平臺。”
有業(yè)內(nèi)人士透露,其實爬蟲已經(jīng)算是很合規(guī)的渠道了,畢竟還是要用戶授權(quán)的。還有些公司會通過各種渠道花錢買數(shù)據(jù),“想買的話都買得到”。
不管是為了更好地做風(fēng)控評估,防止“黑戶”欺詐,還是用于后期催收,借助爬蟲工具,現(xiàn)金貸平臺所能獲取的個人信息超乎想象。
一個擼小貸的人告訴南都記者,“注冊的平臺多了,也就毫無隱私可言了。”
“借款人要是知道了,肯定不愿授權(quán)”
爬蟲引導(dǎo)用戶去訪問自己的賬戶系統(tǒng),然后偷偷爬取信息
雖然數(shù)據(jù)公司宣稱有用戶授權(quán),但專家對其中的授權(quán)方式也提出了質(zhì)疑。
有爬蟲行業(yè)的從業(yè)者表示,“我們爬蟲業(yè)務(wù)幾乎不跟P 2P平臺合作,因為國家打得嚴(yán)。而其中的灰色地帶在于簽約環(huán)節(jié)。”而且,在個人隱私保護和數(shù)據(jù)買賣等問題上,可能觸及紅線。
自己打開門但不知被爬取多少信息
根據(jù)網(wǎng)安法規(guī)定,企業(yè)收集個人信息應(yīng)當(dāng)經(jīng)過被收集者的同意。也就是說,只有經(jīng)過用戶同意,企業(yè)收集個人信息才算合法。
在華東政法大學(xué)教授高富平看來,用戶同意的前提是知情。“平臺要訪問獲取我哪些信息,用于什么目的首先應(yīng)該明確告知,超出這個范圍則不能再用。在明確主體、信息范圍、使用目的三個條件后,只有用戶發(fā)自內(nèi)心自愿同意后,才算真正的知情同意。”
很顯然,用戶并不知道自己會被爬取出這么多具體的信息。“所以這里的用戶授權(quán)實際上存有瑕疵。”高富平對南都記者表示。“借款人要是知道了這些,肯定會不愿意的,尤其是因為這些數(shù)據(jù)借不到錢的人。”李永慶說。
據(jù)網(wǎng)貸行業(yè)數(shù)據(jù)安全專家韓洪慧介紹,爬蟲爬取數(shù)據(jù)做了一個取巧的行為,即引導(dǎo)用戶去訪問自己的賬戶系統(tǒng),比如手機營業(yè)廳、淘寶等,用戶自己輸入賬戶密碼后,爬蟲就進(jìn)入賬戶系統(tǒng)爬取信息。用戶自己打開了門,但其實不知道爬蟲爬取了多少信息,也控制不了爬取的信息以后還會被用在哪里。
南都記者注意到,2016年8月,銀監(jiān)會出臺的《網(wǎng)絡(luò)借貸信息中介機構(gòu)業(yè)務(wù)活動管理暫行辦法》指出,網(wǎng)貸平臺應(yīng)妥善保管出借人與借款人的資料和交易信息,不得刪除、篡改,不得非法買賣、泄露出借人與借款人的基本信息和交易信息。
網(wǎng)貸公司有泄露個人信息嫌疑
韓洪慧認(rèn)為,網(wǎng)貸平臺采用外包模式,讓第三方公司去爬取用戶信息,有泄露用戶個人信息的嫌疑。一方面,網(wǎng)貸平臺無法保證第三方技術(shù)公司不留存數(shù)據(jù),不將數(shù)據(jù)用作其他用途。另一方面,用戶以為是網(wǎng)貸平臺獲得信息,但實際上不僅網(wǎng)貸平臺獲得信息,第三方技術(shù)公司也獲得了,而且可能是全部信息。
他說,“這猶如我求你辦事,你說要到我家看看情況。我給你打開了門,結(jié)果你讓另外一個人進(jìn)去檢查,然后把檢查報告給你,問題是你對那個人并沒有太多約束力,他只是來臨時幫忙的,于是我的家被一個完全不認(rèn)識的人檢查了個遍。”
更糟糕的是,網(wǎng)貸平臺可能只要求技術(shù)公司獲取三個內(nèi)容,但技術(shù)公司獲取了30個內(nèi)容,最后只給了網(wǎng)貸平臺3個內(nèi)容,其他的都留給自己用了。
值得一提的是,所謂的授權(quán)還體現(xiàn)在數(shù)據(jù)公司和網(wǎng)貸平臺的用戶協(xié)議上。以探知數(shù)據(jù)為例,在其查詢頁面有相關(guān)的授權(quán)協(xié)議稱,“您確認(rèn)獲得有效的轉(zhuǎn)授權(quán)我們查看您擬查詢的第三人(電商網(wǎng)站、運營商、學(xué)信網(wǎng)等)信息。”
南都記者查閱發(fā)現(xiàn),不少網(wǎng)貸平臺在用戶協(xié)議里也提及,用戶同意其公司有權(quán)將用戶個人資料和信息,提供給依法設(shè)立的征信機構(gòu)和個人信用數(shù)據(jù)庫和關(guān)聯(lián)方、合作伙伴,以及給第三方進(jìn)行逾期賬款催收。并且有權(quán)與任何第三方進(jìn)行數(shù)據(jù)共享。
有數(shù)據(jù)公司相關(guān)負(fù)責(zé)人表示,原則上借款人要借哪家網(wǎng)貸公司的錢,就授權(quán)把個人信息交給哪家。“當(dāng)中的數(shù)據(jù)公司都是工具,拿了數(shù)據(jù)別悄悄賣就好了”。
大數(shù)據(jù)公司私自保存他人信息違規(guī)
不過,韓洪慧對南都記者表示,大數(shù)據(jù)公司在幫助金融機構(gòu)了解和分析客戶的同時,也保存了數(shù)據(jù)。這樣私自保存是違規(guī)的。數(shù)據(jù)積累越多,風(fēng)險也越大。“畢竟數(shù)據(jù)不是自己業(yè)務(wù)產(chǎn)生的自然數(shù)據(jù),再加上萬一保存不好泄露了,好比定時炸彈”。
今年6月1日,網(wǎng)安法和“兩高”個人信息司法解釋開始生效實施,法規(guī)提及,“非法獲取、出售或提供行蹤軌跡信息、通信內(nèi)容、征信信息、財產(chǎn)信息50條以上的即入罪。”整個大數(shù)據(jù)行業(yè)因此面臨極大的挑戰(zhàn),大量數(shù)據(jù)接口被切斷。
不僅如此,一個更現(xiàn)實的問題是,將來會不會出現(xiàn)手機聯(lián)系的人越來越少,人們都用微信了。如此基于運營商的風(fēng)控邏輯,將不再那么有效了。南都記者注意到,有數(shù)據(jù)公司已悄悄推出微信爬蟲產(chǎn)品。不過,每家公司都有反爬蟲技術(shù),能否不間斷穩(wěn)定爬取數(shù)據(jù),也是一大挑戰(zhàn)。
李永慶告訴南都記者,“怎么在合規(guī)的情況下找到有效的數(shù)據(jù),是不少公司需要考慮的問題。”
(應(yīng)采訪對象要求阿倫和王蘭為化名)
被爬取的個人信息
基本身份信息,近半年的通話記錄詳情、消費賬單、出行信息、人脈關(guān)系、詳細(xì)量化評分情況
聯(lián)系次數(shù),通話過的1000個手機號碼羅列出來,包括完整號碼、歸屬地、通話時長、最早和最后通話時間等。
其中常用的30位聯(lián)系人更是被單獨拎出,統(tǒng)計了近24小時、1-7天、7-30天、30-90天、90-180天5個通話時段的聯(lián)系次數(shù)。
定位到經(jīng)緯度、門牌號的居住地、入網(wǎng)時長,黑名單通信記錄,民間借貸、銀行、P2P平臺與互聯(lián)網(wǎng)小貸等通信記錄、公檢法和澳門通信記錄
淘寶25頁訂單數(shù)據(jù)、京東近3年數(shù)據(jù)
電商、社保、公積金、央行征信報告和學(xué)信網(wǎng)

玩家點評 (0人參與,0條評論)
熱門評論
全部評論