本文转载自:慕云朝伟(ID:tt2gg99)
昨天网信部一纸檄文,将滴滴推上了风口浪尖。
我有个朋友从事银行数据科学工作,对大数据隐私比较敏感。
银行辅助进行黄赌毒排查工作。
以黄为例,聊聊大数据如何用最基本的信息和最简单的手段,找出LSP和不法分子。
每个银行都有一张最基本的用户收支明细表,记录每个用户的每一笔收支记录。
如【时间】2021年7月5日8点15分,【持卡人】Jack在【商家】永和豆浆早餐店花【金额】5.5元买了一杯豆浆、一根油条和一个荷包蛋。
这份数据可以用来解读非常多的信息。
如何扫黄?
第一步,找出那些晚上11点至凌晨3点仍有活跃交易的账户;
第二步,如果这些金额也符合金额特征如”398元”、”498元”等,那就把这笔交易标记为可能涉黄;
这里需要特别指出的是为什么不用商家名称,因为有些搞黄色的按摩会所非常狡猾,很少有使用直接商户名的(如”红浪漫按摩养生会所”的收款名称可能摇身一变成了”永久便利店”);
第三步,假设一个商家1个月有1万笔交易,且70%的交易都符合上述特征。那么大概率这个商家就是涉黄的。
银行会把这批名单输送到公安,至于公安下一步怎么做那就不知道了。
一个特别搞笑的事情是4月份月度排查的时候,名单里居然出现了一家”榆林市解放路空气净化器”的商家,我们觉得不可思议,是不是数据搞错了。
再次核实后确认,这个商家4月份共有989笔交易,有304笔交易是398元,483笔交易是698元,而且交易发生的时间都是在凌晨。
后来同事们笑称,这哪里是空气净化器,明明是前列腺净化器。
回到滴滴,滴滴掌握的是用户出行数据。
何为用户出行数据?从数据库的角度,至少可以拆解成三张表。
1.用户出行记录表,Linda早上8:00从科苑路打车到科技园;
2.底层LBS表。精确到经纬度的位置映射,如北京动物园,116.344765,39.941026;
3.地理名词标签表。如科技园西南门-高档写字楼;红浪漫KTV-休闲娱乐;凑凑火锅(大悦城店)-餐饮火锅。
这三张表可以用来干什么坏事儿?我脑补如下:
1.用户隐私角度。
还是搞黄色,拿搞黄色的为例,近半年内去过5次以上休闲娱乐场所的标记为可能搞黄色;
当然了,滴滴不拿搞黄色盈利,推送贷款才是主要用途。
这里从风控角度可以衍生非常多的标签;如经常往返机场,说明你是有一定消费能力的差旅人士;半年前就注册了但是一直没用,最近开始使用打车软件并且去了好几趟趟家居城。
那么你极有可能被推送贷款。
因为你还得起且有贷款需求。
2.国家安全角度。
2.1暗杀大人物。
北京大院住了很多大人物,当然这些住所很隐蔽,就算你是FBI,也不能挨个排查。因为工作量大。
如果有了滴滴大数据,就可以用排除法了。
首先这些大人物大院子不可能有人经常坐滴滴,人员活动受到限制。搞清楚打车热力图就可以极大减少排除工作量。然后展开暗杀行动。
2.2策反小人物。
从差旅人士里面找策反对象。
比如禄口机场-南京核工业集团、中川国际机场-兰州核工业基地。
有人会问了,这么级别的人物还需要打车?派奔驰接送不就完了么?
有一类群体是管理咨询顾问。他们经常出入各个国企,自己打车…十四五战略规划项目接触到保密材料绰绰有余。
大数据时代,每个人都在裸奔。
怎么把裤子穿好?几个tips送给大家
1.笛卡尔集支付。3张银行卡、3种支付方式(微信 支付宝 银联),比如今天用微信建行卡吃饭,明天用支付宝招行卡网购。
当然,现金最安全。
2.不使用真实地址。如想打车去红浪漫ktv,那最好是定位终点为附近100米的鸡公煲或者肯德基。
3.不作恶。人在做,天在看,数在记。
1、本文只代表作者个人观点,不代表星火智库立场,仅供大家学习参考; 2、如若转载,请注明出处:https://www.xinghuozhiku.com/50715.html