你的手机是不是会经常会收到一些烦人的广告短信?垃圾邮件是不是经常会塞满你的电子信箱?如果你好奇,会问:这些人怎么会知道我的电话号码呢,怎么会知道我姓名呢?这是因为你的个人信息已经泄漏了。
个人信息的泄漏轻则会影响你的心情,重则你的存款会被骗的精光!
前段时间有一个陌生的人给我打电话,电话一接通就说:“您好,张先生,我是广东xx公证处的,三星公司为了回馈广大用户的信任与厚爱,举行了xx活动。我们随机抽取50位幸运用户,很高兴的通知您,您座机号中了一等奖,奖金xx万元!......”,一听就知道是骗子,刚才考虑问题思路突然被电话打断,一听又是骗子火气马上就上来了,冲着话筒一顿臭骂,“啪”的一声挂了电话。事后再想想感觉有些后怕,因为他知道你的姓名,知道你的基本信息等。我估计我挂了电话的这会儿他又在给别人打电话,继续他的诈'骗。现在社会上的诈'骗手段不断翻新,什么短信诈 骗、电话诈 骗到现在非常流行的电信诈 骗、金融诈 骗等等。电视上,记者采访那些被骗者,他们都有一个共同点,就是骗子在说出被骗者的姓名、年龄等基本信息后,被骗者都放松了警惕,能知道我这么详细信息的肯定是xx机构的客服,正是在这种心理暗示下一步一步的陷入了骗子的圈套。
个人信息在我们的生活中随处可见,你去网吧上网要登记身份证,买个手机卡要身份证,甚至买把破菜刀切菜用,也要身份证。登记你的姓名、家庭住址、年龄、教育背景、电话等,ZF不知道你买的刀是切菜用还是别有用途,登记你的信息,以防万一。这些信息如果不加以保护很容易流失被别有用心的人利用。个人信息的倒卖已经成为一个灰色的产业链条。要说个人信息资料哪个行业最全,当然要数金融了,银行、证券交易所保存有海量的个人信息资料。
现在国内的银行都注重业务,至于信息系统的开发维护都交给软件外包公司去做,下面这种情况就有可能造成个人资料外泄。
- 银行将核心业务的外围系统承包给某软件外包公司
- 系统开发完成后需要海量数据作系统的性能测试
- 银行将生产环境上的备份数据库拷贝一份给开发商用于作性能测试
- 有人拿到数据后倒卖给了别人。
我们的信息就这样泄漏了!
可能不断发案的诈'骗引起了最神秘部门“有关部门”的注意,所以最近出台了《商业银行信息科技风险管理指引》,要求“商业银行在信息系统开发、测试和维护,以及服务外包过程中加强对客户信息的保护,防止敏感信息泄露”。为保护客户权益,满足商业银行风险监管和内控监管的要求,需要对开发环境和测试环境中的数据建立统一的管理规范,对于必须使用生产数据的系统开发、测试、维护项目,生产数据必须经过脱密,才能被加载到开发、测试或维护环境。此脱密过程称做“数据漂白”
我负责系统的概要设计和详细设计,也开发了一部分代码。对漂白方法进行汇总,比较优劣总结经验,为二期开发作准备。
个人信息总体可分为:
-
名称类:如客户姓名、公司名称等
-
联系方式类:如联系地址、联系电话、手机号码、E-mail等
-
密码类:如查询密码、取款密码(哈哈,如果能破解就发财了!!)
-
日期类:如生日等
-
证件类:如身份证、军官证、港澳台通行证、驾驶证等
-
.....
数据漂白后的要求:
-
去掉隐私信息
-
保持数据脱密后的数据构成、合法性标准(如果目标系统需要对该数据字段进行校验的话
-
保持数据库的数据一致性和参考完整性
-
应用系统间关联使用的有效性
-
保持聚合字段、行/列计算字段有效性
-
-
开发难点:
保持各业务系统间数据的关联性,比如我在银行存了一笔钱,那么这笔信息会保存在核心业务数据库。如果我又在银行贷了一笔款,那么贷款信息会保存在个人信贷业务数据库。两者的数据必须比较保持一致
脱密算法设计:
- 随机算法(手机号码、电话号码等都用随机数替换,如18721773207,把187后面的数字随机换掉,公司地址、家庭地址从下表中随机一个地址替换)
- 汉字编码位移算法(如GB2312汉字编码表,在取出的汉字编码上加上固定数字得到另外一个汉字)
- 凯撒加密算法(看过“潜伏”么?余则成收到电报后要拿出一本书,用书上的字还原出电报的内容)
脱密方式设计:
思路:漂白脚本以文本文件形式存储于指定的文件夹中,在系统的初始化阶段将漂白脚本读取出使用java.sql.Statement对象的execute(String sql)方法执行DDL语句,在数据库建立漂白脚本和用户函数,然后用java去调用。
- 直接Java处理,把数据库的内容Select出来,数据加工完成后再放回去
思路:在要漂白的数据库上建立连接,获得Connection对象,创建Statement对象
Statement stmt = connection.createStatement(ResultSet.TYPE_SCROLL_SENSITIVE,ResultSet.CONCUR_UPDATABLE);这样Select出来的结果集可以更新
算法比较
1、 随机算法
优点:算法不可逆
缺点:数据被全部打乱,数据间的关联全部丢失。
2、 汉字编码位移算法
优点:折中方案
缺点:漂白出的数据有点不像真实数据(如人名:张三,漂白后可能是:饭傻)。
3、 凯撒算法
优点:基本符合要求
缺点:要作大量的参数配置。
脱密方式比较
1、 数据库脚本
优点:漂白速度快
缺点:需要针对每个数据库编码不同的脚本(Infomix,DB2,Oracle)。
2、 直接Java处理
优点:跨数据库
缺点:性能问题,跑的快不?。
欢迎JavaEye高手提出自己的看法。
分享到:
相关推荐
数据管理与隐私数据漂白平台建设方案.docx
纸浆的多段漂白工艺研究,李建颖,邓宇,采用正交试验的方法对纸浆多段漂白工艺中NaOH用量、辐射功率、碱处理时间及漂白工艺组合等因素进行了优化。结果表明,多段漂白的�
测试数据管理与隐私数据漂白平台.pptx
测试数据管理与隐私数据漂白解决方案.pptx
测试数据管理与隐私数据漂白平台白皮书.pdf
测试数据管理与隐私数据漂白平台白皮书.docx
银行测试数据管理与隐私数据漂白平台建设方案.docx
隐私数据漂白平台建设方案.docx
叶腊石微粉漂白实验研究,董楠,张俭,在酸性环境下用保险粉(Na2S2O4)作还原剂的方法对叶腊石微粉进行了漂白实验。探讨了浸泡时的酸种类、酸浓度,漂洗时的酸种类、酸�
牙齿漂白安全性的研究进展,俞丹丹,闵婕,牙齿漂白是通过漂白产品改善由疾病、年龄增长、吸烟等原因引起的牙齿着色,漂白产品的活性成分是过氧化氢(hydrogen peroxide HP)或过氧�
芦苇的生物化学制浆及漂白研究 芦苇的生物化学制浆及漂白研究
InfoMask数据管理与漂白一体机介绍.pptx
InfoMask数据管理与漂白一体机介绍.pdf
采用响应面方法学(RSM)实验设计中的历史数据设计(HDD)来优化工艺操作参数(温度,时间和吸附剂用量)并将其与漂白效率百分比相关联。 结果分析表明,运行参数的二次效应是显着的。 在160°C的温度,60分钟的...
行业分类-设备装置-一种金融数据的漂白方法.zip
荧光增白剂28的光漂白特性研究,巩宗爱,胡柏,荧光增白剂28(F-28)为欧盟标准EN 648-2006《与食品接触的纸和纸板-荧光增白剂牢度的测定》中判断食品接触材料中荧光增白剂是否向食品中�
图片预处理(七种)、漂白图片(三个算法)、 四角透视校正图片(规格化A4、A5输出)、 边缘裁切(可保留裁切部分为白边)、单位标尺(像素、毫米)、 背景换色(可去除水印)、灰度增强、去除麻点、透明保存等功能
漂白粉漂白原理.docx
本实验的目的是建立麦草浆氧气漂白新漂程,旨在充分利用廉价的氧气,减少传统CEH漂白过程中烧碱及氯水的用量,降低高白度草浆制备过程中的成本及污染物排放量,从而获得一种更为廉价、清洁的漂白工艺。实验以麦草浆...
化工化学类化学助剂行业氧系漂白助剂领域分析报告(研究报告).pdf