大数据分析在为某些企业带来商业利益的同时,也会构成对个体的歧视,并可能触犯消费者数据保护条例。
对企业来说,大数据意味着难以抗拒的商业机会。但是,其中也蕴含着极大的风险,比如对特定群体或个体的歧视。2012年,当桑迪飓风肆虐时,在10月27日到11月1日之间,推特上产生了超过2千万条相关的消息,其中包含了大量关于飓风和受灾人群的信息。通过对这类信息的分析,有助于形成救灾资源配置方面的决策。但是,由于来自于受灾最重地区的推特消息较少,造成了一定程度上的误导和延迟。当时,随着飓风的推进,所到之处电力供应受到严重影响,导致重灾区人群无法发出大量的网络消息。
最近,联邦贸易委员会在名为《Big data: Tool for Exclusion or Inclusion?》的报告中指出,与桑迪飓风相关的推特消息形成了不准确的数据视图,无法正确指向受灾最重的地区以及最需要帮助的人群。在报告中,该委员会对目前热衷于用户大数据分析的企业提出了警告,希望不要因为大数据的运用而形成对特定群体和个人的歧视,从而触犯相关的法律法规。同时,报告中还列出了一系列的问题供企业进行自我审查,防止大数据分析违反消费者数据保护或平权法案。
下面是关于这方面问题的FAQ。
大数据分析如何会触犯与歧视相关的联邦法律?
大数据分析与风险同行,包括错误的预测。在信贷、雇佣或教育等方面,企业的实践对特定群体形成了歧视,就会面临着触犯相关法律法规的风险。
联邦贸易委员会在其报告中指出,如果基于某些群体共性特征来指导针对特定个体的业务决策,则可能会导致机会提供方面的不平等性。更进一步,可能会加深不同群体之间待遇的差异性,或者造成新的歧视现象。传统上,业界是基于信用相关的信息来构建信用评分模型。但是,如果利用大数据分析,对信用相关信息的依赖性就会大大降低,比如基于邮政编码或社交媒体使用量来对信用水平进行预测分析。这些信息,显然是具有歧视性的。
当运用大数据分析时,需要特别注意哪部法律法规?
《公平信用报告法案》(Fair Credit Reporting Act)、《联邦贸易委员会法案》(Federal Trade Commission Act)以及一些可能会对大数据分析起到规制作用的平权类联邦法案。
《公平信用报告法案》(The Fair Credit Reporting Act,FCRA):消费者报告服务机构的主要业务模式是收集和售卖个人数据,所影响的领域包括征信、雇佣、保险、租房等。这些机构处于公平信用报告法案的监管范畴之内,比如要通过合理的流程来确保信用报告的准确性,同时为信息主体提供访问自身数据并提出异议的服务渠道。
《联邦贸易委员会法案》(Federal Trade Commission Act,FTCA):联邦贸易委员会法案的第5部分对从事大数据分析的企业形成了一定的约束。如果企业的大数据实践可能会导致对消费者的伤害(只要这种伤害并非不可避免,或总体来说对消费者弊大于利),则就会被认定为违规。企业不能违背在信息共享方面对用户的承诺,同时必须确保所披露的信息是客观真实的。
确保机会公平性的相关法律:在关于机会的公平性方面,某些联邦法律是从事大数据实践的企业必须遵守的,比如《公平信贷法》(Equal Credit Opportunity Act,ECOA)、《美国残疾人法》(Americans with Disabilities Act)、《就业年龄差异法》(Age Discrimination in Employment Act)、《公平住房法》(Fair Housing Act)、《基因歧视法案》(Genetic Information Nondiscrimination Act)、《1964年民权法》第二章(Title VII of the Civil Rights Act of 1964)等。在这些法律的监管下,企业不能因种族、肤色、性别、宗教、年龄、身体、出生国、婚姻状况和基因信息等因素形成对个人或群体的歧视。
《公平信贷法》规定,征信机构不得基于上述因素对消费者差别对待,并遵守关于数据保存和信息公开方面的规定。
在避免歧视或差别化方面,从事大数据分析的企业应注意哪些问题?
那些运用大数据分析的企业应该进行自审,判断是否有与种族或宗教等因素相关的歧视性业务实践?是否对某类受法律保护的人群有负面作用?是否信守了数据保护方面的承诺?大数据实践过程是否对用户透明?数据安全保障的机制是否有效?
大数据相关的安全防护措施应该与敏感程度、数据规模、处理过程的复杂度以及安全保护的成本相匹配。比如,与仅仅保留个人姓名数据的企业相比,保存有个人医疗数据或社会安全号的企业就应该采取更为严格和全面的监管措施。
联邦贸易委员会建议,在进行分析之前,首先要确保数据具有代表性。有些特定人群的数据,可能相对稀缺,比如,远离技术的人群、未参与到主流经济生态的人群以及不愿意过多分享个人信息的人群。对此,委员会建议,企业必须谨防数据模型中隐藏的偏差,厘清统计关联性和因果性之间的区别。因此,企业需要详尽审视相关模型所依赖的因子,把握好预测分析与公平性之间的平衡关系。
在合规方面,运用大数据分析的企业应该注意哪些具体的对应细则?
将大数据分析用于形成征信、雇佣、承保、租房、社会福利等方面的企业,必须审查自己是否遵守了《联邦贸易委员会法案》的隐私和公平类条款。在流程建设上,必须尽可能确保数据的准确性,并允许消费者能访问自身数据并就错误或遗漏提出异议。而且,企业还要防止大数据分析被用于欺诈或歧视性的目的。
另一方面,从外部引入数据或技术用于上述领域的企业同样需要注意遵守《联邦贸易委员会法案》。比如,将大数据运用于招聘的公司,必须确保自身接收数据是合法的,没有触犯相关的平权法案,并主动告知信息主体。