机器学习的危险(使用计算机来识别和分析数据模式,例如在面部识别软件中)已成为头条新闻。斯坦福大学研究人员的一项新研究表明,这项技术还有望以公平,透明的方式帮助执行联邦法规,包括与环境相关的法规。

该分析报告于本周在计算机协会公平,问责和透明度会议上发表,评估了旨在支持美国环境保护署(EPA)减少严重违反《清洁水法》的倡议的机器学习技术中国机械网okmao.com。它揭示了所谓的算法设计的两个关键要素如何影响哪些社区是合规性工作的目标,因此是谁承担污染违规的负担。
鉴于最近的行政措施要求重新关注环境正义,这项分析是由斯坦福森林环境研究所的“实现环境创新计划”资助的,因此是及时的。
研究共同负责人Daniel Ho,William Benjamin Scott和Luna M. Scott教授说:“机器学习正被用来帮助管理联邦机构的任务,这是提高效率的一种方式。”斯坦福大学法学院法学硕士。“但是我们还表明,仅设计基于机器学习的系统可以带来额外的好处。”
普遍不遵守
《清洁水法》旨在限制直接排放到水道中的实体的污染,但是在任何给定的年份中,将近30%的此类设施自我报告持续或严重违反许可证的行为。为了在2022年之前将这种类型的不合规现象减少一半,EPA一直在探索使用机器学习来针对合规性资源。
为了测试这种方法,EPA向学术界伸出了援助之手。在其选定的合作伙伴中,包括斯坦福的法规,评估和治理实验室(RegLab),这是一个由Ho领导的法律专家,数据科学家,社会科学家和工程师组成的跨学科团队。该小组已经与联邦和州机构进行了持续的工作,以帮助环保。
在这项新研究中,RegLab研究人员研究了每个州如何对具有类似功能的许可证(例如废水处理厂)进行分类,以影响将其纳入EPA国家合规性计划。
他们还使用机器学习模型从EPA数据库中筛选了亿万次观察值(这是传统方法无法完成的任务),以了解历史排放量,合规性历史记录和许可水平变量,以预测未来发生严重违规事件和污染量的可能性每个设施都可能产生。然后,他们评估了每种模型表明风险最高的设施所在地区的人口统计数据,例如家庭收入和少数民族人口。
细节中的魔鬼
该团队的算法流程帮助揭示了EPA合规性计划的设计可以影响谁接收资源的两种关键方式。这些差异集中于包括或排除了哪些类型的许可证,以及如何明确说明目标本身。
在弄清楚如何实现合规性目标的过程中,研究人员首先必须将总体目标转化为一系列具体指令(一种算法)才能实现。当他们评估要对哪些设施进行预测时,他们注意到了一个重要的嵌入式决策。
相对于先前的努力,EPA计划将有盖许可证的范围扩大了至少七倍,但它的范围仅限于“单个许可证”,涵盖了特定的排放实体,例如单个废水处理厂。遗漏的是“一般许可证”,意在涵盖从事类似活动和类似类型废水的多个排放者。一个相关的问题:大多数许可和监督机构属于国家环境机构。因此,
“这种环境联邦制的影响使得与各州建立伙伴关系对于以公平方式实现这些更大目标至关重要”,合著者里德·惠特克(Reid Whitaker)说,他是RegLab会员,也是斯坦福法学院2020年毕业生,目前正在攻读博士学位。加州大学伯克利分校的法学和社会政策课程。
第二,当前的EPA计划着重于降低违规率。尽管有充分的理由实现这一政策目标,但研究人员的算法设计过程明确表明,相比超出许可限制的污染排放量,支持这一做法将产生强大的意想不到的效果。研究人员称,这将使执法资源从最严重的违法者转移到更农村的,以白人为主的社区,而最严重的违法者更有可能在人口稠密的少数民族社区,而转向更小的设施。
研究主要作者,RegLab的研究人员,农业与应用经济学助理教授Elinor Benami说:“将合规性倡议的大概念分解为计算机可以理解的较小部分,这迫使人们开始进行有关明确做出隐含决策的对话。”弗吉尼亚理工大学 谨慎的算法设计可以帮助监管机构透明地确定目标如何转化为实施,同时使用这些技术来解决持久的容量约束。”