[编辑]
关于从损坏数据进行公平性感知学习的不可能性
因果关系和鲁棒性视角下的算法公平性会议论文集,PMLR 171:59-83,2022。
摘要
解决机器学习模型的公平性问题是实现其在现实世界自动化系统中的长期应用的关键一步。已经开发了许多用于从数据训练公平模型的方案,并且这些算法的一个隐含假设是,它们能够在数据中存在潜在历史偏差的情况下恢复一个公平的模型。在这项工作中,我们展示了一系列不可能性的结果,表明当数据集的比例受到任意操纵时,不存在能够恢复公平模型的学习算法。具体来说,我们证明在某些情况下,攻击者可以迫使任何学习器返回一个有偏差的分类器,无论是否降低准确性,并且这种偏差的强度对于数据中代表性不足的受保护群体的问题会增加。我们的结果强调了进一步研究各种强度的数据损坏模型以及建立更严格的数据收集实践以进行公平性感知学习的重要性。