ゼファーネットのロゴ

Causal Bayesian Networks:より公平な機械学習を可能にする柔軟なツール

日付:

機械学習(ML)に基づく決定は、同じ主観性に悩まされることがなく、より正確で分析しやすいため、人間の決定よりも潜在的に有利です。 同時に、MLシステムのトレーニングに使用されるデータには、有害な決定につながる可能性のある人間と社会のバイアスが含まれていることがよくあります。雇用、刑事司法、監視、医療などの分野での広範な証拠は、ML決定システムが個人を不利に扱う可能性があることを示唆しています(不当に)人種、性別、障害、性的指向などの特性に基づいて-呼ばれる 機密属性.  

現在、ML意思決定システムの評価と設計に使用されるほとんどの公平性基準は、機密属性とシステム出力の間の関係に焦点を当てています。 ただし、トレーニングデータは、機密属性が他の変数にどのようにおよびなぜ影響するかに応じて、不公平の異なるパターンを表示する可能性があります。 これを完全に考慮せずにそのような基準を使用すると、問題が生じる可能性があります。たとえば、有害なバイアスを示すモデルは公正であり、その逆は、無害なバイアスを示すモデルは不公平であるという誤った結論につながる可能性があります。 公平性に対する技術的解決策の開発では、データに不公平性が現れる可能性があるさまざまな、場合によっては複雑な方法を検討する必要もあります。 

機密属性がデータセット内の他の変数にどのように、そしてなぜ影響を与えるかを理解することは、技術的分析と社会学的分析の両方を必要とする困難な作業になる場合があります。 視覚的でありながら数学的に正確なフレームワーク 因果関係 ベイジアン ネットワーク (CBN)は、データセットの基礎となるさまざまな不公平シナリオを形式化、測定、および処理するために使用できるため、この点で柔軟で便利なツールを表します。 CBN(図1)は、因果的影響を示すリンクで接続された確率変数を表すノードによって形成されるグラフです。 不公平さをグラフの敏感な属性による有害な影響の存在として定義することにより、CBNはシンプルで直感的な ビジュアルツール データセットの基礎となるさまざまな不公平シナリオを説明するため。 さらに、CBNは 強力な私たち 定量ツール データセットの不公平性を測定し、研究者がデータセットに対処するための技術を開発するのを支援する。 

ビジュアルツールとしての因果ベイジアンネットワーク

データセットの根底にある不公平のパターンの特徴付け

架空の大学入試の例を考えます(バークレー事件に触発された)申請者は、資格Q、部門Dの選択、および性別Gに基づいて許可されます。 また、女性の応募者は特定の部門にもっと頻繁に応募します(簡単にするために、性別をバイナリと見なしていますが、これはフレームワークによって課される必要な制限ではありません)。 

出典:https://deepmind.com/blog/article/Causal_Bayesian_Networks

スポット画像

最新のインテリジェンス

スポット画像