Zephyrnet Logo

Explicação post-hoc de classificadores de caixa preta usando conjuntos de itens confiáveis. (arXiv: 2005.01992v1 [cs.AI])

Data:

[Enviado em 5 de maio de 2020]

Baixar pdf

Abstrato: É difícil confiar nas decisões tomadas pela Inteligência Artificial Black-box
(AI), uma vez que seu funcionamento interno e lógica de decisão estão ocultos do
do utilizador. A Inteligência Artificial Explicável (XAI) refere-se a sistemas que tentam
explicar como um modelo de IA de caixa preta produz seus resultados. Métodos post-hoc XAI
aproxime o comportamento de uma caixa-preta extraindo relacionamentos entre
valores de características e as previsões. Alguns explicadores post-hoc perturbam aleatoriamente
registros de dados e construir modelos lineares locais para explicar previsões individuais.
Outros tipos de explicadores usam conjuntos de itens frequentes para extrair valores de recursos que
freqüentemente aparecem em amostras pertencentes a uma classe particular. No entanto, o
métodos acima têm algumas limitações. Perturbações aleatórias não levam em consideração
conta a distribuição de valores de recursos em diferentes subespaços, levando a
aproximações enganosas. Conjuntos de itens frequentes prestam atenção apenas aos frequentemente
aparecendo valores de recursos e perdendo muitas correlações importantes entre os recursos
e rótulos de classe que podem representar com precisão os limites de decisão do
modelo. Neste artigo, abordamos os desafios acima, propondo uma
método de explicação denominado Confident Itemsets Explanation (CIE). Nós apresentamos
conjuntos de itens confiáveis, um conjunto de valores de recursos altamente correlacionados a um
rótulo de classe específica. O CIE utiliza conjuntos de itens confiáveis ​​para discretizar o todo
espaço de decisão de um modelo para subespaços menores. Extraindo importante
correlações entre as características e os resultados da caixa-preta em
diferentes subespaços, o CIE produz explicações por instância e por classe
que aproximam com precisão o comportamento do classificador de caixa-preta de destino.

Histórico de envio

De: Milad Moradi [ver email]
[V1]
Ter, 5 de maio de 2020 08:11:24 UTC (1,884 KB)

Fonte: http://arxiv.org/abs/2005.01992

local_img

Inteligência mais recente

local_img