domingo, 6 de novembro de 2011

Riscos II - O Fenômeno Linda

Em postagem anterior, verificamos que, por vezes, nossa avaliação intuitiva de riscos e da plausibilidade em situações hipotéticas está de acordo com a moderna Teoria de Probabilidade, mas em outros casos parece indicar caminhos muito diferentes. Há mais algumas manifestações curiosas deste problema. Acompanhemos, por exemplo, um experimento reportado pelos pesquisadores Tversky e Kahneman. Os sujeitos deste experimento, em sua maioria estudantes universitários, eram apresentados a um texto semelhante a este:

"Linda tem 31 anos, é solteira, desinibida e intelectualmente brilhante. Formou-se em Filosofia. Quando estudante, mostrou-se bastante preocupada com questões de discriminação e justiça social, e participou de protestos contra o uso de energia nuclear em seu país. "

Após lerem o texto, os sujeitos deveriam indicar o quanto uma série de afirmações sobre Linda era ou não provável, atribuindo números de 1 a 8. Entre as afirmativas, havia estas duas: 

A) Linda é bancária.
B) Linda é bancária, e participa do movimento feminista. 

Mais de 80% dos respondentes indicaram que B é mais provável que A, e este resultado é bastante estranho. Ocorre que, se tomarmos a palavra probabilidade no seu sentido matemático estrito, é absolutamente impossível que a afirmativa B seja mais provável que a afirmativa A, independentemente de quem seja Linda e quais sejam suas inclinações políticas e profissionais. E não é difícil compreender por quê: a alternativa B exige que seja verdadeira a alternativa A e mais alguma coisa. É claro que B só pode ser, na melhor das hipóteses, tão provável quanto A. Explicando de outro modo, imagine o conjunto de todas as bancárias da cidade onde Linda mora. Agora imagine o conjunto de bancárias feministas. É evidente que este conjunto é necessariamente menor ou igual ao primeiro (e só seria igual se todos as bancárias fossem também feministas). A probabilidade de Linda pertencer a um grupo menor (mais específico) não pode ser maior. Isto é uma questão tão clara que é fácil demonstrá-la a partir dos axiomas de probabilidade.

Este problema de julgamento não é um fenômeno isolado. Há diversos estudos indicando que tendemos a atribuir maior probabilidade a uma conjunção de eventos, em franca oposição ao fato de que a conjunção de vários eventos é necessariamente menos provável que seus eventos constituintes (ou apenas igualmente provável). Para citar dois outros casos:

1) Estudantes de Medicina, após lerem a descrição de um caso, atribuíram maior probabilidade à afirmativa "O Paciente tem as doenças A e B" do que a "O paciente tem a doença A". Mesmo que a doença B seja mais compatível com o quadro apresentado, não pode ser mais provável termos duas doenças simultâneas em vez de uma só.

2) Especialistas em Relações Internacionais, após lerem uma descrição sobre um cenário hipotético na relação entre nações, atribuíram probabilidade maior a "O país A vai invadir B e em seguida o país C vai declarar guerra a A", do que a "O pais C vai declarar guerra a A", que é um quadro mais vago, e por isso necessariamente mais provável.

Este fenômeno costuma ser denominado A Falácia da Conjunção, e discutir suas origens é interessante. Começamos reconhecendo que só existem duas alternativas: ou a maioria não consegue raciocinar corretamente sobre probabilidades, ou a maioria está dando a resposta correta a uma pergunta ligeiramente diferente daquela apresentada. Por motivos que já expus anteriormente, eu acredito que a segunda alternativa seja a correta.  

É preciso então procurar responder a duas questões: qual a pergunta corretamente respondida, e por que os sujeitos não compreenderam que a pergunta não é esta. As teorias são muitas, e não necessariamente excludentes entre si, mas aqui gostaria de discutir apenas uma delas, que atribui a resposta errada a um cálculo equivocado de probabilidades a posteriori

Antes de começarmos, uma pequena advertência: no que se segue, vamos admitir que as ideias estereotipadas que os sujeitos do experimento possam ter sobre feministas, filósofas e bancárias sejam corretas para o limitado efeito de dar a resposta correta ao problema proposto. Afinal, é um problema artificial e estereotipado, e não é esta a questão que nos interessa aqui. Queremos saber como, independentemente da qualidade de suas percepções sobre profissões e perfis de personalidade, os sujeitos chegaram a uma conclusão logicamente absurda. 

Vamos supor que não houvesse texto algum, e que a pergunta fosse, simplesmente, "Conheço alguém chamado Linda. Qual a chance de que ela seja bancária?". Naturalmente, ninguém em sã consciência lhe faria uma pergunta dessas, leitor(a), exceto talvez em um processo seletivo para empresa de consultoria, mas vejamos o que podemos fazer. 

Aparentemente, muito pouco. Talvez diríamos que esta probabilidade é igual à proporção de bancárias entre todas as terráqueas. Se nos fosse permitido fazer mais perguntas, poderíamos descobrir em que país e cidade mora Linda, qual sua idade, sua formação profissional, e com base nestas informações poderíamos melhorar nossa estimativa. Esta nova estimativa de probabilidade tendo por base alguma informação já adquirida (ou que se supõe ser verdadeira) é chamada probabilidade condicional, ou a posteriori

As afirmativas apresentadas aos sujeitos no caso Linda são claramente cálculos de probablidade condicional. A alternativa A pode ser re-escrita da seguinte forma: "Qual a probabilidade de que Linda seja bancária, dado que este texto é uma descrição fiel de Linda"? Pede-se uma estimativa da probabilidade de que Linda seja bancária (ou, na alternativa B, bancária feminista), tendo por base o texto descritivo. 

Alguns autores sugerem que os sujeitos da pesquisa erram porque estão identificando equivocadamente qual informação é dada a priori e qual probabilidade deve ser calculada a partir dela. Na verdade, eles teriam invertido as duas, e estariam respondendo a "Tenho uma amiga Linda, que é bancária. Qual a chance de esse texto se referir a ela"? Em primeira leitura, é até difícil perceber a sutil diferença entre as perguntas.

Com esta inversão, a resposta dada pela maioria não é logicamente inconsistente. Na verdade, pode-se mostrar que, com algumas hipóteses adicionais razoáveis (mais uma vez, razoáveis para o nível de estereótipos com que estamos lidando no problema), a resposta dos 80% está correta --- para a pergunta errada, é preciso insistir. Vejamos: argumentamos acima que a quantidade de bancárias feministas não pode ser maior que a quantidade de bancárias. No entanto, a proporção das bancárias feministas que se encaixam no perfil pode sim ser maior do que a proporção de bancárias que se encaixam no perfil. E, se for, não é difícil mostrar que os cálculos de probabilidade condicional nos levam realmente à resposta dada. 

O caso é análogo para os estudantes de Medicina. A pergunta, como feita, ("Dado este quadro clínico, você apostaria que o paciente tem a doença A ou as doenças A e B ao mesmo tempo"?), está respondida erradamente. Mas uma pergunta sutilmente diferente ("Tenho aqui um prontuário perdido. Ele veio deste paciente que tem doença A ou deste paciente, que tem a doença A mas também a B, mais compatível com o quadro descrito?") foi respondida corretamente.

Falta explicar por que os sujeitos, em todos esses casos, responderam a uma pergunta que não foi feita. Mostramos que a diferença é sutil, mas por que foi escolhida a alternativa errada, em todos os casos? Talvez isto ocorra simplesmente porque a pergunta originalmente feita não faz muito sentido. Voltemos ao caso médico. Não faz sentido algum pedir que se compare uma causa simples e uma composta para os sintomas apresentados, especialmente se uma das causas não parece ter  muita relação com eles. Não é tão surpreendente que a maioria escolha uma interpretação diferente: é preciso atribuir o prontuário existente, concreto,  a um de dois pacientes reais: o que tem a doença A e outro que tem as doenças A e B. 

Em resumo, a Falácia da Conjunção não parece estar de fato relacionada a complexidades inalcançáveis da Probabilidade, mas na nossa tendência, de resto bastante útil, de acreditar que a pergunta que nos foi feita deve corresponder a alguma questão de interesse no  mundo real. 

Um comentário:

  1. Na versão original (6/11), havia uma frase faltando, justamente onde é explicada qual a pergunta efetivamente respondida, no caso Linda.

    ResponderExcluir