quarta-feira, 28 de dezembro de 2011

Riscos IV: A segunda chance

Gostaria de apresentar um outro problema interessante na área de probabilidade. Um professor certa vez me disse que se divertiu fazendo colegas da matemática e da estatística passarem maus bocados tentando resolver uma questão parecida. E, como em outros textos desta série, a confusão vem do uso descuidado de um princípio muito repetido: eventos anteriores não afetam probabilidades. 

Podemos apresentar o problema da seguinte forma: alguém mostra a você 3 conchas sobre uma mesa, e avisa que há uma moeda sob uma delas. Se você escolher a concha correta, fica com a moeda. Simples, não?

Mas, feita a sua escolha, propõe-se uma mudança: remove-se uma das conchas que não foram escolhidas, revelando que a moeda não está lá. Obviamente é sempre possivel retirar uma concha vazia: ou sua escolha foi certa, e neste caso tanto faz retirar qualquer uma das outras duas conchas, ou você escolheu a concha errada, e neste caso retira-se a segunda errada.

E aí vem o aspecto interessante do problema: você tem uma nova chance. Das duas conchas restantes, uma é a que você escolhera. Mas você pode agora mudar de ideia, e ficar com a outra concha que sobrou. Pergunta-se, muito simplesmente: vale a pena mudar a escolha?

O raciocínio rápido e errado costuma ser o seguinte: "A chance de acertar a concha não pode mudar porque eu recebi informação sobre o que havia em uma outra concha diferente da que eu escolhera. Parece então que não vale a pena trocar". Como tendemos a manter nossas escolhas até que se mostrem erradas (ou até um pouco depois de se mostrarem erradas), a reação da maioria é não mudar sua escolha inicial.

E esta maioria terá cometido um erro. Na verdade, você dobra suas chances de encontrar a moeda se fizer a troca. Vejamos por quê. Depois de todo o procedimento (escolha inicial, e revelação de uma concha errada) a escolha é uma só: trocar ou não trocar. Seja qual for a concha escolhida, a decisão de trocar ou não trocar define sucesso ou fracasso. Ou você havia acertado a primeira escolha (e, neste caso, trocar significa fracasso), ou você havia errado a primeira escolha (e, neste caso, trocar significa sucesso). O que atrapalha tudo, é claro, é o fato de você não saber se acertara a primeira escolha.

Ocorre que a chance de acertar a primeira escolha é de 1 para 3 (você escolheu uma de três conchas), e portanto a chance de ter errado a primeira escolha é de 2 para 3. Pelo argumento anterior, aproveitar a chance de troca lhe fará ganhar sempre que você errara a primeira escolha. Como é duas vezes mais provável que você tenha errado a primeira escolha, você deve sempre aceitar a chance de troca. 

Mesmo quando concordam com a resposta correta, algumas pessoas ficam insatisfeitas porque aparentemente esta resposta viola um fato muito enfatizado sobre probabilidade: eventos anteriores não mudam a probabilidade. E parece que o evento "retirar uma das conchas vazias" modificou probabilidades neste caso. 

Parece, apenas. Observe que é sempre mais provável que você tenha errado a primeira escolha (2/3 contra 1/3). O evento "mostrar a concha vazia" não modificou isto, de fato. Apenas permitiu uma chance de corrigir o erro de maneira efetiva.

Veja: se eu simplesmente omitisse esta etapa, e desse a chance de troca sem nada falar sobre as três conchas, ainda seria verdade que você provavelmente errara a primeira escolha. Ocorre que, neste caso, não sabemos como corrigir o erro: é de 2/3 a chance de ter errado (portanto, é bom apostar na correção), mas é 1/2 a chance de conseguir corrigir a escolha, porque agora não sabemos qual das duas conchas restantes escolher. Neste caso, trocar ou não trocar lhe deixaria de novo com 1/3 de chance de acertar.

Certa vez ouvi o seguinte argumento: "mas, se alguém entra na sala no meio do experimento, sem ter acompanhado seus detalhes, não seria tentado a dizer ao candidato que a escolha não faria diferença?".  Sem dúvida. Se esta pessoa apenas vê o candidato escolhendo entre duas conchas, não parece haver nenhum sentido na troca.

Mas não há aqui nenhuma incoerência. O cálculo de probabilidades sempre é condicionado à informação disponível.  Resultados de experimentos anteriores não afetam as probabilidades de novos experimentos feitos nas mesmas condições. Mas a revelação de novas informações sobre um experimento já realizado deve, sim, ser levada em consideração ao computar quais os prováveis resultados. A máxima "não considere eventos anteriores", como já foi afirmado em outros textos da série, tem que ser tomada com um pouco de cuidado.

quinta-feira, 17 de novembro de 2011

Riscos III - O falso positivo.

Esta é mais uma das questões surpreendentes da área de probabilidade:

Você acaba de fazer um exame para detectar uma doença rada, que afeta 1% da população. O resultado, infelizmente, é positivo. Qual a chance de você ter mesmo a doença, sabendo-se que a taxa de falso positivo para este exame é de 1%?

A resposta correta, 50%, não é a mais popular. Ora, se o falso positivo é 1%, não é óbvio que há 99% de chance de termos um "verdadeiro positivo"? É evidente que, mais uma vez, uma pequena confusão semântica estabeleceu-se sobre o significado da expressão "falso positivo".

Não é difícil chegar à resposta correta se raciocinamos da seguinte forma: ou você pertence ao grupo de 1% que tem a doença, ou ao grupo de 1% que, apesar de não ter a doença, é acusado pelo exame. Sem outra informação disponível, a possibilidade de pertencer a um ou outro grupo de 1% é a mesma, e concluímos que a chance de você ser saudável ainda são esperançosos 50%.

Como sempre acontece, esclarecida esta questão, surgem outras. A primeira conclusão (errada) que se pode tirar é que o exame não diz muito. Afinal, depois de todo o trabalho de fazer o exame e esperar o resultado, temos apenas 50% de certeza. Mas vamos com calma: em primeiro lugar, os números do nosso problema são um pouco artificiais. Um exame para uma doença rara, na verdade, costuma ter taxas de falso positivo menores ainda (observe como é difícil desenvolver um bom exame para uma doença rara). Em segundo lugar, e mais importante, o exame nos deu uma enorme quantidade de informação. Saímos de uma pequena dúvida sobre termos a doença (1%) para uma situação muito mais clara (50%), embora talvez não tão clara quanto desejássemos.

Outra pergunta que surge é: não haveria uma definição mais prática de falso positivo, que me desse de imediato a resposta ao problema em questão (afinal, não é isso que eu busco quando falo em falso positivo)? Em outras palavras, não seria melhor dizer que o falso positivo do exame do problema considerado é 50%, o que me permitiria chegar mais facilmente à resposta correta?

Infelizmente, esta definição "prática" é, na verdade, impraticável, com o perdão do trocadilho. Observem que a resposta correta ao problema depende não só do exame em si, mas da raridade da doença. Se a doença afetasse 10% da população, a chance de estar doente, com os mesmos 1% de falso positivo, subiria para quase 91%. Assim, não se pode atribuir ao exame um número único, que nos dê a resposta correta para a questão. Não há saída fácil. É preciso ter cuidado com as definições, e fazer todas as contas.

segunda-feira, 14 de novembro de 2011

Chamando a Tecnologia de "Vossa Excelência"

A expressão é comum no futebol: o craque tem intimidade com a bola, trata a bola por "você". O perna-de-pau já a chama de "Vossa Excelência".

Eu acredito que o português falado no Brasil, e as regras de redação científica que nós mesmo nos impomos, nos faz chamar a Ciência, e em particular a Tecnologia, de "Vossa Excelência".Termos são mantidos no idioma inglês, por vezes sem necessidade alguma, ou a tradução vai buscar palavras desnecessariamente eruditas. Em nome da objetividade, o autor se preocupa mais em esconder os sujeitos das orações do que em comunicar ideias. Eu conheço alguns exemplos da área de eletrônica e informática, mas tenho certeza que o caso é mais geral.

Primeiro, vamos voltar ao futebol: goleiro, escanteio, zagueiro, centro-avante. Traduções que foram, em algum momento, inventadas, e que devem ter soado estranhíssimas para quem se acostumara com as corruptelas nacionalizadas, que ainda podem ser encontradas em textos antigos sobre o esporte no Brasil: golquipa, corner, beque, centerfor.

Seria tão difícil buscar uma tradução para, digamos software (que os franceses chamam logiciel)? A questão não é de nacionalismo. Não vejo problema em o português absorver dezenas de palavras do inglês em informática. O problema, de novo, é de recorrer a um idioma estrangeiro para tornar uma palavra mais respeitável e séria, mais "vossa excelência".

Muitos não escondem um sorriso discreto e superior ao saber que os portugueses chamam de rato o dispositivo indicador do computador ou, para mais um exemplo esportivo, de grelha a disposição dos carros antes da largada. Mas ora, mouse e grid não querem dizer nada mais profundo que rato e grelha. Se achamos a alegoria crua, por que não buscamos algo menos cru na nossa língua?

Na área de eletrônica digital, um circuito capaz de se manter estável em duas condições diferentes é a base de muitas formas de armazenamento de dados (armazena um 0 em um de seus estados estáveis, ou um 1 no outro estado). Tal dispositivo recebe nomes simples em inglês: latch (ferrolho) ou flip-flop (algo como vira-vira). Na verdade, estes dois nomes são usados para dispositivos sutilmente diferentes, mas isto não interessa aqui. Interessa que nós buscamos, nos píncaros do academicismo, o palavrão "multivibrador biestável" para descrever a mesma coisa. Convenhamos, já estamos quase trocando Vossa Excelência por Vossa Majestade.

Antes de sairmos da questão da tradução, não posso deixar de comentar o curioso caso da palavra "mídia". Corruptelas em geral são formadas mudando-se a ortografia da palavra para aproximá-la da pronúncia local (é a transformação de goal keeper para golquipa, vista acima). Já "mídia" parece ser uma corruptela às avessas. Transformamos a palavra latina media (meios) para que fique mais parecida com a pronúncia intuitiva e errada de cidadãos de língua inglesa...

Mas o esforço, consciente ou não, de tornar a tecnologia algo distante e estranho não se resume a uma escolha particular de palavras. Eu poderia citar o exagero das siglas, mas o pior mesmo são algumas praticas de redação técnica. Se eu costumo reclamar do tom bolorento e pedante de alguns trabalhos academicos das áreas de humanidades, devo reconhecer que os da área tecnológica perdem feio, em particular com sua bizarra preferência pela voz passiva e pelas orações sem sujeito.

Se o estudante escreve "Fizemos as medidas apresentadas neste trabalho usando o equipamento tal do laboratório tal" fatalmente ouvirá que precisa escrever de maneira mais objetiva. Se ousar escrever "Fiz", pode ser expulso da sala, entre esconjuros e aspersões de água benta.

E eu confesso que o argumento da objetividade nunca me convenceu. "Fizeram-se as medidas..." faria o leitor desconfiar que seres superiores fizeram as medidas e deixaram o resultado em nosso laboratório para que os reportássemos, assim propagando a Verdade? Não é escamoteando o sujeito da oração que nos tornamos objetivos. A objetividade cientifica vem da garantia de neutralidade do método empregado em relação à tese defendida, da comparação clara de resultados com teses alternativas, da investigação de significância estatística nas diferenças encontradas. Usar a voz passiva, ou procurar despertar o sono no leitor, é a parte fácil.

Se vamos empregar criativamente a tecnologia, e vamos defender que seu estudo seja mais difundido e mais respeitado, que tal evitarmos a formalidade, a complexidade desnecessária, a redação artificial e enfadonha? Vamos tratá-lá por "você"?

domingo, 6 de novembro de 2011

Riscos II - O Fenômeno Linda

Em postagem anterior, verificamos que, por vezes, nossa avaliação intuitiva de riscos e da plausibilidade em situações hipotéticas está de acordo com a moderna Teoria de Probabilidade, mas em outros casos parece indicar caminhos muito diferentes. Há mais algumas manifestações curiosas deste problema. Acompanhemos, por exemplo, um experimento reportado pelos pesquisadores Tversky e Kahneman. Os sujeitos deste experimento, em sua maioria estudantes universitários, eram apresentados a um texto semelhante a este:

"Linda tem 31 anos, é solteira, desinibida e intelectualmente brilhante. Formou-se em Filosofia. Quando estudante, mostrou-se bastante preocupada com questões de discriminação e justiça social, e participou de protestos contra o uso de energia nuclear em seu país. "

Após lerem o texto, os sujeitos deveriam indicar o quanto uma série de afirmações sobre Linda era ou não provável, atribuindo números de 1 a 8. Entre as afirmativas, havia estas duas: 

A) Linda é bancária.
B) Linda é bancária, e participa do movimento feminista. 

Mais de 80% dos respondentes indicaram que B é mais provável que A, e este resultado é bastante estranho. Ocorre que, se tomarmos a palavra probabilidade no seu sentido matemático estrito, é absolutamente impossível que a afirmativa B seja mais provável que a afirmativa A, independentemente de quem seja Linda e quais sejam suas inclinações políticas e profissionais. E não é difícil compreender por quê: a alternativa B exige que seja verdadeira a alternativa A e mais alguma coisa. É claro que B só pode ser, na melhor das hipóteses, tão provável quanto A. Explicando de outro modo, imagine o conjunto de todas as bancárias da cidade onde Linda mora. Agora imagine o conjunto de bancárias feministas. É evidente que este conjunto é necessariamente menor ou igual ao primeiro (e só seria igual se todos as bancárias fossem também feministas). A probabilidade de Linda pertencer a um grupo menor (mais específico) não pode ser maior. Isto é uma questão tão clara que é fácil demonstrá-la a partir dos axiomas de probabilidade.

Este problema de julgamento não é um fenômeno isolado. Há diversos estudos indicando que tendemos a atribuir maior probabilidade a uma conjunção de eventos, em franca oposição ao fato de que a conjunção de vários eventos é necessariamente menos provável que seus eventos constituintes (ou apenas igualmente provável). Para citar dois outros casos:

1) Estudantes de Medicina, após lerem a descrição de um caso, atribuíram maior probabilidade à afirmativa "O Paciente tem as doenças A e B" do que a "O paciente tem a doença A". Mesmo que a doença B seja mais compatível com o quadro apresentado, não pode ser mais provável termos duas doenças simultâneas em vez de uma só.

2) Especialistas em Relações Internacionais, após lerem uma descrição sobre um cenário hipotético na relação entre nações, atribuíram probabilidade maior a "O país A vai invadir B e em seguida o país C vai declarar guerra a A", do que a "O pais C vai declarar guerra a A", que é um quadro mais vago, e por isso necessariamente mais provável.

Este fenômeno costuma ser denominado A Falácia da Conjunção, e discutir suas origens é interessante. Começamos reconhecendo que só existem duas alternativas: ou a maioria não consegue raciocinar corretamente sobre probabilidades, ou a maioria está dando a resposta correta a uma pergunta ligeiramente diferente daquela apresentada. Por motivos que já expus anteriormente, eu acredito que a segunda alternativa seja a correta.  

É preciso então procurar responder a duas questões: qual a pergunta corretamente respondida, e por que os sujeitos não compreenderam que a pergunta não é esta. As teorias são muitas, e não necessariamente excludentes entre si, mas aqui gostaria de discutir apenas uma delas, que atribui a resposta errada a um cálculo equivocado de probabilidades a posteriori

Antes de começarmos, uma pequena advertência: no que se segue, vamos admitir que as ideias estereotipadas que os sujeitos do experimento possam ter sobre feministas, filósofas e bancárias sejam corretas para o limitado efeito de dar a resposta correta ao problema proposto. Afinal, é um problema artificial e estereotipado, e não é esta a questão que nos interessa aqui. Queremos saber como, independentemente da qualidade de suas percepções sobre profissões e perfis de personalidade, os sujeitos chegaram a uma conclusão logicamente absurda. 

Vamos supor que não houvesse texto algum, e que a pergunta fosse, simplesmente, "Conheço alguém chamado Linda. Qual a chance de que ela seja bancária?". Naturalmente, ninguém em sã consciência lhe faria uma pergunta dessas, leitor(a), exceto talvez em um processo seletivo para empresa de consultoria, mas vejamos o que podemos fazer. 

Aparentemente, muito pouco. Talvez diríamos que esta probabilidade é igual à proporção de bancárias entre todas as terráqueas. Se nos fosse permitido fazer mais perguntas, poderíamos descobrir em que país e cidade mora Linda, qual sua idade, sua formação profissional, e com base nestas informações poderíamos melhorar nossa estimativa. Esta nova estimativa de probabilidade tendo por base alguma informação já adquirida (ou que se supõe ser verdadeira) é chamada probabilidade condicional, ou a posteriori

As afirmativas apresentadas aos sujeitos no caso Linda são claramente cálculos de probablidade condicional. A alternativa A pode ser re-escrita da seguinte forma: "Qual a probabilidade de que Linda seja bancária, dado que este texto é uma descrição fiel de Linda"? Pede-se uma estimativa da probabilidade de que Linda seja bancária (ou, na alternativa B, bancária feminista), tendo por base o texto descritivo. 

Alguns autores sugerem que os sujeitos da pesquisa erram porque estão identificando equivocadamente qual informação é dada a priori e qual probabilidade deve ser calculada a partir dela. Na verdade, eles teriam invertido as duas, e estariam respondendo a "Tenho uma amiga Linda, que é bancária. Qual a chance de esse texto se referir a ela"? Em primeira leitura, é até difícil perceber a sutil diferença entre as perguntas.

Com esta inversão, a resposta dada pela maioria não é logicamente inconsistente. Na verdade, pode-se mostrar que, com algumas hipóteses adicionais razoáveis (mais uma vez, razoáveis para o nível de estereótipos com que estamos lidando no problema), a resposta dos 80% está correta --- para a pergunta errada, é preciso insistir. Vejamos: argumentamos acima que a quantidade de bancárias feministas não pode ser maior que a quantidade de bancárias. No entanto, a proporção das bancárias feministas que se encaixam no perfil pode sim ser maior do que a proporção de bancárias que se encaixam no perfil. E, se for, não é difícil mostrar que os cálculos de probabilidade condicional nos levam realmente à resposta dada. 

O caso é análogo para os estudantes de Medicina. A pergunta, como feita, ("Dado este quadro clínico, você apostaria que o paciente tem a doença A ou as doenças A e B ao mesmo tempo"?), está respondida erradamente. Mas uma pergunta sutilmente diferente ("Tenho aqui um prontuário perdido. Ele veio deste paciente que tem doença A ou deste paciente, que tem a doença A mas também a B, mais compatível com o quadro descrito?") foi respondida corretamente.

Falta explicar por que os sujeitos, em todos esses casos, responderam a uma pergunta que não foi feita. Mostramos que a diferença é sutil, mas por que foi escolhida a alternativa errada, em todos os casos? Talvez isto ocorra simplesmente porque a pergunta originalmente feita não faz muito sentido. Voltemos ao caso médico. Não faz sentido algum pedir que se compare uma causa simples e uma composta para os sintomas apresentados, especialmente se uma das causas não parece ter  muita relação com eles. Não é tão surpreendente que a maioria escolha uma interpretação diferente: é preciso atribuir o prontuário existente, concreto,  a um de dois pacientes reais: o que tem a doença A e outro que tem as doenças A e B. 

Em resumo, a Falácia da Conjunção não parece estar de fato relacionada a complexidades inalcançáveis da Probabilidade, mas na nossa tendência, de resto bastante útil, de acreditar que a pergunta que nos foi feita deve corresponder a alguma questão de interesse no  mundo real. 

sábado, 13 de agosto de 2011

Contando infinitamente parte II - Novos números


Em uma postagem anterior, raciocinamos sobre a questão dos infinitos números naturais (1,2,3,.....) e verificamos um fato curioso: mesmo tomando apenas subconjuntos destes (só os números pares, só os números maiores que 1 milhão, ou maiores que 1 bilhão) temos sempre uma “mesma” quantidade infinita de números. A primeira vista, pode parecer então que qualquer conjunto infinito tem o mesmo número de elementos. 

Será que a situação seria diferente se incluíssemos outros números além dos naturais? A operação de subtração de dois naturais, por exemplo, pode produzir números que não são naturais. Se subtraímos 101 de 100, ficamos “devendo” 1, e precisamos representar esta quantidade, que está abaixo do zero. Chegamos assim à ideia do número negativo (no caso, o número -1). Quando incluímos os negativos e o número zero aos naturais, temos os números inteiros.

Da mesma forma, a divisão entre dois naturais pode produzir números que não são naturais. Se dividirmos 10 por 3 temos um número bem definido, maior que o número 3, mas menor que o número 4, e que não é natural (nem inteiro). Quando incluímos estas frações (quantidades representadas como a razão entre dois números inteiros), construímos o conjunto dos números racionais.

Será que, ao acrescentarmos todos esses novos números aos nossos infinitos naturais, teremos uma infinitude “maior” que a dos naturais? A resposta será, mais uma vez, não.

Para mostrar por quê, vamos tornar nosso raciocínio um pouco mais amplo. Se eu usar duplas de números naturais, eu tenho um conjunto maior do que os naturais? Estas duplas são, naturalmente, formadas por dois números naturais. Aqui estão alguns exemplos.

(1 , 1)
(1 , 3)
(3 , 1)

Vejam que, se usarmos apenas os 5 primeiros naturais (1,2,3,4 e 5), podemos formar 25 duplas como essas. A quantidade parece maior, mas devemos nos lembrar da questão de comparar naturais e números pares, que discutimos na postagem anterior. Raciocinar sobre conjuntos finitos e querer daí concluir relações gerais sobre infinitudes não funciona.

De fato, novamente Cantor vem mostrar que a cada dupla dessas podemos atribuir um número natural único. A expressão nem é particularmente complicada. Se há uma dupla formada pelos números (x , y), eu atribuo a ela o número

½ (x+y) (x+y+1) +y

O leitor, se quiser, pode fazer alguns testes com esta expressão, e descobrirá que, para cada par, ela atribui um (e apenas um) número natural. Por exemplo, para os três pares apresentados acima, este "Pareamento de Cantor" indicaria os números 3, 11 e 9, respectivamente.  E ele pode ser estendido para trios, quartetos ou quaisquer listas de números.

Pelo argumento que temos usado deste a primeira postagem, uma vez que haja correspondência com os números naturais, a quantidade é igual à dos naturais. Neste ponto, talvez se deva mencionar que este argumento (segundo o qual existir correspondência entre dois conjuntos infinitos prova que eles têm a mesma quantidade) não está livre de críticas no campo da filosofia, mas não cabe uma discussão mais profunda disto aqui.

E o que tudo isso tem a ver com números negativos ou frações? Ora, quando representamos o número negativo -1, o sinal “-“ é apenas um código para indicar que este é um número negativo. Poderíamos convencionar que a dupla (0 ; 1 ) representa o número 1 e que a dupla (1 ; 1) representa o número -1. Para qualquer outro número x, (0 ; x) representa o número x e (1 ; x) representa a quantidade –x. Assim, os números inteiros são apenas um caso particular destes pares de números, em que se usam apenas os números 0 e 1 como primeiro número do par. Se existe infinitude contável de pares de números naturais, adicionar os negativos não nos ajudou em nada.

Para as frações, a relação é ainda mais evidente. Representamos a fração 10/3 desta forma por convenção. Podemos representá-la pela dupla (10 ; 3). Assim, adicionar todas as frações não produziu uma infinitude diferente.

Talvez neste ponto o leitor esteja reclamando aborrecidamente (“Já entendi. Todas as infinitudes são iguais”). Mas o interessante é que não são. Com um pouco de paciência, vamos encontrar este conjunto “mais infinito” do que os infinitos números naturais. Mas precisamos ainda de outros números.

E outros números existem, mas não vamos encontrá-los fazendo operações elementares sobre os números que já conhecemos, como acabamos de fazer com os negativos e as frações. É melhor usar aqui um argumento geométrico. Primeiro, façamos uma pergunta: o que significa uma medida? Quando o autor afirma que tem 1 metro e 65 centímetros de altura, o que isto de fato quer dizer? Podemos pensar da seguinte forma: se dividirmos o metro em 100 partes iguais, o autor cabe exatamente em 165 destas partes. Bom, na verdade não cabe, porque o autor tem vários milímetros de altura além destes 165 centímetros, mas vai dispensá-los para simplificar o argumento.

Mesmo que o autor queira os seus milímetros de altura de volta, bastaria dividir o metro em 1000 partes. Pode-se imaginar que qualquer medida “caiba” um número inteiro de vezes em algum submúltiplo suficientemente pequeno do metro. Ou, em outras palavras, que exista alguma fração relacionando qualquer comprimento e o metro, ou qualquer outra unidade de medida que se queira usar.

A descoberta de que isto não é verdade deve ser considerada uma das maiores ironias do destino em toda a história da matemática, já que ela coube justamente aos  pitagóricos, que valorizavam mais do que quaisquer outros a ideia de proporção. Em particular, eles descobriram que, em um quadrado qualquer, nenhum pedaço de seus lados, por menor que seja, cabe um número inteiro de vezes na diagonal.  

Traduzindo para números e álgebra, esta curiosa descoberta implica no fato de que a raiz quadrada do número 2 não pode ser expressa como uma fração. Diz-se que este é um número irracional. São irracionais, entre outros, as raízes quadradas dos números primos. São também irracionais certos números chamados transcendentes (que não podem ser encontrados a partir de finitas operações com números inteiros), como π (pi, a razão entre a circunferência e o diâmetro de um círculo), e e (o número de Euler, que aparece, por exemplo, na resposta de sistemas físicos a estímulos externos).

E há muitos outros. Na verdade (como o leitor pode imaginar....) há infinitos irracionais. E há infinitos irracionais entre dois números quaisquer.

Uma característica dos irracionais é que sua expressão decimal, ou seja, sua expressão como soma de potências do número 10 (unidades, décimos, centésimos, etc.) é infinita e sem repetições. Para entender isto, vamos ver o que ocorre com a expansão decimal de números racionais, primeiramente.

Em alguns casos,  números racionais têm descrição decimal finita (10/4 = 2,5). Em outros, é infinita (10/3 = 3,33333333333333333333333.....). Mesmo quando a expansão é infinita, os números desta expansão acabam se repetindo. Por exemplo, 10/7 = 1,42857428571428571....). Neste último caso, os números 428571 serão repetidos para sempre.

Já para os irracionais, a expansão decimal é infinita, e nenhuma repetição aparece. As primeiras cinquenta casas da expansão decimal de pi valem

π = 3.14159265358979323846264338327950288419716939937510...

e, por mais que se calculem novas casas, nunca haverá um padrão de repetição. Também o número de Euler, em 50 casas decimais, vale

e = 2.71828182845904523536028747135266249775724709369995...

Vejam que o “1828” parece que ia ser repetido, mas depois o número e mudou de idéia.

A inclusão dos irracionais no conjunto de racionais produz o conjunto de números reais. E este conjunto tem, finalmente uma infinitude diferente daquela dos inteiros, o que vínhamos tentando produzir até agora.

O argumento é, de novo, atribuído a Cantor, e espantoso pela sua simplicidade. Vamos supor que eu tenha concebido uma lista de todos os números reais, como fizemos anteriormente para os naturais, os inteiros e os racionais. Estes números (que incluem os irracionais) podem ser expressos por uma expressão decimal infinita. Vamos supor que a lista tenha o seguinte aspecto:

D11 D12 D13 ......
D21 D22 D23 ............
D31 D32 D33 ............
......

Em cada linha desta lista, há uma sequência (possivelmente infinita) de dígitos decimais (0,1,..,9). A rigor, devemos também indicar onde está  a vírgula decimal de cada número, mas isto pode ser facilmente definido com dígitos extras.

Não interessa de que maneira engenhosa nós tenhamos concebido tal lista: ela não pode incluir todos os irracionais. E a demonstração é muito simples. Dada esta lista, basta construir um número cuja expansão decimal é
  • Diferente de D11 na primeira casa.
  • Diferente de D22 na segunda casa.
  • Diferente de D33 na terceira casa.
e assim por diante. Teremos construído um número real que, por definição, não pode estar nesta lista, seja ela concebida como for. Se você atualizar a lista com este novo número que acabamos de construir, eu faço um novo número que não está incluído na nova lista, seguindo o mesmo método. E isto não terá fim.  Veja que o argumento não vale para os racionais, porque em algum momento seus dígitos decimais acabam ou se repetem.

Assim, não é possível colocar em correspondência os números reais e os números naturais. Os números reais não podem ser contados. Trata-se, finalmente, da infinitude incontável que procurávamos.

Depois de verificarmos tantos argumentos e tantos conjuntos de números, chegamos aonde? Conjuntos infinitos têm a estranha propriedade de terem subconjuntos com a mesma quantidade de elementos; naturais, inteiros e racionais todos pertencem a uma mesma classe de infinitude; os números reais (que incluem os irracionais) pertencem a outra classe de infinitude.

E, neste ponto de chegada, temos perguntas muito mais sérias do que aquelas com que partimos. Duas devem surgir logo de imediato:
  1. Existem infinitudes ainda maiores do que a dos reais?
  2. Existem infinitudes intermediárias, maiores do que a dos naturais e menores do que a dos reais?

Já adiantando, a resposta à primeira pergunta é sim. A resposta à segunda pergunta é.... digamos..... não se sabe.  Na verdade, é pior do que isso. Não se quer dizer que ninguém inteligente o bastante apareceu para responder à segunda pergunta. A resposta à segunda pergunta é “acredita-se que esta pergunta não possa ser respondida sem hipóteses adicionais".

Mas isso definitivamente é assunto para uma postagem futura.

sexta-feira, 24 de junho de 2011

Ainda os livro

Houve recentemente grande polêmica a respeito de um livro didático do ensino fundamental (“Por uma vida melhor”, Carolina Amaral de Aguiar e outros autores). Em particular, com relação ao seguinte trecho:

Mas eu posso falar os livro?’. Claro que pode. Mas fique atento porque, dependendo da situação, você corre o risco de ser vítima de preconceito linguístico.

Por um lado, muitos demonstraram indignação com um livro didático que “ensina a falar errado”. Outros tantos mostraram-se não menos indignados com os primeiros, que acusaram de ignorância, ou hipocrisia, ou submissão à imprensa golpista.

Mais uma opinião não há de fazer mal, mesmo vinda de um leigo (ou, pelo menos, um leigo no ensino de crianças e adolescentes). O livro de fato não ensina a falar errado, e esta crítica não é justa quando observamos o contexto da frase. Mas o trecho acima, mesmo lido em contexto, ou principalmente quando se pensa no contexto, merece a indignação que causou.

A linguagem não é um objeto acadêmico, mas um instinto individual que se expressa e se reinventa em sociedade. A linguagem em sua manifestação popular não é menos competente em realizar seus propósitos do que a linguagem mais erudita. Não existe debilidade cognitiva ou preguiça no falar popular, apenas um conjunto diferente de regras. Convenhamos, a justificativa teórica por trás da polêmica frase não é algo difícil de entender.

Nem é tese particularmente nova. Lembro-me, quando ainda aluno do ensino fundamental (à época “primeiro grau”), de ter sido instruído sobre a diferença entre a norma culta e outras formas de comunicação. Nunca fiquei tentado a dizer “passa-me o pão!” na mesa, em família, apesar de meu livro didático não conter uma autorização explícita para que eu continuasse empregando a próclise erradamente. E à época estávamos, se não me engano, no governo Figueiredo, e portanto podemos dispensar o debate PT x PSDB, que não nos ajuda em nada.

Considero razoável, para não dizer óbvio, pedir que um livro do ensino fundamental dedique-se a ensinar fundamentos, e não versões infantilizadas de teses da pedagogia, linguística ou sociologia. Peço também que o livro tenha sido escrito tendo em mente os estudantes que devem lê-lo, e não os especialistas que devem elogiá-lo. O trecho ora famoso, na minha opinião, mostra que o livro falha nos dois quesitos.

Para quem foi escrita a polêmica frase? Para o suposto estudante que fala “os livro”? Ele não sabe que “pode” falar como....fala? É ele que vem, incrédulo, pedir nossa permissão com a pergunta que inicia este trecho citado? Sem esse aviso, ele talvez viesse a desprezar o linguajar de seus amigos, de sua família, dos artistas populares que admira? Alguém realmente acredita que livros e professores tenham este poder?

Não, este trecho foi escrito para que os próprios autores professem, diante de seus pares e do público,  sua subscrição a teses em voga. Também a defesa apaixonada que se seguiu, com vários depoimentos de especialistas --- pois não há certo nem errado, mas especialistas há --- não chega a ser um debate sobre técnicas de ensino, mas uma cerimônia na qual pessoas vêm a público demonstrar sua superior generosidade, conhecimento e tolerância.

Mas pior do que esta autorização condescendente é a advertência que se segue: a crítica ao emprego do linguajar popular é preconceito. De novo os autores subscrevem tese cuja popularidade atual só é menor do que o tamanho do erro nela contido. Segundo tal ideia, toda crítica seria manifestação de alguma forma de preconceito. Tal raciocínio só pode interessar a quem deseja calar a crítica e, no caso da educação, fazer apologia à ignorância.

Afirmei acima que não há debilidade cognitiva ou preguiça no falar popular. É preconceito supor que uma pessoa seja pouco inteligente, ou incapaz, porque fala “os livro”. Mas não é preconceito supor que ela tenha tido educação incompetente, ou tenha-se dedicado pouco aos estudos. No momento de escolher entre candidatos para qualquer tarefa, não é preconceituoso nem errado levar este fato em conta. E a pessoa terá sido vítima sim. Não do preconceito, mas do fracasso do processo a que ela se submeteu, pensando em se aprimorar. Alguém que está sentado em uma sala de aula para estudar não pode seriamente considerar a "opção" oferecida pelos autores. Para falar como já fala, para pensar como já pensa, o que estaria fazendo ali?

Se a escola de fato não pode corrigir ou criticar (porque isto seria preconceito), o que ela de fato oferece? Como se chega à vida melhor que o livro humildemente propõe em seu título? Para ensinar ou defender o que se vê nas ruas, as ruas são melhores do que as escolas. Melhores do que seus professores e certamente melhor do que seus livros. 

domingo, 29 de maio de 2011

Contando discretamente até o infinito --- e mais um pouco. Parte I

A Matemática não tem lá uma fama muito boa. Árida, difícil, e “sem sentido” são algumas apreciações comuns. Há também a acusação de “frieza”. É considerada uma disciplina ao alcance apenas de uma minoria que nasceu com a habilidade (ou será o defeito?) de decifrar seus mistérios.

É claro que as diferentes áreas de atuação atraem pessoas com diferentes perfis. Mas é bastante injusto julgar a Matemática pelo que se faz dela na escola. Disciplina alguma (nem a Arte, nem a Ciência, nem a Filosofia) sobrevive incólume ao tratamento a ela dispensado nos bancos escolares.

É particularmente injusto colocar a Matemática lá onde agem os “frios e calculistas”, de um lado, e colocar do outro lado as disciplinas que expressam as qualidades do espírito humano. Longe de ser um campo de idéias pré-definidas, imutáveis e autonomamente construídas, a Matemática é um campo ilimitado para expressão da criatividade. Não há nela fundamentos imutáveis, nem proibições absolutas. O símbolo + pode ser redefinido para ter pouca (ou nenhuma) relação com a tabuada de adição. A afirmativa 1+1=1 pode ser válida, e estudantes de Engenharia Elétrica e de Computação trabalham rotineiramente com ela.

Por vezes, questões profundas e instigantes estão logo ao lado dos objetos e operações mais simples da matemática. É também notável como algumas dessas indagações, que parecem nascidas exclusivamente para satisfazer a uma curiosidade intelectual, acabam encontrando aplicação em campos da ciência e da tecnologia.

Vamos percorrer um desses caminhos nesta série de textos, começando com o simples ato de contar objetos. Logo estaremos nos perguntando coisas estranhas, como “todas as coleções infinitas têm o mesmo número de objetos?”, “todas as coleções de objetos podem ser contadas, mesmo que se demore infinitamente? “, “é possível conceber uma máquina que produza automaticamente a lista de todas as afirmações que podem ser provadas em matemática? “ Veremos que por trás de algumas destas questões estão conceitos bastante mundanos, que o leitor certamente já encontrou em algum momento, tais como a diferença entre o analógico e o digital, só para citar um deles.

Todos sabemos contar conchas recolhidas na praia, contar carneirinhos durante a insônia (se é que alguém realmente faz isso), e contar outros objetos. Sabemos que começamos com o número 1, e sabemos seguir daí pra frente. E sabemos ainda que, possivelmente, esta contagem não tem fim. Estes números que apareceriam na nossa contagem hipotética (1, 2, 3, etc.) são, muito apropriadamente, chamados Números Naturais.

A idéia de infinitude é incômoda. Podemos aceitá-la intuitivamente a princípio, mas é difícil fazer afirmações sobre o infinito. Por exemplo, o que ocorre se eu começar a contar do número 2? (eu resolvi pular o número 1, não gosto dele, ela dá azar). A sequência de números continua infinita, ao que tudo indica. Mas ao mesmo tempo ela deve ter um número a menos (porque o 1 vai ficar de fora). Infinito menos 1 ainda é infinito? E é o mesmo infinito?

Vamos deixar a questão ainda mais interessante. Eu quero contar apenas os números pares. Se eu contar todos os naturais até 10, vou ver que apenas 5 são pares (o 2, 4, 6, 8 e 10). Se contar até o 20, tenho 10 pares.

E se contar infinitamente? Existem mais números naturais do que números pares? Bom, parece que, se eu aumentar minha contagem mais e mais (em direção ao infinito!), continua a haver metade de pares. Assim, eu seria levado a afirmar que há 2 vezes mais números naturais do que números pares, que afinal são só um subconjunto daqueles.

No entanto, observe que há algo estranho sobre o meu argumento. Meu objetivo era comparar os infinitos números naturais com os infinitos números pares. Quando paramos a contagem em 10, em 20, ou em 1 bilhão, temos um conjunto finito, e a princípio, o raciocínio não vale.

Ora, mas certamente eu preciso parar a contagem alguma hora, não é mesmo? Curiosamente a resposta é não. Vejamos o raciocínio de Georg Cantor (1845-1918), matemático alemão que se aventurou ousadamente neste estranho campo de conjuntos que não têm fim.

Eu posso fazer uma correspondência entre cada número natural e um número par. Funciona assim: você me informa o número natural, e eu multiplico por dois. O resultado certamente será um par. A correspondência fica desta forma:
1 <-> 2
2 <-> 4
3 <->6
e assim até o infinito.

O raciocínio que precisamos seguir agora é muito simples: se a cada natural corresponde um par, o número de naturais e de pares precisa ser o mesmo. Se não fosse o mesmo, eu seria proibido de fazer esta correspondência em algum momento. Mas, dado qualquer número, sei fazer a correspondência. Ela não depende do tamanho do número escolhido. Há tantos naturais quanto pares! Veja que meu raciocínio não envolveu parar a contagem em algum momento e comparar os dois conjuntos. Estamos realmente comparando dois conjuntos infinitos...

E mais: como contar nada mais é do que atribuir um número natural a cada objeto, toda coleção que possa ser colocada em correspondência com os naturais pode ser contada, ainda que, se a coleção não tiver fim, esta contagem não termine nunca.

Sem sentido mesmo, essa matemática! Como assim pode ser contada se a contagem não termina? Veja que a matemática é elegante demais para se preocupar com coisas mundanas. Não interessa se você vai efetivamente terminar esta contagem antes de partir desta para melhor, ou ficar entediado e resolver fazer outra coisa (o que, convenhamos, é muito mais provável). A questão é saber se existe um procedimento para colocar esta coleção em correspondência com os números naturais. Se existe, ela pode ser contada. E daremos a essa coleção de infinitos objetos que pode ser contada, o nome de Infinitude Contável, é claro. Um nome no mínimo estranho sem o contexto do argumento acima.

Assim, nossa sequência de pares é uma infinitude contável. O número par “1 milhão” é o número 500000 desta sequência, e eu sei disso sem ter que contar diretamente até lá. Eu vou ter que parar a contagem alguma hora, mas eu sei o que foi contado e o que não foi, e sei onde entram os (infinitos) objetos que ainda falta contar.

E, se puder ser contada, essa coleção infinita de objetos tem “o mesmo tamanho” da coleção de números naturais. Assim como aconteceu com os pares, a quantidade de números naturais maiores que 1 milhão é igual à de números naturais. É só imaginarmos a seguinte correspondência:
1 <-> 1 milhão e 1
2 <-> 1 milhão e 2
3 <-> 1 milhão e 3

Será que este argumento nos leva a concluir que qualquer conjunto infinito é contável? A princípio, eu só preciso definir a ordem pela qual os elementos serão contados. Os exemplos que vimos nos levam a pensar que estabelecer esta ordem não deve ser tão difícil.

Na verdade, um dos resultados mais notáveis do trabalho de Cantor é uma resposta negativa a esta indagação: existem conjuntos que, além de infinitos, não podem ser colocados em correspondência com os naturais, ou seja, não se pode definir, de nenhuma forma, um método de contagem.

É interessante tentarmos encontrar estes conjuntos. Não funciona com os naturais, então teremos que procurar outros tipos de números. Mas isto fica para um próximo post. 

domingo, 22 de maio de 2011

Conheça Hans, o incrivel cavalo matemático

Durante a primeira década do século XX, alguns cidadãos da Alemanha foram brindados com um curioso espetáculo de rua: a demonstração das habilidades matemáticas e linguísticas do cavalo Hans.

Em uma destas demonstrações, por exemplo, o treinador e dono de Hans, Orlov Trotter, perguntava em voz alta: “Hans, se o dia 5 do mês caiu em uma terça-feira, qual o dia da sexta-feira seguinte?” Hans então começava a bater uma das patas no chão e parava após 8 batidas, para total admiração do público e o sorriso orgulhoso do dono.

As perguntas para Hans podiam também ser feitas por escrito, e envolver operações aritméticas de certa complexidade.

O assunto despertou óbvio interesse, e em certo momento criou-se uma comissão de investigação, formada por acadêmicos de diversas áreas e profissionais do ramo do circo. Uma série de experimentos conduzidos pelo psicólogo Oskar Pfungst começou a lançar alguma luz sobre o fenômeno. Foi observado que:
  • Hans só acertava perguntas cuja resposta fosse conhecida pelos espectadores à sua volta.
  • Hans precisava ter visão desimpedida, incluindo sua visão periférica, para responder corretamente às questões.

A comissão concluiu que Hans batia uma pata no chão até observar, por sutis sinais de alívio e aprovação de seu treinador ou do público, que havia chegado à contagem correta.

Esta história curiosa ilustra, de maneira notável, alguns aspectos do método científico e do comportamento humano (e animal) em relação ao conhecimento.

Em primeiro lugar, vemos que o ceticismo da investigação científica é uma necessidade. Não é um capricho, uma demonstração de mau-humor, de falta de imaginação ou de arrogância. Na verdade, é uma demonstração cristalina de humildade, em um nível raramente observado em outras áreas: precisamos de ceticismo para com as teses que levantamos, porque geralmente estamos errados. Porque as aparências e nossas pré-disposições nos enganam. A ciência consegue, ao longo do tempo (e com alguns recuos), fugir das armadilhas da aparência, não em virtude de ter em seus quadros pessoas de inteligência incomum, mas porque se cerca de procedimentos, por vezes incômodos, para diminuir a chance de nos enganarmos.

Outra reflexão: apesar do eventual incômodo a que me referi, os fundamentos do método científico estão à disposição de qualquer pessoa. O método de Pfungst é, de fato, simples: variar as condições dos experimentos, para verificar quais delas constituem a essência e a causa do fenômeno estudado. Se uma modificação fez o fenômenos desaparecer, estamos nos aproximando da identificação de sua causa. Não há nada de excessivamente sofisticado ou acadêmico nisso. Esta ferramenta está à nossa disposição para estudarmos e questionarmos muitos aspectos corriqueiros e cotidianos. Ela não é uma construção dos departamentos de ciências exatas das universidades, mas uma parte integral e essencial do espírito crítico do ser humano, a ser explorada e celebrada.

Deve-se notar também que, embora Hans não estivesse de fato fazendo aquilo que seu treinador e a maior parte do público imaginavam, não havia fraude alguma! Nada nas investigações da comissão ou nos experimentos de Pfungst indica que Trotter (que, a propósito, nunca cobrou por suas demonstrações) estivesse conscientemente passando dicas para Hans, ou tivesse tomado qualquer atitude para enganar o público. Este público de então viu, com aqueles olhos que a esta altura a terra já comeu, exatamente o que eles alegavam ter visto. Mas o que foi visto não nos leva a concluir que Hans fosse um cavalo versado em matemática nem (muito mais improvável ainda, obviamente) em alemão. Quando se recebe com ceticismo a informçaão de que uma testemunha alega ter presenciado algo, não estamos questionando sua honestidade ou sua honradez, mas apenas procurando explicações alternativas.

Uma última reflexão: além de ser acusada de arrogância, a ciência é por vezes criticada por “tirar a beleza” ou “o mistério” dos fenômenos. Cá estamos, às voltas com um fenômeno instigante, que nos faz pensar que animais podem ter habilidades maiores do que se imaginara, e lá vêm esses cientistas para estragar tudo com uma explicação sem graça.

E como resposta, deve-se fazer outra pergunta: quem disse que acabou o mistério? O feito de Hans é absolutamente extraordinário. É um fenômeno de interesse para a psicologia e a engenharia ainda hoje, 100 anos depois das demonstrações de Trotter. Apenas temos que interpretar esta curiosa história de maneira correta.

Hans foi capaz de estabelecer uma relação complexa com outros agentes inteligentes, construída a partir de pistas frágeis: de uma base empírica e sem planejamento, ele identificou quais eram as expectativas das pessoas à sua volta e desenvolveu de maneira autônoma um algoritmo para alcançá-la em uma interação não-trivial. Tal habilidade ainda pertence ao mundo dos sonhos da pesquisa moderna em sistemas inteligentes. Hans derrota, sem dificuldade, o mais sofisticado robô conhecido, um século depois de seus feitos. Não conhecemos o mecanismo neuro-químico capaz de representar processamento de informação de tamanha complexidade. Quem se dispuser a investigar este fenômeno não sofrerá por falta de mistérios.

E não precisamos parar por aí. Seria estranho que esse “efeito Hans” não tivesse um equivalente, ainda mais sutil e complexo, quando falamos da relação entre seres humanos. Quando fazemos entrevistas ou pesquisas de opinião, será que nosso sujeito não retira do entrevistador (que se esforça para manter-se neutro) dicas sutis sobre a resposta esperada, e não se sente, em algum nível, compelido a satisfazê-la? Será que isto explica, por exemplo, por que posições políticas extremas frequentemente têm maior representação no processo secreto de voto do que nas pesquisas eleitorais?

Hans nos oferece mistérios instigantes e a ciência nos convida a falarmos sobre eles. Ela só nos ajuda a não perdermos tempo onde o mistério não está.