segunda-feira, 13 de outubro de 2008

Falácias estatísticas


Dedicado ao Rogério Carpi meu mentor estatístico


Começamos com a seguinte igualdade, que é verdadeira:

16-36 = 25-45

Somamos (81/4) nos dois lados, o que não altera a igualdade:

16-36+(81/4) = 25-45+(81/4)

Isso pode ser escrito da seguinte forma: (trinômio quadrado perfeito)

(4-(9/2))2 = (5-(9/2))2

Tirando a raiz quadrada em ambos os lados temos:

4-(9/2) = 5-(9/2)

Somando (9/2) nos dois lados da igualdade temos:

4 = 5

Como 4=2+2 chegamos a seguinte conclusão:

2+2=5

A ascensão dos economistas como senhores das verdades e dos destinos do nosso país, dentre outros problemas (por formação faço parte desta “ classe “ me sinto à vontade para falar dela ), instituiu a estatística popular. Aquela que os jornais diários, os comentaristas radiofônicos e os apresentadores de televisão vivem repetindo, sem ter a menor idéia do que estão falando. É a estatística que transforma números absolutos em médias (“ontem eu vendi uma média de 30 produtos “) , que revelam progressões percentuais de situações não mensuráveis ( “ minha contusão melhorou uns 50 % “) e que transformam relações de causa e efeito em correlações (“ a ascensão do Obama está correlacionada à política externa de Bush“ ).

Termos estatísticos se tornaram os tapadores de buraco da pobreza de vocabulário. E caíram na boca do povo. Vox populi vox dei , alguém poderia argumentar - coitado de Deus que sempre leva a culpa.

Para entender as confusões é necessário saber o que significam as palavras do jargão estatístico. Vamos a elas :

1. Média : é , sem dúvida , o termo mais mal utilizado e, por isso mesmo, o alvo de inúmeras piadas ( quem não conhece a do frango ?) . Considerando uma distribuiçao de frequência de valores numéricos, ou seja , precisamos ter , pelo menos, duas ocorrências destes valores, podemos calcular uma média aritmética ( soma destes valores dividida pelo número de ocorrências) ou uma média geométrica (raiz enésima, onde “n” é o número de ocorrências, da multiplicação dos valores). Caso tenhamos um fator de ponderação, pesos relativos à importância ou repetição das ocorrências, uma dependente da outra, podemos calcular a média ponderada. Chamando a distribuição de valores “x” e a tabela de pesos “y” , a média ponderada é calculada somando-se o resultado das multiplicações de cada valor “x” pelo valor “y” correspondente e dividindo o valor obtido pela somatória de valores “y”.

Complicado ? Pode parecer mas, com certeza, fazemos isto com facilidade sem pararmos para pensar. O que realmente é complicado é que também não paramos para pensar na hora de utilizarmos a palavra média e aí, não poucas vezes, falamos besteiras. Falamos de média de uma única ocorrência (?!?) , de médias não relacionadas a valores numéricos (?!?) , de médias sem sobrenome ( aritmética, geométrica ou ponderada ?).

Ou seja : “ na média, usamos erroneamente a média”.

2. Progressões : quando falamos de uma progressão, devemos pensar em dois pré-requisitos , a saber, primeiro uma progressão se refere a um evento anterior do mesmo tipo , segundo os eventos comparados precisam ser mensuráveis (estamos falando de novo de valores numéricos). Quando alguém comenta que sua gripe melhorou 60 %, a primeira coisa que me vem à cabeça é se a pessoa mediu isto em relação aos graus de febre ou ao número de espirros... Ou quando alguém fala que “fulano é uns 30% melhor que beltrano” não consigo sequer supor o que isto quer dizer.

3. Correlação : o prefixo “ co “ indica algo que é feito ou ocorre em conjunto. Daí temos que uma correlação indica uma co-dependência entre duas distribuições de frequência, ou seja uma dependência mútua entre duas ou mais séries de valores numéricos. Usando a linguagem matemática poderíamos dizer que y = f (x) , ao mesmo tempo em que x = f (y) . A confusão típica é usar a palavra correlação para indicar uma relação de causa e efeito, onde apenas uma das variáveis é dependente.

Aqui também temos frequentemente a utilização do termo estatístico para ilustrar situações sem valores numéricos , “ correlacionando “ fatos não mensuráveis quantitativamente. Prática fomentada todos os dias pela nossa imprensa.

Poderíamos ainda citar diversas outras confusões semântico-estatísticas, mas a questão mais significativa é que devemos tomar cuidado com o uso destas palavras mais quando as ouvimos do que quando as falamos. Falácia , é algo que parece verdade, soa como verdade e é dito como se fosse verdade - mas é mentira . Manipular palavras de forma a convencer alguém sob argumentos falsos. Algumas pessoas são mestres na manipulação de palavras. Outras se especializam na manipulação de números !

Um ditado inglês diz que “ liars can figure, and figures can lie “, quando nos deparamos com afirmações onde se manipula bem as palavras e o números corremos o grande risco de tomarmos decisões erradas , dependendo da situação e da ordem de grandeza destes números, decisões catastróficas. Se tivermos o bom hábito de conhecer o básico do jargão estatístico evitamos as falácias e podemos nos ater a questionar a validade dos números.

Um comentário:

Sergio Sparsbrod disse...

Caramba, dessa vez você foi longe Fábio! Muito bom artigo. Faz tempo que eu não revia estes conceitos (rsss)!

Abraços,