Cerca de 5 milhões de brasileiros fizeram a prova do Exame Nacional do Ensino Médio (ENEM) em outubro. O organizador da prova, Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), mostrou o gabarito poucos dias depois. Suponha que um dos estudantes, hipoteticamente chamado de Isaac Newton, tenha resolvido as questões de matemática que ele sabia, e que, antes de entregar a prova, tenha chutado as respostas que não sabia. Afinal, entre cinco alternativas (a,b,c,d ou e), a chance de acertar uma delas no chute é de 1/5, ou seja, 20%. Com o gabarito oficial em mãos, Isaac Newton descobre que acertou uma das questões no chute. Em janeiro de 2012, quando usar seu CPF para saber a nota individual, aprenderá uma lição: é difícil enganar computadores. Para azar dele, os computadores a serviço do INEP vão soltar um relatório dizendo, mais ou menos, assim: "É muito alta a chance de que nosso amigo Isaac Newton tenha acertado essa questão no chute. Nós, computadores, recomendamos desconsiderar essa questão na nota final do Isaac Newton".
Para organizar o ENEM, técnicos do INEP usam um método estatístico conhecido como TRI (Teoria da Resposta ao Item). É um método usado por médicos, militares, propagandistas, administradores de empresas, esportistas. Quando uma empresa usa o TRI para organizar qualquer tipo de questionário, ela ganha uma pergunta importante: qual é a probabilidade de que uma pessoa tenha acertado a questão x por seu próprio mérito ou por acaso? Se a probabilidade for alta, a empresa atribui o mérito da resposta ao respondente; se a probabilidade for baixa, ela ignora a questão, pois é mais provável que o respondente tenha chutado.
Ao usar o TRI, o governo ganha várias vantagens: ele consegue informação mais precisa de quem sabe exatamente o quê, consegue comparar escolas da zona rural de Manaus com escolas do centro de São Paulo. A TRI, contudo, é menos ótima para quem faz o teste: o estudante, seu professor, seus pais. Se Isaac Newton quisesse saber como a TRI funciona, e por que sua nota é aquela divulgada pelo governo, teria que de estudar estatística avançada. Especialistas no assunto dizem que o Ministério da Educação (MEC) deve continuar usando a TRI nas avaliações oficiais, pois, pressupondo que o MEC esteja fazendo tudo com boa vontade, isso é bom para o Brasil. Mas, a cada rodada do ENEM, falta divulgar informações de um jeito que o estudante, seu professor e seus pais possam compreender e usar.
O Mais Provável
Raquel Cunha Valle, estatística da Fundação Carlos Chagas, diz que podemos usar uma fita métrica para medir a altura de uma pessoa em centímetros, ou usar uma balança para medir seu peso em quilogramas, mas como medimos o que uma pessoa sabe ou ignora? "A resposta da teoria da resposta ao item", diz Raquel, "é criar uma unidade de medida para o conhecimento".
Uma tabela muito simples, mostrada abaixo, pode ajudar leitores como Isaac Newton a entender o que lhes aconteceu. No caso de uma prova como a do ENEM, "C" significa "acertou" e "E" significa "errou".
Neste nosso exemplo, Gauss acertou as cinco questões, provavelmente sabe 100% do que deveria saber. Euler, acertou quatro questões e errou uma, provavelmente sabe 80% do que deveria saber. Arquimedes acertou três questões e errou duas, provavelmente sabe 60% do que deveria saber. E assim por diante. A ênfase na palavra provavelmente serve para destacar a natureza estatística da TRI. Da mesma forma, a questão 1, que somente uma pessoa acertou, é difícil demais para 80% dos candidatos. A questão 2, que só duas pessoas responderam corretamente é difícil demais para 60% dos candidatos. E assim por diante.
Agora, imagine o Isaac Newton como sendo a sexta pessoa da tabela acima:
Note que ele também acertou duas questões e errou três, e que, portanto, sua média é igual à média de Einstein. Isaac Newton parece saber 40% do que deveria saber. Mas sua prova tem lógica? Até que ponto uma pessoa consegue acertar uma questão difícil (questão 1) e errar três questões mais fáceis? Não é mais provável que Isaac Newton tenha chutado a resposta da questão 1?
Ao realizar um teste comum, o MEC só consegue descobrir duas coisas: quantas questões a pessoa acertou e quantas errou. Mas, ao realizar um teste com todas as ferramentas estatísticas da TRI, o MEC consegue saber, com maior grau de precisão, o que uma pessoa sabe ou ignora.
Tufi Machado Soares, professor da Universidade Federal de Juiz de Fora (MG) e coordenador de pesquisas do Centro de Políticas Públicas e Avaliação da Educação, explica as principais alavancas de ajuste num modelo estatístico feito com base na TRI: dá para ajustar o grau mínimo de conhecimento para responder a uma questão com 50% de chance, dá para ajustar até que ponto a questão vai discriminar entre quem sabe e quem ignora, e dá para saber a probabilidade de que alguém acerte a questão por acaso (chutando). Essas três alavancas têm nomes técnicos complicados (traço latente do j−ésimo indivíduo) e simbolizados por letras gregas e latinas (θj).
Para explicar a mágica da TRI, especialistas como Raquel e Tufi Machado sempre mostram uma curva famosa: curva característica do item:
Na imagem acima, θ representa o que a pessoa sabe, e se θ=0 significa que a pessoa tem conhecimentos suficientes para acertar uma questão com probabilidade de 50% - ela tem conhecimentos suficientes para, nesta questão, decidir a resposta no cara e coroa. Se ela fizer isso, os computadores do INEP não conseguirão dedurá-la, pois ela acertou outras questões com o mesmo grau de dificuldade. Mas se θ=–5, significa que a pessoa tem conhecimentos suficientes para acertar a questão com probabilidade de 2%. Em outras palavras, significa que, caso ela acerte a questão, é bem provável que tenha chutado, e os computadores do INEP vão dedurá-la.
Exame por Computador
Especialistas independentes e técnicos do INEP não se cansam de mencionar as vantagens do TRI. Se a prova for bem desenhada, o avaliador pode cancelar uma questão errada sem prejudicar ninguém, pois as probabilidades são calculadas para as questões válidas. Se uma questão estiver escrita de modo a confundir pessoas com conhecimentos avançados, isto ficará claro, pois os computadores vão mostrar um grande número de pessoas com conhecimentos avançados errando a mesma questão, o que é pouco provável. Se uma pessoa se submeter a duas provas diferentes, mas feitas segundo a TRI, é provável que sua nota seja quase a mesma nas duas provas. O MEC pode comparar pessoas de regiões diferentes em anos diferentes. Se alguém obtiver os gabaritos da prova e vendê-los por um bom dinheiro, os computadores do INEP serão capazes de detectar a discrepância estatística.
A TRI só existe porque existem computadores. Sem eles, seria impossível calcular à mão todas as variáveis do modelo estatístico. Na fórmula principal da TRI, cada pessoa é descrita por meio de sete variáveis e quatro constantes. No ENEM, com 5 milhões de pessoas, são 35 milhões de variáveis e 20 milhões de constantes para calcular e comparar umas com as outras. Quando o INEP tiver um banco de dados de itens de tamanho adequado, os estudantes poderão realizar as provas por meio do computador: o estudante acerta uma questão e o computador puxa do banco de dados uma questão um pouco mais difícil; o estudante erra uma questão e o computador puxa uma questão um pouco mais fácil. Com esse método, o MEC conseguirá medir com precisão maior ainda o que o estudante sabe.
Bula Indecifrável
Críticos do ENEM vivem dizendo que o governo esconde os critérios pelos quais forma a nota de cada aluno. Afinal, os critérios são públicos ou são segredo de Estado? Tufi Machado diz que não há segredo algum: se a pessoa for ótima de estatística, se ela tiver conhecimentos profundos sobre a TRI, e se ela for persistente feito um mosquito da dengue, então ela conseguirá ter acesso aos critérios técnicos e talvez até aos dados brutos. "Os critérios até que são bem conhecidos pelos especialistas no assunto", fiz Tufi. Contudo, se a pessoa for um estudante, ou seu professor, ou um de seus pais, aí sim ela está numa enrascada. Até agora, o governo brasileiro não demonstrou interesse em divulgar critérios técnicos e dados brutos com frequência e clareza.
Explicar a TRI é difícil mesmo. Um exemplo: se o estudante tira a nota média do ENEM, ele tira 500, pois o INEP atribui valor 500 à nota média. Contudo, numa escala de 0 a 10, a nota média de uma ano pode ser 6 e de outro ano pode ser 5,5. Nos dois casos, o aluno que tirar a nota média vai tirar 500. Se ele tirar mais de 500, significa apenas que tirou mais que a nota média. Se tirar menos que 500, significa que tirou menos que a nota média. "A TRI é como se fosse um tipo de mágica", diz Raquel Valle, "mas poucos têm acesso ao truque".
Especialistas em modelagem matemática sabem que, quanto mais fielmente o modelo matemático representa a realidade, mais complicado ele é, pois a realidade é bem complicada. A TRI é complicada simplesmente porque ela retrata a realidade de modo melhor. Porém, isso não é desculpa para explicar a TRI com linguagem supertécnica. É possível pensar na TRI como uma bula. Se você escrever a bula com linguagem médica muito técnica, o paciente não vai entender nem mesmo para que serve o remédio.
O Teorema de Bayes
Os criadores da teoria da resposta ao item usaram como ferramenta principal o teorema de Bayes, criado pelo matemático inglês Thomas Bayes (1702–1761). O teorema trata de uma questão importante, cotidiana até, mas difícil de entender: qual é a probabilidade de que o evento A tenha ocorrido, visto que o evento B acabou de ocorrer? O símbolo para isso é Pr(A∣B).
Teorema: Os eventos A1,A2,A3,⋯,Ak são eventos mutuamente exclusivos, cuja união é todo o espaço amostral de um experimento. O evento B é um evento com probabilidade diferente de zero (Pr(B)≠0). Sendo assim:
Pr(Ai∣B)=Pr(B∣Ai)⋅Pr(Ai)∑kx=1Pr(B∣Ax)⋅Pr(Ax)
Um exemplo para tornar a fórmula acima mais clara: A1 representa o evento de jogar uma moeda com duas "caras" três vezes seguidas, e A2 representa o evento de jogar uma moeda comum três vezes seguidas. Suponha que você escolhe uma das duas moedas ao acaso e, portanto, Pr(A1)=1/2 e Pr(A2)=1/2. Seja B o evento de obter três caras seguidas (ou seja, você escolheu uma moeda ao acaso, jogou essa moeda ao ar três vezes e conseguiu três caras seguidas); portanto, Pr(B∣A1)=1 e Pr(B∣A2)=1/8. Qual é a probabilidade de que você tenha escolhido a moeda com duas caras (A1) visto que saíram três caras seguidas? Aplicando a fórmula:
Pr(A1∣B)=Pr(B∣A1)⋅Pr(A1)Pr(B∣A1)⋅(A1)+Pr(B∣A2)⋅Pr(A2)Pr(A1∣B)=1⋅121⋅12+18⋅12=89=88,9%
O teorema de Bayes dá a resposta: se você escolheu uma das moedas ao acaso, e obteve três caras seguidas, então a probabilidade de que tenha escolhido a moeda com duas caras é de 88,9%.
Na notação acima, temos que Pr(A) é a probabilidade a priori (antes do experimento) e Pr(Ai∣B) é a probabilidade a posteriori (depois do evento).
Alguns exemplos do teorema de Bayes na vida diária:
1) Se um homem bate na própria mulher, qual é a probabilidade de que venha a matá-la? É baixa, visto que a maioria desses homens não mata a mulher. Se uma mulher é encontrada morta a facadas, qual é a probabilidade de que tenha sido assassinada pelo próprio marido, dado que o marido batia nela? É altíssima.
2) Escolha uma pessoa a esmo. Qual a chance de que ela tenha problemas psiquiátricos? É baixa. Qual a chance de que ela acredite que seu chefe lê seus pensamentos? É baixa. Mas se essa pessoa escolhida a esmo acredita que seu chefe lê seus pensamentos, qual é a chance de que tenha problemas psiquiátricos? É altíssima.
3) Segundo dados do INEP, só 11% dos brasileiros terminam o ensino médio sabendo a matemática que deveriam saber. Dada tal informação, o que é mais provável: que o MEC esconda os dados a respeito do método usado no ENEM para, escondendo, melhorar artificialmente os números da educação no Brasil, ou que ninguém no MEC tenha se animado a criar um programa nacional de explicações simples e claras sobre o ENEM?
Referências:
[1] Revista Cálculo nº 10, ed. Segmento, 2011
Veja mais:
Introdução à Ferramenta TRI
Análise Estatística e a TRI
Eu não conhecia esta TRI, e achei muito interessante. É claro que eu fiquei pensando: Pode ser que haja uma pequena injustiça em supor que um determinado candidato tenha acertado uma questão no chute. Sei lá, vai que o cara sabia resolver uma questão difícil, por ter estudado e entendido aquele assunto mais do que os outros. Eu entendi, pela leitura do post, que esta probabilidade é muito baixa, ou quase nula. Enfim, as estatísticas devem neste caso falar mais alto, e aí, azar daquele que fugiu do padrão. O ideal era se fazerem exames escritos, mas isto é impraticável, devido às dimensões deste tipo de prova.
ResponderExcluirAbraço, e parabéns pelo post altamente informativo.
Segundo dados do INEP, só 11% dos brasileiros terminam o ensino médio sabendo a matemática que deveriam saber. Dada tal informação, qual é a probabilidade de que o MEC esconda os dados a respeito do método usado no ENEM para, escondendo, melhorar artificialmente os números da educação no Brasil? É altíssima.
ResponderExcluirOlá Jairo,
ResponderExcluirRealmente é muito interessante e parece ser bem complexo na prática. Creio que alguma injustiça deva acontecer, mas pelo que entendi, esse método é bem dinâmico e os dados estão sempre se atualizando e sendo modelados para a realidade. Mais uma ferramenta matemática em prol da sociedade. Uma coisa interessante é que tudo começou com Thomas Bayes, no século XVIII.
mas se um candidato não sabe nada e resolve chutar, ele também pode dar a sorte de acertar as questões "certas" e assim entrar na estatística. Também acho que uma prova dissertativa seria o ideal para medir o quanto se sabe, mas como disse, seria impraticável. Acho que já passou da hora do Brasil mudar a forma de como trata a educação. Para entrar numa faculdade, deveria avaliar o currículo escolar e assim decidir em qual faculdade será aceito.
AMIGO, VOCÊ DISSE ACIMA TUDO QUE EU SEMPRE TIVE VONTADE DE VER EM MEU PAÍS, AVALIAÇÃO DE CURRICULO ESCOLAR DECIDINDO O FUTURO DO ALUNO!
ExcluirMEUS PARABÉNS PELO BLOG! É DIFÍCIL ENCONTRAR QUALIDADE, MAS AQUI EU ENCONTREI.
Não concordo. Infelizmente algumas escolas não ensinam o básico, de matemática principalmente. Tem gente na universidade que não sabe regra de três.
ExcluirIsso é verdade. Mas vejo que, para que esse sistema para entrar na faculdade com base no currículo escolar, o Brasil tem que mudar muito. E quando isso acontecer, o ensino médio terá qualidade suficiente. O grande problema é que o Brasil não quer mudar.
ExcluirVale a pena dar uma olhada!
ResponderExcluirhttp://notasenem.blogspot.com/
obrigado pelo link, realmente muito interessante. Abraços
ExcluirMuito bom artigo e blog, parabéns. Mas só pra não perder a viagem...
ResponderExcluir"A TRI é como se fosse um tipo de mágica", diz Raquel Valle, "mas poucos têm acesso ao truque"
^ Que comentário patético dessa mulher! Como uma pessoa estudada em Estatística fala uma besteira dessas? Podia ter pensado mais antes de falar isso. Não tem nada de mágica. E qualquer um poderia ter acesso ao truque se o INEP quisesse.
Há pessoas que acreditam nos números tanto quanto fiéis seguidores de uma Religião, e querem ser os donos da verdade dando declarações evasivas e estabelecendo dogmas matemáticos. Que vergonha. O papel da Matemática é esclarecer, não ocultar.
Não, a TRI não é magica. É Estatística. E qualquer pessoa poderia ter acesso ao suposto "truque", que não passa de um programa de computador.
Olá Fulano, realemtne não tem nada de mágica é matemática pura! Mas é uma pena que em nosso país o ensino é mascarado para que continuemos sendo manipulados, pelo menos é assim em sua maioria.
ExcluirQuanto ao comentário da Raquel Valle, não acredito que ela tenha dito que é uma "mágica". Ela somente fez uma analogia onde em uma mágica, somente alguns sabem do truque; no caso da TRI, somente alguns sabem como funciona.
É triste que uma matemática tão sofisticada e com aplicações em várias áreas seja tão restrita.
Um abraço.
Gostei demais,post muito instrutivo,grato!
ResponderExcluirMuito inteligente essa TRI, mas gostaria de saber então se ela também faria o contrário, para ser justa. Isto é, suponha que um indivíduo acerte a todas as 19 das 20 questões de matemática de uma prova, errando apenas uma questão de nível FÁCIL. Nesse caso, o TRI "compreenderia" que o sujeito sabe o assunto mas provavelmente errou por nervosismo ou alguma distração qualquer? Note-se que ele acertou muitas questões bem mais difíceis.
ResponderExcluirAfinal, se for pra baixar a nota de quem acerta no chute, para serem totalmente justos, deveriam aumentar a nota de quem domina um assunto e erra por um vacilo qualquer.
Olá Jimmy. Não sei como ocorre na prática, mas o que você levantou seria o justo. Mas se tratando de Brasil, onde procura-se emburrecer a população, acredito que não seja computada.
ExcluirAbraços.
Belo texto! Bastante detalhado e acessível!
ResponderExcluirSó achei um pouco injusta a classificação das sumidades acima..Para gauss tudo bem, já que ele se envolveu em pesquisas relacionadas a varias areas do conhecimento...mas Newton e Einstein, que traduziram os fenomenos naturais atraves da física deixaram a desejar rsrsrsrs
Brincadeiras å parte, infelizmente, o processo ainda não possui a transparência devida e,provavelmente, os dados não refletem a realidade da educação brasileira...afinal, a manipulação de numeros para escondê-la e a aplicação de soluções paliativas ineficazes são especialidades de nosso governo...
Nada demais. Só uma outra informação sobre o País que o povo não está apto para compreender. Como avaliar currículos escolares de escolas públicas dada esta situação? Somente colégios de elite (leia-se particulares) terão preferência na escolha dos melhores cursos. As faculdades de quinta linha ficarão para a sobra, isto se não preferirem fazer curso técnico. Nada contra curso técnico, eu tenho, mas acaba sendo quebra-galho prá quem está nas camadas inferiores da pirâmide.
ResponderExcluir