Edição 4

Revista Bimensal
Edição - Novembro 04
Página

proFORM		R
	*online*

Contributo para uma reflexão sobre validade e fiabilidade dos exames nacionais

Ana Morais
Professora do 4ª Grupo A
Esc. Sec. c/ 3º ciclo de Padre António Vieira

A avaliação das aprendizagens não pode ser um acto isolado que se realiza quando termina a tarefa da formação. Se centrarmos a avaliação em um momento único, seja ele a realização de um teste escrito ou de um exame nacional, estamos a fazer uma avaliação não rigorosa pois as variáveis que condicionam esse momento são tantas que não é possível garantir a validade da mesma. Além disso, num acto isolado de avaliação, as condições do avaliado introduzem um artificialismo no seu comportamento que pode conduzir a enganos irreparáveis.

A avaliação deve ser contextualizada e ter em consideração as condições em que se produz a formação. Não é um fenómeno estranho, sobreposto, postiço e descontextualizado.

Pode parecer estranho que se tenha começado este texto por uma introdução em que se chama a atenção para o facto da avaliação dever ser contextualizada. No entanto, parece-me importante começar por integrar as provas de exame nacional apenas numa parte da avaliação dos alunos. No sistema educativo português há uma combinação para efeitos de certificação, entre as classificações obtidas pelos alunos nos exames nacionais e as que são obtidas nas escolas (o peso dos exames é 30%, o da avaliação interna é 70%). Essas classificações obtidas pelos alunos nas escolas são certamente fruto de avaliações contínuas partilhadas em que as aprendizagens vão sendo construídas de forma significativa.

Desde o final do séc. XIX que a escolaridade dos cidadãos de quase todos os países do mundo aumentou significativamente. A esta expansão demográfica nas escolas correspondeu, em muitos países, e igualmente em Portugal, um aumento das ofertas ao nível do ensino superior, não sendo, mesmo assim suficiente para responder ao aumento da procura. Neste contexto, os exames assumiram para além do papel de certificação, de controlo, de monitorização e motivação, uma função marcadamente selectiva. Muito se tem escrito sobre as várias funções dos exames nacionais em Portugal. Não vou referir (porque não é esse o contexto deste documento) as desvantagens dos exames. Enumero, apenas, e admitindo que a sua elaboração tem qualidade pedagógica e formativa, três vantagens que os exames nacionais podem ter:

exercer um efeito moderador nas avaliações praticadas pelos professores nas escolas;
sugerir práticas inovadoras de avaliação;
ser um contributo para avaliar o sistema educativo.

Dada a importância que os exames nacionais assumem no nosso sistema educativo, deve ser assegurada a sua validade e sua fiabilidade.

A validade de um exame nacional, é representada pelo grau de exactidão com que o instrumento de avaliação consegue avaliar o que na verdade pretende medir.

A validade não se refere propriamente ao teste em si mesmo, mas sim à interpretação de resultados tendo em vista um determinado propósito.

O conceito de validade surge, assim, sempre no contexto de uma situação de avaliação, o que conduz a diferentes tipos de validade. Podemos falar de três tipos de validade: validade de conteúdo, validade empírica e validade teórica.

Destes três tipos aquele que constitui requisito indispensável de qualquer teste é a validade de conteúdo que, num teste referente a critérios, constitui a trave mestra em que este se apoia.

Pode definir-se fiabilidade de um instrumento de avaliação como a consistência da medida. Para que a classificação de um exame nacional seja fiável é necessário que se classifiquem os testes de tal forma que as classificações obtidas em determinada ocasião sejam muito semelhantes às que seriam obtidas se o exame tivesse sido administrado aos mesmos alunos com as mesmas competências, mas em tempos diferentes.

Não sendo possível eliminar completamente as inconsistências é, no entanto, desejável que se tenham em conta os factores que influenciam a fiabilidade.

Porque existem várias fontes de erro de medição, existem vários tipos de fiabilidade. Não tem sentido falar em fiabilidade sem referir as várias fontes de erro de medição.

As três grandes fontes de erro são: o próprio teste e respectivos critérios de classificação, as circunstâncias em que o teste é aplicado e o classificador que atribui a classificação do teste.

Vejamos alguns dos factores, inerentes à classificação, que interferem na fiabilidade das classificações de um teste:

Personalidade do classificador
Experiência do classificador
Critérios implícitos (ocultos) do classificador
Hierarquia de critérios do classificador
Momento em que o classificador efectua a classificação
Duração da sessão de classificação
Intervalo entre as sessões de classificação
Efeitos de contraste e de assimilação

Informação sequencial

Ancoragem

Modelo de referência

Há processos de moderação que contrariam os factores que influenciam a fiabilidade da classificação.

Podemos referir alguns desses processos:

Formação de classificadores
Resolução e análise detalhada da prova antes de se iniciar a classificação
Análise detalhada dos critérios
Multiclassificação das provas
Classificação item a item ou grupo a grupo
Variação da ordem da classificação das provas
Controlo por amostragem
Ajustamento de médias

O Gabinete de Avaliação Educacional (GAVE) concebeu e promoveu acções de formação presencial, subordinadas ao tema: Avaliação Externa no Ensino Secundário e destinadas a professores que, depois de receber essa formação, seriam supervisores da classificação das provas de Química, Matemática e Biologia, nos anos 2001/2002 e 2002/2003, tendo sido a disciplina de História integrada neste processo de supervisão no ano 2003/2004. Promovendo a formação de professores classificadores contribui-se, assim, para um aumento da fiabilidade das classificações.

O mesmo gabinete publicou o ”Relatório Técnico e de Avaliação” da supervisão da classificação das provas de exame de Biologia, Matemática e Química, no qual se faz a descrição do processo, a avaliação do processo e as conclusões quanto à importância deste processo de supervisão.

Podemos ler nas conclusões desse Relatório:
“Consideramos que o diálogo entre todos os elementos intervenientes no processo contribuiu para:

um aumento da qualidade dos instrumentos de avaliação externa (provas de exame e respectivos critérios);
uma reflexão sobre a qualidade dos testes escritos e respectivos critérios (avaliação interna);
o reconhecimento da importância do cumprimento dos critérios de classificação das provas de exame, mesmo estando em desacordo com eles;
a disponibilidade dos supervisores para promoverem reuniões nos grupos disciplinares, visando divulgar e debater com os professores a vantagem da fiabilidade das classificações;
a melhoria e o refinamento do próprio processo de supervisão, na medida em que, ao longo dos anos, o diálogo promovido abrangerá um maior número de professores.”

Este é um dos caminhos a percorrer.

Fernandes, D. (2004) Avaliação das aprendizagens: uma agenda, muitos desafios. Versão não definitiva de um trabalho em desenvolvimento para publicação posterior na Texto Editora.
Santos Guerra, M. A. (2003) Uma seta no alvo – A avaliação como aprendizagem. Edições Asa.
Silva Pereira, J. (coordenação). (2003). Relatório Técnico e de Avaliação. GAVE (Gabinete de Avaliação Educacional).