A avaliação das
aprendizagens não pode ser um acto isolado que se realiza
quando termina a tarefa da formação. Se centrarmos a avaliação
em um momento único, seja ele a realização de um teste escrito
ou de um exame nacional, estamos a fazer uma avaliação não
rigorosa pois as variáveis que condicionam esse momento são
tantas que não é possível garantir a validade da mesma. Além
disso, num acto isolado de avaliação, as condições do avaliado
introduzem um artificialismo no seu comportamento que pode
conduzir a enganos irreparáveis.
A avaliação deve ser contextualizada e ter em
consideração as condições em que se produz a formação. Não é
um fenómeno estranho, sobreposto, postiço e descontextualizado.
Pode parecer estranho que se tenha começado este texto
por uma introdução em que se chama a atenção para o facto da
avaliação dever ser contextualizada. No entanto, parece-me
importante começar por integrar as provas de exame nacional
apenas numa parte da avaliação dos alunos. No sistema
educativo português há uma combinação para efeitos de
certificação, entre as classificações obtidas pelos alunos nos
exames nacionais e as que são obtidas nas escolas (o peso dos
exames é 30%, o da avaliação interna é 70%). Essas
classificações obtidas pelos alunos nas escolas são certamente
fruto de avaliações contínuas partilhadas em que as
aprendizagens vão sendo construídas de forma significativa.
Desde o final do séc. XIX
que a escolaridade dos cidadãos de quase todos os países do
mundo aumentou significativamente. A esta expansão demográfica
nas escolas correspondeu, em muitos
países, e igualmente em
Portugal, um aumento das ofertas ao nível do ensino superior,
não sendo, mesmo assim suficiente para responder ao aumento da
procura. Neste contexto, os exames assumiram para além do
papel de certificação, de controlo, de monitorização e
motivação, uma função marcadamente selectiva. Muito se tem
escrito sobre as várias funções dos exames nacionais em
Portugal. Não vou referir (porque não é esse o contexto deste
documento) as desvantagens dos exames. Enumero, apenas, e
admitindo que a sua elaboração tem qualidade pedagógica e
formativa, três vantagens que os exames nacionais podem ter:
-
exercer um efeito moderador nas
avaliações praticadas pelos professores nas escolas;
-
sugerir práticas inovadoras de
avaliação;
-
ser um contributo para avaliar o
sistema educativo.
Dada a importância que os
exames nacionais assumem no nosso sistema educativo, deve ser
assegurada a sua validade e sua fiabilidade.
A validade de um exame nacional, é representada pelo
grau de exactidão com que o instrumento de avaliação consegue
avaliar o que na verdade pretende medir.
A validade não se refere propriamente ao teste em si
mesmo, mas sim à interpretação de resultados
tendo em vista um determinado
propósito.
O conceito de validade surge, assim, sempre no contexto
de uma situação de avaliação, o que conduz a diferentes tipos
de validade. Podemos falar de três tipos de validade: validade
de conteúdo, validade empírica e validade teórica.
Destes três tipos aquele que constitui requisito
indispensável de qualquer teste é a validade de conteúdo que,
num teste referente a critérios, constitui a trave mestra em
que este se apoia.
Pode definir-se fiabilidade de um instrumento de
avaliação como a consistência da medida. Para que a
classificação de um exame nacional seja fiável é necessário
que se classifiquem os testes de tal forma que as
classificações obtidas em determinada ocasião sejam muito
semelhantes às que seriam obtidas se o exame tivesse sido
administrado aos mesmos alunos com as mesmas competências, mas
em tempos diferentes.
Não sendo possível eliminar completamente as
inconsistências é, no entanto, desejável que se tenham em
conta os factores que influenciam a fiabilidade.
Porque existem várias fontes de erro de medição,
existem vários tipos de fiabilidade. Não tem sentido falar em
fiabilidade sem referir as várias fontes de erro de medição.
As três grandes fontes de erro são: o próprio teste e
respectivos critérios de classificação, as circunstâncias em
que o teste é aplicado e o classificador que atribui a
classificação do teste.
Vejamos alguns dos factores, inerentes à classificação,
que interferem na fiabilidade das classificações de um teste:
-
Personalidade do classificador
-
Experiência do classificador
-
Critérios implícitos (ocultos)
do classificador
-
Hierarquia de critérios do
classificador
-
Momento em que o classificador
efectua a classificação
-
Duração da sessão de
classificação
-
Intervalo entre as sessões de
classificação
-
Efeitos de contraste e de
assimilação
-
Informação sequencial
-
Ancoragem
-
Modelo de referência
Há processos de moderação
que contrariam os factores que influenciam a fiabilidade da
classificação.
Podemos referir alguns desses processos:
-
Formação de classificadores
-
Resolução e análise detalhada da
prova antes de se iniciar a classificação
-
Análise detalhada dos critérios
-
Multiclassificação das provas
-
Classificação item a item ou
grupo a grupo
-
Variação da ordem da
classificação das provas
-
Controlo por amostragem
-
Ajustamento de médias
O Gabinete de Avaliação
Educacional (GAVE) concebeu e promoveu acções de formação
presencial, subordinadas ao tema: Avaliação Externa no Ensino
Secundário e destinadas a professores que, depois de receber
essa formação, seriam supervisores da classificação das provas
de Química, Matemática e Biologia, nos anos 2001/2002 e
2002/2003, tendo sido a disciplina de História integrada neste
processo de supervisão no ano 2003/2004. Promovendo a formação
de professores classificadores contribui-se, assim, para um
aumento da fiabilidade das classificações.
O mesmo gabinete publicou o ”Relatório Técnico e de
Avaliação” da supervisão da classificação das provas de exame
de Biologia, Matemática e Química, no qual se faz a descrição
do processo, a avaliação do processo e as conclusões quanto à
importância deste processo de supervisão.
Podemos ler nas conclusões desse Relatório:
“Consideramos que o diálogo entre todos os elementos
intervenientes no processo contribuiu para:
-
um aumento da qualidade dos
instrumentos de avaliação externa (provas de exame e
respectivos critérios);
-
uma reflexão sobre a qualidade
dos testes escritos e respectivos critérios (avaliação
interna);
-
o reconhecimento da importância
do cumprimento dos critérios de classificação das provas de
exame, mesmo estando em desacordo com eles;
-
a disponibilidade dos
supervisores para promoverem reuniões nos grupos
disciplinares, visando divulgar e debater com os professores a
vantagem da fiabilidade das classificações;
-
a melhoria e o refinamento do
próprio processo de supervisão, na medida em que, ao longo dos
anos, o diálogo promovido abrangerá um maior número de
professores.”
Este é um dos caminhos a
percorrer.
Fernandes, D. (2004) Avaliação
das aprendizagens: uma agenda, muitos desafios. Versão não
definitiva de um trabalho em desenvolvimento para publicação
posterior na Texto Editora.
Santos Guerra, M. A. (2003) Uma
seta no alvo – A avaliação como aprendizagem. Edições Asa.
Silva Pereira, J. (coordenação). (2003). Relatório Técnico e
de Avaliação. GAVE (Gabinete de Avaliação Educacional).