Reformando nosso sistema de teste obsoleto

Os objetivos potenciais da reforma escolar incluem o currículo (o que deve ser ensinado), a instrução (como o ensino ocorre e quem o faz) e testes (o método pelo qual a aprendizagem é medida). Como já discutii instruções, gostaria de usar esta parcela para discutir o que precisa ser alterado sobre testes, um processo atualmente tão obsoleto quanto a instrução em sala de aula.

Grande parte dessa obsolescência resulta da contínua dependência da indústria de testes educacionais sobre os pressupostos subjacentes ao modelo psicométrico clássico que criou, e foi avançado, as primeiras tentativas de desenvolver testes de inteligência e aptidão. Hipóteses que podem ter sido sustentáveis ​​para construções que (a) eram de etiologia desconhecida, (b) possuíam domínios de itens que não podiam ser especificados de forma exaustiva, e (c) acreditavam (incorretamente) serem estáveis ​​e imutáveis ​​às instruções. De igual importância, uma pontuação perfeita (ou uma pontuação de zero) nos testes resultantes não poderia ser interpretada quantitativamente porque era impossível para qualquer humano ter atingido a perfeição (ou ser completamente desprovido) dos atributos em questão.

A aprendizagem escolar, por outro lado, não possui nenhuma dessas restrições, embora os testes comerciais de "realização" sejam construídos como se fosse. Isso se mostrou muito infeliz, uma vez que os propósitos reais dos testes educacionais são identificar qual o currículo que cada aluno dominou e o que mais precisa ser ensinado (ou re-ensinado).

Como os testes de aprendizado escolar devem ser construídos

Uma vez que sabemos o que provoca a aprendizagem (instrução) e o que deve ser ensinado em nossas escolas (o currículo), a avaliação da aprendizagem escolar dificilmente é ciência do foguete. Supondo que nosso prazo de teste continue sendo um ano letivo, "tudo" que precisamos é:

1. Especifique todo o currículo da escola primária através do uso de objetivos de instrução com detalhes suficientes para permitir que vários itens de teste sejam escritos para cada objetivo.

2. Construa ensaios de aprendizagem escolar por algum procedimento defensável e transparente a partir desta lista de objetivos de instrução e itens de teste. Esses testes podem ser baseados em assuntos acadêmicos únicos (por exemplo, matemática, compreensão de leitura) ou mais tópicos de instrução especializados em um assunto (por exemplo, vocabulário de leitura).

3. Administrar cada teste duas vezes (de preferência através de computadores para que os resultados possam estar imediatamente disponíveis, armazenados de forma segura e adequadamente distribuídos), uma vez no início do ano e uma vez no final. (Não há necessidade de avaliar objetivos ou itens idênticos duas vezes, uma vez que não é difícil garantir a equivalência se os mesmos procedimentos de amostragem forem empregados. É necessário administrar os testes duas vezes durante o mesmo ano, no entanto, uma vez que a escola atualmente tem pouco controle sobre o que ocorre durante os meses de verão).

A diferença entre o início do ano e o final do ano, os resultados dos exames representarão a quantidade absoluta do currículo de qualquer aluno aprendido durante esse ano. A maior parte disso será uma função da instrução escolar, embora haja (e sempre será) algum erro associado a inferências com base nos resultados dos exames devido à amostragem, como um aluno pode ter sentido durante uma das sessões de teste, exposição a uma escola extra instrução, e assim por diante. Nenhuma medida jamais desenvolvida (física, psicológica ou educacional) é conduzida sem algum grau de erro.)

Os resultados dos testes construídos dessa maneira possuem uma série de características interessantes, algumas das quais são:

1. Não é necessário empregar pontuações padrão (como equivalências de notas, classificações de percentil, etc.). Todas essas manipulações algébricas, incluindo a própria curva normal, são usadas exclusivamente para classificar os resultados das ordens com a finalidade de compará-los uns aos outros, o que é necessário apenas quando um teste é incapaz de medir a quantidade absoluta de algo. Os testes que avaliem o aprendizado escolar devem ser capazes de produzir zeros significativos (indicando que nenhum currículo foi aprendido) e pontuações perfeitas (ou seja, 100% de domínio do currículo). Em outras palavras, os escores produzidos por tais testes representariam a quantidade de aprendizado que ocorre. Para reduzi-los a uma lista ordenada de classificação simples seria idiotice.

2. Testes como estes têm implicações diretas de instrução por direito próprio, uma vez que cada item representa um objetivo instrucional e um item faltado, portanto, representa um conceito específico não aprendido que precisa ser ensinado (ou re-ensinado). A unidade de análise mais significativa, portanto, muitas vezes se torna uma resposta individual do aluno para cada item individual.

3. Uma vez que todas as partes interessadas (professores, pais e alunos) podem ter acesso aos objetivos de instrução que devem ser ensinados e aos tipos de itens que serão utilizados para avaliar a aprendizagem: (a) os professores devem ensinar o teste e devem empregar testes simulados com base em itens similares (mas não idênticos) para verificar quais alunos dominaram quais os objetivos imediatamente após a instrução; (b) os pais também teriam a capacidade de avaliar o progresso de seus filhos durante o ano letivo; e (c) os alunos se familiarizarão com o processo de teste e os tipos de itens que irão enfrentar no final do ano.

4. Recursos como estes (ou seja, a existência de uma tradução abrangente do currículo por meio de objetivos de instrução, cada um dos quais seria acompanhada de itens de teste de amostra) também pode acelerar o desenvolvimento de software de tutoria digital suplementar, tornar a tutoria humana suplementar mais efetiva , e reduzir os efeitos das habilidades de teste diferencial que contribuem para a diferença de testes socioeconômicos.

Do meu ponto de vista, a única questão não respondida é por que deve haver resistência, fora do setor de testes, para substituir esse processo pelo nosso modelo de teste atualmente obsoleto.

Para uma discussão mais abrangente sobre os testes escolares, consulte o capítulo oito de TOO SIMPLE TO FAIL: um caso para mudança de educação (Oxford University Press) [[email protected]]