Os instrutores devem dizer aos cães quando seu comportamento é errado?

SC Psychological Enterprises photo
Fonte: SC Psychological Enterprises photo

O Golden Retriever moveu-se pelo chão até onde uma meia dúzia de objetos em forma de halteres foram espalhados. Quando o cão se aproximou de um desses, o treinador disse "Sim!" Com uma voz entusiasmada. O cão imediatamente pegou o artigo e devolveu-o a ela em troca de um deleite.

Poucos momentos depois, o artigo com o cheiro do manipulador havia sido devolvido ao grupo de outros itens e colocado em um local diferente. Mais uma vez, o grande cão amarelo avançou e estava prestes a levantar outro objeto do chão, no entanto, esta vez não era o item com o cheiro correto. Ao ver isso, o manipulador anunciou "Desculpe!" O cachorro parou de alcançar o item errado, olhou de volta para o treinador e, de uma maneira bastante subjugada, começou a explorar os outros itens. Em última análise, ele decidiu sobre o item correto, o que desencadeou outro feliz "Sim!" E quando ele voltou com ele, ele recebeu outro deleite.

A primeira parte desta sequência de treinamento é um aspecto bastante comum e familiar do treinamento de cães. É semelhante ao que é chamado de "treinamento de clique" onde um som ou um sinal serve como um marcador de recompensa para indicar que o cão é feito para corrigir a resposta e este marcador informa que um deleite aguardará quando ele retornar ao manipulador ( Clique aqui para mais sobre isso). A segunda parte da sequência de treinamento é consideravelmente menos comum, já que, neste caso, a palavra "Desculpe" é um marcador que diz ao cachorro que ele estava errado e que nenhuma recompensa está chegando desta vez.

Perguntei ao treinador por que ela escolheu usar este "sem marcador de recompensa" e ela disse: "Contar com o cão que é errado simplesmente lhe fornece informações extras e permite que ele abandone todas as respostas sem saída e siga em outros comportamentos que são mais prováveis ​​de ser recompensados. Eu li várias vezes e fui às oficinas em que vários treinadores de cães bem conhecidos alegaram que dizer ao cão quando ele está incorreto, bem como quando ele está fazendo o certo é um método de treinamento mais eficiente ".

A idéia de um marcador de recompensa ao treinar animais foi introduzida pelo psicólogo BF Skinner. Eu tive uma série de oportunidades para falar com ele, pois ele freqüentemente visitava Vancouver porque sua filha estava casada com um membro da faculdade no departamento de história da minha universidade. Em tais visitas, muitas vezes ele deixa o Departamento de Psicologia para visitar com amigos e conhecidos. Em um ponto eu me lembro de perguntar-lhe sobre como treinadores de cães podem usar marcadores. Especificamente, eu queria saber se devíamos estar dizendo a um animal quando ele estava fazendo algo errado e não estava prestes a ser recompensado da mesma forma que lhe dizemos quando ele estava correto e estava prestes a receber sua recompensa.

Ele balançou a cabeça e sorriu. "Toda vez que você recompensa um animal por fazer a coisa correta, você fortalece essa resposta e torna mais provável que ela ocorra novamente. Mas sinalizar para um animal que é errado faz com que esse sinal seja uma espécie de punisher. E a verdade é que os animais querem evitar qualquer coisa associada a qualquer situação em que possam ser punidos. Você faz palavras cruzadas? "Eu assenti. "Bem, a diversão de fazer palavras cruzadas é que, sempre que você conseguir algo certo, você sente como se tivesse sido recompensado. Imagine o que aconteceria se cada vez que você colocasse uma palavra errada ou escrevesse uma carta errada em um quadrado, o quebra-cabeça zumbiu para dizer-lhe que estava errado. Você imagina que o trabalho de palavras cruzadas seria tão divertido quanto um trabalho em que você simplesmente conseguiu puxar até que você tenha a resposta certa sem comentários negativos? Você acha que, voluntariamente, escolheu trabalhar nesse quebra-cabeça que lhe deu esse feedback negativo extra ao invés de optar pelo formato mais tradicional? "

Pensei nisso e cheguei à conclusão de que Skinner provavelmente estava certo. Eu acredito que eu preferiria a situação em que todos os meus comentários só se concentraram em minhas respostas corretas, sem causar problemas sobre meus erros. Se esse for o caso de uma pessoa, não é razoável presumir que os animais que estavam sendo treinados provavelmente se sentiriam da mesma maneira. No entanto, não houve dados reais para sustentar essa conclusão – até agora.

Recebi recentemente uma cópia de uma tese escrita por Naomi Rotenberg, que era uma estudante de mestrado no Hunter College * da Universidade da Cidade de Nova York *. O experimento relatado nesta tese abordou diretamente esta questão. O estudo de Rotenberg foi bastante direto e envolveu 27 cães que estavam sendo treinados para realizar um truque simples (colocar as duas pernas em um aro no chão). Metade dos cães foram ensinados usando apenas um marcador de recompensa, neste caso o som tipicamente usado de um clicker. A outra metade do grupo foi ensinado com um som de clique gratificante, mas, além disso, eles ouviram um tom (apenas o tom que chamamos de "C médio" em um piano) que dizia ao cachorro que cometeu um erro e escolheu o comportamento errado.

A sequência de treinamento envolveu o experimentador emitindo o comando "Hoop" e depois atraindo o cão para fazer a resposta correta, após o que ele ouviu o clique e obteve uma recompensa. O treinamento foi dividido em seis níveis diferentes em que a atração foi gradualmente eliminada. No mais alto nível, o cão simplesmente recebeu o comando verbal e era esperado que ele fizesse o comportamento. Quantos níveis bem-sucedidos que o cão fez durante a sessão de treino foi uma indicação quanto ao quanto o animal havia aprendido. Além disso, a porcentagem de respostas corretas serviu como outra medida da proficiência do cão.

Os resultados foram bastante inequívocos. Os cães que foram recompensados ​​por suas respostas corretas e que simplesmente tiveram suas respostas incorretas ignoradas fizeram consideravelmente melhor. Esses cães aprenderam mais rapidamente e alcançaram um nível de proficiência mais alto do que os cães que receberam a "informação extra" dizendo-lhes quando estavam errados. Durante as sessões de treino, o nível médio de realização para os cães cujos erros foram ignorados foi o nível 4 (de 6), enquanto que para aqueles que foram informados quando estavam errados, bem como quando estavam certos, conseguiram apenas um desempenho médio de nível 1 . Em termos de porcentagem correta, os cães que apenas receberam os marcadores indicando os casos em que fizeram o que foi certo obtiveram uma taxa de resposta correta de 60%, enquanto aqueles cães que também foram informados quando fizeram o erro conseguiram apenas corrigir 27% do tempo. Uma análise estatística mostrou que, em geral, os cães que só foram informados quando estavam corretos eram quase duas vezes mais proficientes no final do treinamento.

Rotenberg resume seus resultados dessa maneira [onde eu estou explicando suas abreviaturas entre colchetes].

Não só [os marcadores não recompensadores que disseram aos cães que estavam errados e nenhum tratamento estava chegando] afetaram significativamente o desempenho dos cães em geral, mas eles levaram muitos cães a falhar muito cedo na sessão de treinamento. Os cães que ouviram um [marcador de não recompensa] seguindo um erro inicial continuaram a cometer erros e nenhum conseguiu progredir para atrair o nível 2. Em contraste, os cães cujos erros iniciais foram ignorados foram capazes de se recuperar e, eventualmente, passar para pelo menos atrair nível 2. Este padrão de resultados empresta credibilidade às afirmações de alguns formadores de que ouvir [marcadores não recompensadores] pode levar certos cães a abandonar o treinamento, em vez de tentar superar seus erros para executar o comportamento corretamente …

Em outras palavras, os cães que estão simplesmente trabalhando para descobrir os comportamentos corretos e são recompensados ​​por esses comportamentos, mantêm-se na tarefa de treinamento e, finalmente, conseguem, enquanto aqueles cães que não são informados apenas quando fizeram a resposta correta, mas também são informados Quando eles fizeram a resposta errada parecem ficar desanimados e desistir de toda a tarefa de aprendizagem.

Stanley Coren é o autor de muitos livros, incluindo: The Wisdom of Dogs; Do Dogs Dream? Nascido para Bark; O Cão Moderno; Por que os cães têm narizes molhados? The Pawprints of History; Como os cães pensam; Como falar cachorro; Por que nós amamos os cães que fazemos; O que os cães sabem? A Inteligência dos Cães; Por que meu cão age assim? Entendendo os cães por manequins; Ladrões de sono; A síndrome do esquerdo

Copyright SC Psychological Enterprises Ltd. Não pode ser reimpresso ou reposto sem permissão

* Dados de: Naomi Rotenberg (2015). Treinar um novo truque usando marcadores sem recompensas: efeitos no desempenho dos cães e comportamentos de estresse. Tese de mestrado, Hunter College, Nova York. CUNY Academic Works. http://academicworks.cuny.edu/hc_sas_etds/12