¿Deberían los entrenadores decirles a los perros cuándo su comportamiento es incorrecto?

SC Psychological Enterprises photo
Fuente: SC Psychological Enterprises foto

El Golden Retriever se movió por el piso hacia donde se extendían media docena de objetos con forma de pesa. Cuando el perro se acercó a uno de ellos, el entrenador dijo "¡Sí!" Con voz entusiasta. El perro inmediatamente agarró el artículo y se lo devolvió a cambio de un regalo.

Unos momentos más tarde, el artículo con el aroma del guía había sido devuelto al grupo de otros artículos y colocado en una ubicación diferente. Una vez más, el gran perro amarillo se movió hacia adelante y estaba a punto de levantar otro objeto del suelo, sin embargo, esta vez no era el elemento con el aroma correcto. Al ver esto, el guía anunció "¡Lo siento!" El perro dejó de buscar el artículo incorrecto, miró al entrenador y luego de una manera más bien moderada comenzó a explorar los otros artículos. Finalmente decidió el artículo correcto, lo que desencadenó otro feliz "¡Sí!" Y cuando regresó con él recibió otro regalo.

La primera parte de esta secuencia de entrenamiento es un aspecto bastante común y familiar del entrenamiento del perro. Es similar al llamado "entrenamiento de clicker" donde un sonido o una señal sirve como un marcador de recompensa para indicar que el perro está hecho para corregir la respuesta y este marcador le informa que un convite estará esperando cuando regrese al controlador ( haga clic aquí para obtener más información al respecto). La segunda parte de la secuencia de entrenamiento es considerablemente menos común, ya que en este caso la palabra "Lo siento" es un marcador que le dice al perro que estaba equivocado, y que esta vez no recibirá ninguna recompensa.

Le pregunté al entrenador por qué eligió usar este "marcador de no recompensa" y ella dijo: "Decir al perro que está mal simplemente le proporciona información adicional y le permite abandonar cualquier respuesta sin salida y pasar a otros comportamientos que tienen más probabilidades de ser recompensados. He leído varias veces y asistí a talleres en los que varios entrenadores de perros famosos han afirmado que decirle al perro cuándo es incorrecto y cuándo está haciendo lo correcto es un método más eficiente de entrenamiento ".

La idea de un marcador de recompensa al entrenar animales fue presentada por el psicólogo BF Skinner. Tuve varias oportunidades para hablar con él, ya que a menudo visitaba Vancouver porque su hija estaba casada con un miembro de la facultad en el departamento de historia de mi universidad. En tales visitas solía pasar por el Departamento de Psicología para visitar a amigos y conocidos. En un momento recuerdo que le pregunté cómo los entrenadores de perros podrían usar marcadores. Específicamente, quería saber si deberíamos contarle a un animal cuando estaba haciendo algo mal y no iba a ser recompensado de la misma forma que le decimos cuando estaba en lo correcto y estaba por recibir su recompensa.

Él negó con la cabeza y sonrió. "Cada vez que recompensas a un animal por hacer lo correcto, fortaleces esa respuesta y haces que sea más probable que vuelva a ocurrir. Pero indicarle a un animal que está equivocado hace que esa señal sea una especie de castigo. Y la verdad es que los animales quieren evitar todo lo relacionado con cualquier situación en la que puedan ser castigados. ¿Haces crucigramas? Asentí. "Bueno, la diversión de hacer crucigramas es que cada vez que obtienes algo bien, sientes que has sido recompensado. Imagine lo que sucedería si cada vez que escribe una palabra incorrecta o escribe una letra incorrecta en un cuadrado, el rompecabezas zumba para decirle que estaba equivocado. ¿Te imaginas que trabajar ese crucigrama sería tan divertido como trabajar en uno en el que simplemente tienes que hurgar hasta obtener la respuesta correcta sin ningún comentario negativo? ¿Crees que voluntariamente elegirías trabajar en ese rompecabezas que te dio ese feedback negativo adicional en lugar de optar por el formato más tradicional? "

Lo pensé y llegué a la conclusión de que Skinner probablemente tenía razón. Creo que preferiría la situación en la que todos mis comentarios solo se centraran en mis respuestas correctas sin hacer ningún escándalo por mis errores. Si ese es el caso para una persona, no es razonable suponer que los animales que fueron entrenados probablemente se sentirían de la misma manera. Sin embargo, no hubo datos reales que respalden esa conclusión, hasta ahora.

Recientemente obtuve una copia de una tesis escrita por Naomi Rotenberg, que era una estudiante de maestría en el Hunter College * de la Universidad de la Ciudad de Nueva York. El experimento reportado en esa tesis aborda directamente este problema. El estudio de Rotenberg fue bastante directo e involucró a 27 perros que estaban siendo entrenados para realizar un truco simple (colocar ambas piernas en un aro en el piso). A la mitad de los perros se les enseñó usando solo un marcador de recompensa, en este caso el sonido típico de un clicker. La otra mitad del grupo fue enseñada con un sonido de clicker gratificante, pero además oirían un tono (solo el tono que llamamos "C media" en un piano) que le decía al perro que había cometido un error y había elegido el comportamiento incorrecto

La secuencia de entrenamiento involucró al experimentador emitiendo el comando "Hoop" y luego atrayendo al perro para que hiciera la respuesta correcta, luego de lo cual escuchó el clic y obtuvo una recompensa. El entrenamiento se dividió en seis niveles diferentes en los que el cebo se eliminó gradualmente. En el nivel más alto, el perro simplemente recibió el comando verbal y se esperaba que realizara el comportamiento. El número de niveles de éxito que logró el perro durante la sesión de entrenamiento fue una indicación de cuánto había aprendido el animal. Además, el porcentaje de respuestas correctas sirvió como otra medida del dominio del perro.

Los resultados fueron bastante claros. Los perros que fueron recompensados ​​por sus respuestas correctas y que simplemente ignoraron sus respuestas incorrectas mejoraron considerablemente. Estos perros aprendieron más rápido y alcanzaron un nivel más alto de competencia que los perros que recibieron la "información adicional" diciéndoles cuando estaban equivocados. Durante las sesiones de entrenamiento, el nivel medio de logro para los perros cuyos errores fueron ignorados fue el nivel 4 (de 6), mientras que para aquellos a quienes se les dijo cuándo estaban equivocados y cuando tenían razón solo lograron una mediana del nivel 1 En términos de porcentajes correctos, aquellos perros que solo recibieron los marcadores que indicaban aquellos casos en los que hicieron lo correcto lograron una tasa de respuesta correcta del 60%, mientras que los perros a quienes también se les dijo cuándo hicieron lo incorrecto lograron ser correctos solamente 27% del tiempo. Un análisis estadístico mostró que, en general, los perros a los que solo se les dijo cuándo eran correctos tenían casi el doble de habilidad al final del entrenamiento.

Rotenberg resume sus resultados de esta manera [donde estoy deletreando sus abreviaturas entre corchetes].

No solo [los marcadores que no son de recompensa que les dijeron a los perros que estaban equivocados y que no recibían ningún tratamiento] afectaron significativamente el rendimiento general de los perros, pero llevaron a muchos perros a fallar muy temprano en la sesión de entrenamiento. Los perros que escucharon un [marcador de no recompensa] después de un error temprano continuaron cometiendo errores, y ninguno pudo progresar para atraer al nivel 2. En contraste, los perros cuyos errores iniciales fueron ignorados pudieron recuperarse y eventualmente pasar al menos al señuelo nivel 2. Este patrón de resultados da credibilidad a las afirmaciones de algunos entrenadores de que la audición [marcadores de no recompensa] puede hacer que ciertos perros abandonen el entrenamiento, en lugar de intentar superar sus errores para realizar el comportamiento correctamente …

En otras palabras, los perros que simplemente trabajan para descubrir los comportamientos correctos y son recompensados ​​por esos comportamientos, se mantienen en la tarea de entrenamiento y finalmente tienen éxito, mientras que los perros a los que no solo se les informa cuándo han respondido correctamente, sino también cuando han hecho que la respuesta incorrecta parezca desanimada y abandonen toda la tarea de aprendizaje.

Stanley Coren es el autor de muchos libros, entre ellos: The Wisdom of Dogs; ¿Los perros sueñan? Nacido para ladrar; El perro moderno; ¿Por qué los perros tienen narices mojadas? Las Pawprints de la historia; Cómo piensan los perros Cómo hablar perro; Por qué amamos a los perros que hacemos; ¿Qué saben los perros? La inteligencia de los perros; ¿Por qué mi perro actúa de esa manera? Comprensión de perros para tontos; Ladrones de sueño; El síndrome del zurdo

Copyright SC Psychological Enterprises Ltd. No puede ser reimpreso o reposicionada sin permiso

* Datos de: Naomi Rotenberg (2015). Entrenando un nuevo truco usando marcadores sin recompensa: efectos en el rendimiento de los perros y los comportamientos de estrés. Tesis de maestría, Hunter College, Nueva York. CUNY Academic Works. http://academicworks.cuny.edu/hc_sas_etds/12