Yabasta siberian husky: Belöning

Visar inlägg med etikett Belöning. Visa alla inlägg

söndag 12 juni 2011

Positivt och negativt

Det finns fyra grunder som ingår i all hundträning oavsett metod. Positiv förstärkning, negativ förstärkning, positivt straff och negativt straff. Jag har hört de här begreppen återkomma på föreläsningar den senaste tiden, när man diskuterar hundträning. Varenda gång blir det missförstånd! Det ställer till det att man pratar om positivt och negativt. Därför ska jag försöka få rätsida på begreppen nu.

Positiv förstärkning: Med positiv menar man att man lägger till någonting. Som plus i matematiken alltså. Förstärkning innebär någon form av belöning som hunden uppskattar. Positiv förstärkning betyder alltså att man ger hunden en belöning.

Negativ förstärkning: Med negativ menar man, i det här fallet, att man tar bort någonting. Som minus i matematiken. Negativ förstärkning innebär alltså att man tar bort en belöning från hunden. I praktiken handlar det om att låta bli att ge hunden en belöning som den förväntat sig.

Positivt straff: Kanske är det begreppet positivt straff som blir allra mest missförstått. Positivt betyder nämligen att man lägger till någonting. Att lägga till ett straff innebär att man bestraffar hunden. Det behöver inte nödvändigtvis vara att man slår hunden. Att rycka i kopplet, hålla ihop munnen på hunden eller tillföra annat obehag är ett positivt straff.

Negativt straff: Det kan tyckas att negativt straff borde betyda att man bestraffar hunden. Men det betyder att man tar bort ett straff. Hunden slipper på så sätt undan en bestraffning när man jobbar med negativt straff.

Alla dessa fyra sätt förekommer inom hundträning, i olika kombinationer. Det allra vanligaste är faktiskt inte, som man kanske tror, att använda sig antingen av straff eller belöning. Nej det allra vanligaste är att använda sig av positiv förstärkning och positivt straff!

Tänk er träning av linförighet. Man går med hunden vid sidan och har kort koppel. Om hunden går för långt bort, stramas kopplet åt och blir obehagligt. Om hunden kommer närmare får den belöning för sin fina position. Positivt straff och positiv förstärkning förenas i träningen!

Inom shapingen jobbar man enbart med positiv och negativ förstärkning. Vid rätt beteende blir hunden belönad och vid fel beteende blir den utan. Det är en förutsättning för att shapingen ska fungera, att man jobbar på detta sätt! Shapingen förutsätter nämligen att hunden vågar prova sig fram, vågar ta initiativ och vågar utveckla nya beteenden med vår belöning som stöd.

En hund som tränas med positivt straff, alltså att fel beteende leder till någon form av obehag, kommer - oavsett hur duktig tränaren är - att få en hämmad initiativförmåga. Tänk själv. Du kan få en fin belöning för rätt beteende men du kan också få ett obehag för fel beteende. Vilket skulle du välja? Prova dig fram, med risk för att få obehag? Eller försöka undvika att prova dig fram för att slippa obehaget? Det krävs en riktigt bra belöning, och att obehaget är väldigt begränsat, för att du ska våga testa dig fram.

Detta innebär att hundar som tränas med positivt straff (får obehag för fel beteende) kommer att försöka undvika att göra fel, snarare än att jobba för att göra rätt! Vi får en hund som medvetet försöker fly obehaget. Flykten i ovanstående linförighetsträning gör hunden genom att hålla sig tätt intill matte. Åtminstone fram till klass två där kopplet ska tas av. När kopplet åker av finns även möjligheten att hunden rent fysiskt faktiskt börjar fly från matte.

Det är detta som är negativt straff. Hunden jobbar för att försöka undvika straff. Belöningen blir att slippa obehaget. Men även här finns en risk. När hunden sluppit obehaget (=gjort rätt) tillräckligt länge, kommer den att börja ta sig friheter. Obehaget är ju orsaken till att hunden går nära sin förare. Om det är länge sedan hunden fått obehag, kommer den börja våga riskera mer. Den börjar glida ur position. Det är nämligen så enkelt att negativt straff, att hunden slipper obehag, kräver att hunden ibland straffas! Annars kommer det inte fungera i längden. Man måste påminna hunden om att den faktiskt jobbar för att undvika obehaget.

Att jobba med positiv förstärkning är alltså egentligen rätt så meningslöst om man samtidigt jobbar med att ge hunden obehag. Godisen kommer inte vara lika mycket värt, som att slippa obehaget. Oavsett vilket så kommer vi få en passiv och undvikande hund. Det kanske fungerar på hundar som är extremt lätta att motivera eller extremt förarberoende, under förutsättning att obehagen är relativt små. Men för de allra flesta hundar tar det bort, inte arbetsviljan, men arbetsglädjen. Vi får en hund som gör det den måste men ingenting mer.

fredag 10 juni 2011

Hundar som tröttnar

Jag har flera gånger på senaste stött på vänner som kört fast med sina hundar för att hundarna tröttnar. För de allra flesta hundar är det inte naturligt att göra samma sak om och om igen. När det kommer till naturliga behov och berikning ligger det givetvis en del jobb i det. En fri hund skulle säkert jobba länge och uttåligt för att hitta ett sätt att få tag på en hare i skogen. Men när den väl hittar ett sätt som fungerar är ju målet uppnått och den kommer inte att förbättra sin jaktförmåga mer.

Annat är det på träning. När hunden hoppar ett hinder och får sin belöning - ja, varför ska den då hoppa igen? Hunden vill säkert ha mer godis och hoppar några gånger till. Men förr eller senare kommer den att bli mätt och/eller tröttna. Det är här vi kör fast. Lösningen för de allra flesta hundar tror jag ligger i belöningen.

Om belöningen är riktigt sjukt bra, kommer belöningskänslan att överföras till hoppet. Hunden kommer alltså att uppfatta hoppet i sig som en belöning! För många agilityhundar är detta ett ständigt dilemma. Att låta hunden jobba vidare på banan, trots att den slarvat med till exempel ett kontaktfält, kan mycket väl fungera som en belöning för det slarviga beteendet! Att beteendet i sig blir lika värdefullt för hunden som själva belöningen, är ett av de stora målen jag har i träningen, och grunden i att kunna få en riktigt bra uthållighet på lydnadsplanen.

Men här finns ett dilemma. Om vi belönar med mörad oxfilé varenda hopp, då riskerar vi att den mörade oxfilén blir en tråkig belöning. Den blir dels för lätt att uppnå när beteendet aldrig behöver utvecklas vidare, och dels blir den uttjatad då den matas gång på gång. Hur kommer vi runt detta problemet?

Jag läste eller hörde någon som jämförde belöningar med trisslotter. Om det var tjugofem kronors vinst på varenda lott skulle ingen köpa trisslotter. Nej, det är överraskningsmomentet i sig som är anledningen att miljontals lotter säljs varje år, och dessutom ger vinst till ägarna! Tjusningen med överraskningen är så stor att människor kan köpa hundratals lotter med bara någon enstaka tjugofemkronorsvinst och ändå fortsätta att köpa dem.

Kan trisslotterna hjälpa våra hundar att bli uthålligare i sitt arbete och inte tröttna? Självklart! Att variera belöningarnas kvalitet, intensitet och mängd, bygger upp en riktig trisslottspänning för våra hundar. De vet att de kan få en riktig jackpot - om inte den här gången så kanske nästa? Hundar med trisslottkänsla kan upprepa samma beteende, precis som trisslottentusiaster, otaliga gånger för att kanske en gång kommer den där extra jackpoten!

Eva Marie Wergård berättade på en föreläsning om belöningstester på möss. Jag försöker grubbla och komma ihåg exakt hur det gick till, men kan inte minnas. Eva Marie - om du läser detta får du gärna komplettera! Det var i allafall ungefär såhär: Man lät möss springa en liten sträcka fram till en belöning. Några av mössen fick bra belöning hela tiden. Några fick först dålig, sedan bra och sedan dålig igen. Det visade sig att mössen med sämre belöning sprang snabbare och mer intensivt än de som fick bra belöning hela tiden. De fick en smakbit på att det kunde bli bra belöning och sprang snabbare även vid sämre belöning. Trisslottsfenomenet.

Så finns det givetvis hundar som kan upprepa samma beteende gång på gång utan att tröttna. Det kan verka som att de är extra lättränade och visst är så fallet! Men det beror garanterat inte på att de har någon magisk extrakraft. Antingen är beteendet i sig redan självförstärkande. Som att be en draghund att dra. Det är sällan någon som ger korv till en draghund; att få komma framåt är den bästa belöningen. Eller så har beteendet blivit förknippat med någon slags belöning och därför blivit väldigt starkt i sig. Någonting att sträva efter alltså!

Jag har börjat en utmaning för mig själv (och kanske er?). Den heter 100 belöningar. Jag ska samla hundra olika sätt att belöna våra hundar! Men det räcker inte med det. Det ska vara belöningar som hundar kan tänkas vara villiga att arbeta hårt för! Jag kommer samla alla belöningar som jag har i min skalle och fundera ut ännu fler, men om du själv har något riktigt bra belöningssätt i bakfickan är du varmt välkommen att skicka det tillsammans med en bild så lägger jag det till listan!!

måndag 2 maj 2011

Belöning och rutiner

Jag har fått massor fina tips om hur vi kan jobba vidare med Divas sök, av Hedvig, Josefin och Mia! Beröring, tjänstetecken och verbal peppning är alla jättefina tips. Igår testade vi att hålla Diva på ett speciellt sätt vid sökstarten och efter fyra skick sprang hon självmant rakt ut för att söka, utan hörselhjälp! Jag tror nog att vi även kommer att koppla på ett verbalt kommando, då det tyvärr är väldigt lätt att missbruka ett beröringsmönster - när man väl börjat använda det i en situation halkar det även lätt med in i den allmänna beröringen. Beröring i kombination med situation och ett speciellt verbalt kommando tror jag kan nå långt.

Jag skulle gärna använda tjänstetecken också, speciellt som vi förhoppningsvis kommer börja söka alltmer ute i skogen framöver. Tyvärr är Diva inte alls speciellt förtjust i att ha "kläder" på sig. När vi först klär på henne, går hon tokbananas i trädgården men sedan när vi börjar arbeta så går det bra. Av den anledningen vill jag avvakta lite med att sätta på tjänstetecken just nu, till hon förstår att hon ska arbeta och inte bara får tokfnatt!

Så har jag också bollat friskt med instruktör-Mia kring detta med belöning. När vi spårade mycket förra året, kände jag att det var svårt att få till en riktigt bra belöning. Detsamma gäller söket. Det är otroligt viktigt att belöningen har en hög kvalitet och blir riktigt bra för att motivera Diva att jobba intensivt - och sist men inte minst för att hålla henne i arbete så hon inte får för sig att rymma och jaga eller annat roligare...

Först och främst tror jag att det kan vara värdefullt att belöningen varierar. Hellre blanda bra belöningar med några halvbra, än konstant använda samma belöningar bara för att de är de bästa. Så finns det ju flera saker som jag tror Diva kan tända till på. För det första har vi sett att Diva tänder på att någon springer iväg. Hittills har vi använt det som hörselretning för att locka fram ett sökarbete, men i framtiden kan det istället bli en belöning där Diva får jaga figuranten efter att hon hittat den.

För det andra blev det lite konstigt när figuranterna skulle mata Diva. Det är ju lite speciellt att mata en blind hund, hon söker ju inte själv handen om man inte på något sätt talar om för henne att man har godis i den. Detta kan ta udden av belöningen litegrann. Därför ska vi basera belöningen mer på små burkar som antingen luktar eller låter och som Diva själv kan söka. I burkarna kan vi ha till exempel mjuk ost eller leverpastej som en doftande godbit där hon får slicka upp mumset eller lite skramlande godisbitar inuti där man kan skaka på burken och hon får lyssna sig fram till belöningen. Jag har faktiskt också ett par små leksaker där man stoppar in godis som hunden sedan får lirka ut.

Jag ska också se på möjligheten att släpa en godisleksak längs marken så hon får jaga efter den. Det kräver att den låter en del men ska nog gå att ordna :) Sen finns ju, för den figurant som gillar att leka, också möjligheten både att kampa med trasa eller skinn eller att kasta våran fina gummiboll med bjällra i, som Diva älskar!

Ja det är spännande detta med sök! Det får mig att tänka i vidare banor och de här lärdomarna kommer säkerligen ge effekter även i annan träning. Till exempel i Issens träning där jag slarvat och bara använt "lättlekta" leksaker och inte minst i Gunnes träning där vi redan fått jobba hårt för att få fram värdefulla belöningar!

Ps. Du får jättegärna komma med tankar, frågor, idéer och förslag! Enklast är att kommentera som "Namn/webadress". Det kan krångla på första försöket men brukar gå på andra!