Pawlow und Skinner - klassische und operante Konditionierung

Pawlow und Skinner sind zwei der wichtigsten Begründer der Lerntheorie des Konditionierens. Damit wird der Vorgang beschrieben, wie ein Lebewesen Verknüpfungen anstellt und über diese Verknüpfungen schliesslich lernt, Verhalten zu zeigen oder eben nicht. Um zu verstehen, wie der Clicker funktioniert und sich eine Meinung darüber bilden zu können, ob man den Clicker gut oder schlecht findet, sollte man die beiden Theorien, die klassische und die operante Konditionierung, zumindest im Ansatz verstanden haben. Deshalb hier ein kleiner, kurzgefasster Exkurs in die Lerntheorie.


Iwan P. Pawlow hat zu Beginn des 20. Jahrhunderts die Theorie der klassischen Konditionierung formuliert und damit den Grundstein für die bis heute wichtigen behaviouristischen Lerntheorien gelegt. Bekannt ist das Experiment an den so genannten „Pawlowschen Hunden“, die über die klassische Konditionierung dazu kamen, bei einem Glockenton zu sabbern, weil dieser Ton zuvor jedes Mal erklang, wenn die Hunde gefüttert wurden.


Diese Art der Konditionierung, die Pawlow entdeckt hat, wird klassische Konditionierung genannt. Der Lerneffekt bei der klassischen Konditionierung ist kein bewusster, das bedeutet, dass Pawlows Hunde ihr Verhalten, also das Sabbern, nicht selber beeinflusst und an die Situation angepasst haben. Vielmehr wird dieses Verhalten (das Sabbern) von einem äusseren Reiz (dem Futter) ausgelöst und dann mit einem neutralen Reiz (dem Glockenton) verbunden, so dass dieser Reiz schliesslich das gleiche Verhalten auslöst und zu einem konditionierten Reiz wird. Es ist vielleicht deutlicher, wenn man in diesem Zusammenhang nicht von Verhalten, sondern von Reaktion spricht.


In der Theorie sieht das so aus:
1. unbedingter Reiz löst unbedingte ("natürliche") Reaktion aus
2. unbedingter Reiz + neutraler Reiz löst unbedingte Reaktion aus, neutraler Reiz wird bei genügend Wiederholungen zum bedingten ("konditionierten") Reiz, unbedingte Reaktion wird zur bedingten ("konditionierten") Reaktion, diese kann leicht abweichen von der unbedingten, "natürlichen" Reaktion
3. bedingter Reiz löst bedingte Reaktion aus


Und in der Praxis:
1. Fleischstück löst Sabbern aus
2. Fleischstück + Glockenton löst Sabbern aus
3. Glockenton löst Sabbern aus

Die Verknüpfung vom Clicker zum Goodie erfolgt über klassische Konditionierung, indem der Klickton mittels unmittelbar folgender Belohnung zu einem konditionierten Reiz wird, dem Hund also etwas sagt (nämlich, dass jetzt eine Belohnung folgt). Im Gegensatz zum Experiment mit Pawlows Hunden wird beim Clickern die Belohnung aber nie weggelassen, da sich die Funktion des Clickers dann relativ schnell wieder verlieren würde.

Mitte des 20. Jahrhunderts hat der amerikanische Psychologe Burrhus F. Skinner diese Theorie des klassischen Konditionierens weiter entwickelt zum instrumentellen, oder auch operanten Konditionieren. Diese Theorie beruht nun auf aktivem Lernen, also darauf, dass der Hund sein Verhalten bewusst wählt und anpasst, je nachdem, welche Reaktion er auf sein Verhalten bekommen hat.


Dabei geht man davon aus, dass der Hund schlussendlich irgendwie einen angenehmen Zustand herbeiführen will, in dem er entweder a) direkt etwas Gutes bekommt (zB Goodies) oder b) etwas Schlechtem entgeht (zB Schmerzen). Gelingt ihm eines von beidem, wird er das Verhalten, das zu diesem guten Zustand geführt hat, immer häufiger zeigen. Das nennt man Verstärkung. Führt ein Verhalten hingegen dazu, dass der Hund eine negative Konsequenz darauf erfährt, nämlich entweder c) etwas Schlechtes bekommt (zB Schläge) oder d) etwas Gutem entgeht (zB der Aufmerksamkeit des Menschen), wird er es nicht mehr zeigen, man nennt diesen Vorgang Bestrafung.

Hier stehen nun die schwierigen und oft missverstandenen Begriffe wie "positive Bestrafung". Es ist wichtig, zu verstehen, dass es sich dabei um wissenschaftliche Begriffe handelt, die man nicht emotional interpretieren darf. Positiv heisst also nicht prinzipiell gut, sondern nur, dass etwas direkt zugeführt wird (Goodies oder Schläge), und negativ nicht prinzipiell schlecht, sondern dass etwas weggenommen wird (Schmerzen oder Aufmerksamkeit).

Daraus ergibt sich:

Verstärkung (Herbeiführung eines guten Zustandes als Konsequenz auf ein Verhalten) durch entweder
a) Gutes bekommen (Goodies) = positive Verstärkung

oder
b) Schlechtem entgehen (Schmerzen) = negative Verstärkung


Bestrafung (schlechter Zustand als Konsequenz auf ein Verhalten) durch entweder
c) Schlechtes bekommen (Schläge) = positive Bestrafung

oder
d) Gutem entgehen (Aufmerksamkeit) = negative Bestrafung

Der Clicker gehört zu a), denn er ist ja nicht anders, als wenn man mit Goodies belohnen würde (was man ja im Anschluss an den Click auch macht), nur dass über die klassische Konditionierung eben der Click als gut bewertet wird.

 

Kommentar schreiben

Kommentare: 6
  • #1

    Samer (Donnerstag, 19 Juli 2012 00:48)

    THX for info

  • #2

    Centrifugal Juicer (Donnerstag, 11 April 2013 22:19)

    I just shared this upon Myspace! My friends will definitely like it!

  • #3

    hkin (Samstag, 08 April 2017 10:51)

    gggg

  • #4

    der imperator (Samstag, 08 April 2017 10:53)

    ich werde euch alle finden und ich werde euch alle töten
    muhahahahahahahahahahahahahahahhahahahahahahahahahahahahahahahahahhahaahahahahahahahahahahahahahahahahahhhahahahaahahahhhahhaahahahhaahaahahahahahahhahahahahahaahahahahhahahaahahahahahahhaahahahahahahahahahh

  • #5

    gott (Samstag, 08 April 2017 11:04)

    ich mag züge

  • #6

    ich (Samstag, 08 April 2017 12:03)

    ich werde euch alle verbal vernichten wen ihr meine allmächtigkeit noch einmal in frage stellt