Eine sehr, sehr basale Demo zur Darstellung des Grundprinzips von Reinforcement Learning. Die App lässt einen “Roboter” einen Pfad zum Ziel lernen, indem in einem Koordinatensystem Felder mit Gewichten versehen werden, die bedeuten, wie hilfreich ein Weg zum Finden des Ziels war.
Sollte die Darstellung nicht richtig funktionieren, kann das Skript auch hier gefunden werden.