AulaPro verwendet Cookies, um seinen Benutzern ein besseres Erlebnis zu bieten. Sie können weitere Informationen erhalten hier, oder klicken Sie einfach auf "Ich akzeptiere" oder außerhalb dieses Hinweises, um weiter zu surfen.
Der virtuelle Kurs "Prediction and Control with Approximation of Functions - Virtual Course - Coursera", ist ein Kurs mit unterschiedlichen Inhalten und bietet Videoklassen von . Erkunden Sie die wesentlichen Funktionen und klicken Sie auf die orangefarbene Schaltfläche, um detaillierte Informationen zur E-Learning-Plattform von Coursera zu erhalten.
In diesem Kurs lernen Sie, Probleme mit großen, hochdimensionalen und potenziell unendlichen Zustandsräumen zu lösen. Sie werden sehen, dass die Wertfunktionsschätzung in ein überwachtes Lernproblem (Funktionsnäherung) umgewandelt werden kann, wodurch Sie Agenten erstellen können, die Generalisierung und Unterscheidung sorgfältig ausbalancieren, um die Auszahlung zu maximieren. Wir beginnen diese Reise mit der Untersuchung, wie unsere Bewertung von Richtlinien oder Vorhersagemethoden wie Monte Carlo und TD auf die Approximationskonfiguration von Funktionen erweitert werden kann. Sie lernen Techniken zur Feature-Konstruktion für RL und Repräsentationslernen durch neuronale Netze und Backprop kennen. Wir schließen diesen Kurs mit einem tiefen Einblick in die Policy-Gradient-Methoden ab; eine Möglichkeit, Richtlinien direkt zu lernen, ohne eine Wertfunktion zu lernen. In diesem Kurs lösen Sie zwei kontinuierliche Zustandskontrollaufgaben und untersuchen die Vorteile von Policy-Gradient-Methoden in einer kontinuierlichen Aktionsumgebung. Voraussetzungen: Dieser Kurs baut stark auf den Grundlagen der Kurse 1 und 2 auf und die Teilnehmer müssen diese vor Beginn dieses Kurses abgeschlossen haben. Die Schüler sollten auch mit Wahrscheinlichkeiten und Erwartungen, grundlegender linearer Algebra, grundlegender Analysis, Python 3.0 (mindestens 1 Jahr) und der Implementierung von Algorithmen aus Pseudocode vertraut sein. Am Ende dieses Kurses werden Sie in der Lage sein: -Verstehen, wie Ansätze des überwachten Lernens zur Approximation von Wertfunktionen verwendet werden -Ziele für die Vorhersage (Wertschätzung) unter Funktionsapproximation verstehen -TD mit Funktionsapproximation (Zustandsaggregation) implementieren,
Bereiten Sie sich von zu Hause aus mit den renommiertesten Universitäten der Welt vor.
Die Qualität der Coursera-Kurse wird von seinen Dozenten unterstützt, die oft promovierte Dekane sind.
Mehr als 85 % der Coursera-Studenten berichten von Karrierevorteilen wie Beförderungen oder Gehaltserhöhungen.
Millionen von Studenten auf der ganzen Welt erreichen ihre persönlichen und beruflichen Ziele mit Coursera.
Coursera bietet Kurse von über 200 führenden Universitäten und Unternehmen an, um Online-Lernen auf der ganzen Welt anzubieten. Mit einem Coursera Plus-Abonnement, Sie erhalten unbegrenzten Zugriff auf über 90 % aller Kurse und die beliebtesten beruflichen Zertifikate und Spezialisierungen auf Coursera.
Data Science, Geschäfts- und Persönlichkeitsentwicklung. Sie können sich für mehrere Kurse gleichzeitig anmelden, unbegrenzt viele Zertifikate erwerben und sich gefragte berufliche Fähigkeiten aneignen, um Karrieren zu beginnen, zu wachsen und sogar zu wechseln.
ENTDECKEN SIE, WIE SIE DAS MEISTE ERHALTEN UND ÜBER 500 USD SPAREN MIT EINEM JAHRESABONNEMENT VON COURSERA PLUS*
*Sie sparen bis zu 500 USD in 12 Monaten, wenn Sie mit der Aktion von 59 USD für ein monatliches Abonnement zu einem Jahresabonnement wechseln. Das normale Jahresabonnement beträgt 399 USD. Mit der Aktion zahlen Sie nur 299 USD. Erfahren Sie alles, indem Sie auf den gelben Button klicken.
Hallo, wie kann ich Ihnen helfen? Interessieren Sie sich für einen Kurs? Zu welchem Thema?
AulaPro verwendet Cookies, um seinen Benutzern ein besseres Erlebnis zu bieten. Sie können weitere Informationen erhalten hier, oder klicken Sie einfach auf "Ich akzeptiere" oder außerhalb dieses Hinweises, um weiter zu surfen.
Eine Bewertung hinzufügen