Actor-Critic-Methoden sind eine beliebte Klasse von Reinforcement-Learning-Algorithmen, die die Vorteile von richtlinienbasierten und wertbasierten Ansätzen kombinieren. Sie verwenden zwei ...