`evorl.algorithms.contrib.pop_ppo`¶

Module Contents¶

Classes¶

PopPPOWorkflow

API¶

class evorl.algorithms.contrib.pop_ppo.PopPPOWorkflow(env: evorl.envs.Env, agent: evorl.agent.Agent, optimizer: optax.GradientTransformation, evaluator: evorl.evaluators.Evaluator, config: omegaconf.DictConfig)[source]¶

Bases: evorl.algorithms.ppo.PPOWorkflow

classmethod build_from_config(config: omegaconf.DictConfig, enable_multi_devices: bool = False, enable_jit: bool = True) → typing_extensions.Self[source]¶

evaluate(state)[source]¶

learn(state: evorl.types.State) → evorl.types.State[source]¶

classmethod name()[source]¶

setup(key: chex.PRNGKey) → evorl.types.State[source]¶

step(state: evorl.types.State) → tuple[evorl.metrics.MetricBase, evorl.types.State][source]¶