`evorl.algorithms.meta.pbt_workflow`¶

Module Contents¶

`PBTEvalMetric`
`PBTOffpolicyTrainMetric`
`PBTOffpolicyWorkflowTemplate`	PBT Workflow Template for Off-policy algorithms with shared replay buffer.
`PBTOptState`
`PBTTrainMetric`
`PBTWorkflowBase`
`PBTWorkflowMetric`
`PBTWorkflowTemplate`	Standard PBT Workflow Template.

class evorl.algorithms.meta.pbt_workflow.PBTEvalMetric[source]¶

class evorl.algorithms.meta.pbt_workflow.PBTOffpolicyTrainMetric[source]¶

class evorl.algorithms.meta.pbt_workflow.PBTOffpolicyWorkflowTemplate(workflow: evorl.workflows.OffPolicyWorkflow, evaluator: evorl.evaluators.Evaluator, config: omegaconf.DictConfig)[source]¶

PBT Workflow Template for Off-policy algorithms with shared replay buffer.

step(state: evorl.types.State) → tuple[evorl.metrics.MetricBase, evorl.types.State][source]¶

class evorl.algorithms.meta.pbt_workflow.PBTOptState[source]¶: Bases: evorl.types.PyTreeData

class evorl.algorithms.meta.pbt_workflow.PBTTrainMetric[source]¶

class evorl.algorithms.meta.pbt_workflow.PBTWorkflowBase(workflow: evorl.workflows.RLWorkflow, evaluator: evorl.evaluators.Evaluator, config: omegaconf.DictConfig)[source]¶

abstract apply_hyperparams_to_workflow_state(workflow_state: evorl.types.State, hyperparams: evorl.types.PyTreeDict[str, chex.Numeric]) → evorl.types.State[source]¶

classmethod build_from_config(config: omegaconf.DictConfig, enable_multi_devices=True, enable_jit: bool = True)[source]¶

abstract exploit_and_explore(pbt_opt_state: evorl.algorithms.meta.pbt_workflow.PBTOptState, pop: chex.ArrayTree, pop_workflow_state: evorl.types.State, pop_metrics: chex.ArrayTree, key: chex.PRNGKey) → tuple[chex.ArrayTree, evorl.types.State, evorl.algorithms.meta.pbt_workflow.PBTOptState][source]¶

step(state: evorl.types.State) → tuple[evorl.metrics.MetricBase, evorl.types.State][source]¶

class evorl.algorithms.meta.pbt_workflow.PBTWorkflowMetric[source]¶

class evorl.algorithms.meta.pbt_workflow.PBTWorkflowTemplate(workflow: evorl.workflows.RLWorkflow, evaluator: evorl.evaluators.Evaluator, config: omegaconf.DictConfig)[source]¶

Standard PBT Workflow Template.

exploit_and_explore(pbt_opt_state: evorl.algorithms.meta.pbt_workflow.PBTOptState, pop: chex.ArrayTree, pop_workflow_state: evorl.types.State, pop_metrics: chex.ArrayTree, key: chex.PRNGKey) → tuple[chex.ArrayTree, evorl.types.State, evorl.algorithms.meta.pbt_workflow.PBTOptState][source]¶