Source code for sierra.core.pipeline.stage3.pipeline_stage3

# Copyright 2018 John Harwell, All rights reserved.
#
#  SPDX-License-Identifier: MIT

"""Stage 3 of the experimental pipeline: processing experimental results.

"""

# Core packages
import time
import datetime
import logging
import pathlib

# 3rd party packages
import yaml

# Project packages
from sierra.core.pipeline.stage3.statistics_calculator import BatchExpParallelCalculator
from sierra.core.pipeline.stage3.run_collator import ExperimentalRunParallelCollator
from sierra.core.pipeline.stage3.imagizer import BatchExpParallelImagizer
import sierra.core.variables.batch_criteria as bc
from sierra.core import types, utils


[docs]class PipelineStage3:
    """Processes the results of running a :term:`Batch Experiment`.

    Currently this includes:

    - Generating statistics from results for generating per-experiment graphs
      during stage 4. This can generate :term:`Averaged .csv` files, among
      other statistics.

    - Collating results across experiments for generating inter-experiment
      graphs during stage 4.

    - Generating image files from project metric collection for later use in
      video rendering in stage 4.

    This stage is idempotent.

    """

[docs]    def __init__(self, main_config: dict, cmdopts: types.Cmdopts) -> None:
        self.logger = logging.getLogger(__name__)
        self.main_config = main_config
        self.cmdopts = cmdopts

[docs]    def run(self, criteria: bc.IConcreteBatchCriteria) -> None:
        self._run_statistics(self.main_config, self.cmdopts, criteria)
        self._run_run_collation(self.main_config, self.cmdopts, criteria)

        if self.cmdopts['project_imagizing']:
            intra_HM_path = pathlib.Path(self.cmdopts['project_config_root']) \
                / pathlib.Path('intra-graphs-hm.yaml')

            if utils.path_exists(intra_HM_path):
                self.logger.info(("Loading intra-experiment heatmap config for "
                                  "project '%s'"),
                                 self.cmdopts['project'])
                intra_HM_config = yaml.load(utils.utf8open(intra_HM_path),
                                            yaml.FullLoader)
                self._run_imagizing(self.main_config,
                                    intra_HM_config,
                                    self.cmdopts,
                                    criteria)

            else:
                self.logger.warning("%s does not exist--cannot imagize",
                                    intra_HM_path)

    # Private functions

[docs]    def _run_statistics(self,
                        main_config: dict,
                        cmdopts: types.Cmdopts, criteria:
                        bc.IConcreteBatchCriteria):
        self.logger.info("Generating statistics from experiment outputs in %s...",
                         cmdopts['batch_output_root'])
        start = time.time()
        BatchExpParallelCalculator(main_config, cmdopts)(criteria)
        elapsed = int(time.time() - start)
        sec = datetime.timedelta(seconds=elapsed)
        self.logger.info("Statistics generation complete in %s", str(sec))

[docs]    def _run_run_collation(self,
                           main_config: dict,
                           cmdopts: types.Cmdopts, criteria:
                           bc.IConcreteBatchCriteria):
        if not self.cmdopts['skip_collate']:
            self.logger.info("Collating experiment run outputs into %s...",
                             cmdopts['batch_stat_collate_root'])
            start = time.time()
            ExperimentalRunParallelCollator(main_config, cmdopts)(criteria)
            elapsed = int(time.time() - start)
            sec = datetime.timedelta(seconds=elapsed)
            self.logger.info(
                "Experimental run output collation complete in %s", str(sec))

[docs]    def _run_imagizing(self,
                       main_config: dict,
                       intra_HM_config: dict,
                       cmdopts: types.Cmdopts,
                       criteria: bc.IConcreteBatchCriteria):
        self.logger.info("Imagizing .csvs in %s...",
                         cmdopts['batch_output_root'])
        start = time.time()
        BatchExpParallelImagizer(main_config, cmdopts)(
            intra_HM_config, criteria)
        elapsed = int(time.time() - start)
        sec = datetime.timedelta(seconds=elapsed)
        self.logger.info("Imagizing complete: %s", str(sec))


__api__ = [
    'PipelineStage3'
]