refactor: use model classes and also refactor original config impleme…

…ntation to use model classes
wetransform-os · Sep 9, 2024 · a79aa2f · a79aa2f
1 parent 26f0185
commit a79aa2f
Show file tree

Hide file tree

Showing 48 changed files with 3,676 additions and 333 deletions.
diff --git a/.gitignore b/.gitignore
@@ -1,3 +1,5 @@
 .DS_Store
 .idea
 .ipynb_checkpoints/
+__pycache__/
+output_files
diff --git a/configuration.json b/configuration.json
@@ -1,5 +1,5 @@
 {
- "input_matrix_path": "toy_example/car_data.csv",
+ "input_matrix_path": "/Users/kapil/workspace/ranking-service/ProMCDA/input_files/toy_example/car_data.csv",
   "polarity_for_each_indicator": ["+","+","-","+","+","+"],
 
   "sensitivity": {
@@ -22,4 +22,4 @@
 
 
   "output_directory_path": "toy_example"
-}
+}
diff --git a/input_files/toy_example/car_data.csv b/input_files/toy_example/car_data.csv
@@ -4,4 +4,4 @@ B,25,4,30000,20,6,5
 C,35,5,20000,10,10,2
 D,40,3,24000,30,7,1
 E,38,1,15000,10,10,3
-F,40,4,28000,15,9,4
+F,40,4,28000,15,9,4
diff --git a/input_files/toy_example/sample-car-data-robustness-on-weights-no-sensitivity.json b/input_files/toy_example/sample-car-data-robustness-on-weights-no-sensitivity.json
@@ -0,0 +1,34 @@
+{
+  "inputMatrix": {
+    "Fuel Efficiency":{"A":30.0,"B":25.0,"C":35.0,"D":40.0,"E":38.0,"F":40.0},
+    "Safety Rating":{"A":5.0,"B":4.0,"C":5.0,"D":3.0,"E":1.0,"F":4.0},
+    "Price":{"A":25000.0,"B":30000.0,"C":20000.0,"D":24000.0,"E":15000.0,"F":28000.0},
+    "Cargo 'Space":{"A":15.0,"B":20.0,"C":10.0,"D":30.0,"E":10.0,"F":15.0},
+    "Acceleration":{"A":8.0,"B":6.0,"C":10.0,"D":7.0,"E":10.0,"F":9.0},
+    "Warranty":{"A":3.0,"B":5.0,"C":2.0,"D":1.0,"E":3.0,"F":4.0}
+  },
+  "weights": [
+    0.8, 0.9, 0.5, 0.5, 0.1, 0.7
+  ],
+  "polarity": [
+    "+","+","-","+","+","+"
+  ],
+  "sensitivity": {
+    "sensitivityOn": "yes",
+    "normalization": "minmax",
+    "aggregation": "weighted_sum"
+  },
+  "robustness": {
+    "robustness": "weights",
+    "onWeightsLevel": "all",
+    "givenWeights": [
+      0.8, 0.9, 0.5, 0.5, 0.1, 0.7
+    ]
+  },
+  "monteCarloSampling": {
+    "monteCarloRuns": 10000,
+    "marginalDistributions": [
+      "normal", "normal", "normal", "normal", "normal", "normal"
+    ]
+  }
+}
diff --git a/input_files/toy_example/sample-car-data.json b/input_files/toy_example/sample-car-data.json
@@ -0,0 +1,34 @@
+{
+  "inputMatrix": {
+    "Fuel Efficiency":{"A":30.0,"B":25.0,"C":35.0,"D":40.0,"E":38.0,"F":40.0},
+    "Safety Rating":{"A":5.0,"B":4.0,"C":5.0,"D":3.0,"E":1.0,"F":4.0},
+    "Price":{"A":25000.0,"B":30000.0,"C":20000.0,"D":24000.0,"E":15000.0,"F":28000.0},
+    "Cargo 'Space":{"A":15.0,"B":20.0,"C":10.0,"D":30.0,"E":10.0,"F":15.0},
+    "Acceleration":{"A":8.0,"B":6.0,"C":10.0,"D":7.0,"E":10.0,"F":9.0},
+    "Warranty":{"A":3.0,"B":5.0,"C":2.0,"D":1.0,"E":3.0,"F":4.0}
+  },
+  "weights": [
+    0.8, 0.9, 0.5, 0.5, 0.1, 0.7
+  ],
+  "polarity": [
+    "+","+","-","+","+","+"
+  ],
+  "sensitivity": {
+    "sensitivityOn": "no",
+    "normalization": "minmax",
+    "aggregation": "weighted_sum"
+  },
+  "robustness": {
+    "robustness": "none",
+    "onWeightsLevel": "none",
+    "givenWeights": [
+      0.8, 0.9, 0.5, 0.5, 0.1, 0.7
+    ]
+  },
+  "monteCarloSampling": {
+    "monteCarloRuns": 10000,
+    "marginalDistributions": [
+      "normal", "normal", "normal", "normal", "normal", "normal"
+    ]
+  }
+}
diff --git a/mcda/configuration/config.py b/mcda/configuration/config.py
@@ -71,7 +71,7 @@ def __init__(self, input_config: dict):
         # keys_of_dict_values = self._keys_of_dict_values
 
         self._validate(input_config, valid_keys, str_values,
-                       int_values, list_values, dict_values)
+                           int_values, list_values, dict_values)
         self._config = copy.deepcopy(input_config)
 
     def _validate(self, input_config, valid_keys, str_values, int_values, list_values, dict_values):

diff --git a/mcda/mcda_ranking_run.py b/mcda/mcda_ranking_run.py
@@ -0,0 +1,170 @@
+#! /usr/bin/env python3
+
+"""
+This script serves as the main entry point for running all pieces of functionality in a consequential way by
+following the settings given in the configuration file 'configuration.json'.
+
+Usage (from root directory):
+    $ python3 -m mcda.mcda_run -c configuration.json
+"""
+
+import time
+from ProMCDA.mcda.utils.application_enums import *
+from ProMCDA.mcda.utils.utils_for_main import *
+from ProMCDA.mcda.utils.utils_for_plotting import *
+from ProMCDA.mcda.utils.utils_for_parallelization import *
+from ProMCDA.models.configuration import Configuration
+
+log = logging.getLogger(__name__)
+
+FORMATTER: str = '%(levelname)s: %(asctime)s - %(name)s - %(message)s'
+logging.basicConfig(stream=sys.stdout, level=logging.DEBUG, format=FORMATTER)
+logger = logging.getLogger("ProMCDA")
+
+# randomly assign seed if not specified as environment variable
+RANDOM_SEED = os.environ.get('random_seed') if os.environ.get('random_seed') else 67
+NUM_CORES = os.environ.get('num_cores') if os.environ.get('num_cores') else 1
+
+
+# noinspection PyTypeChecker
+def main_using_model(input_config: dict) -> dict:
+    """
+    Execute the ProMCDA (Probabilistic Multi-Criteria Decision Analysis) process.
+
+    Parameters:
+    - input_config : Configuration parameters for the ProMCDA process.
+
+    Raises:
+    - ValueError: If there are issues with the input matrix, weights, or indicators.
+
+    This function performs the ProMCDA process based on the provided configuration.
+    It handles various aspects such as the sensitivity analysis and the robustness analysis.
+    The results are saved in output files, and plots are generated to visualize the scores and rankings.
+
+    Note: Ensure that the input matrix, weights, polarities and indicators (with or without uncertainty)
+    are correctly specified in the input configuration.
+
+    :param input_config: dict
+    :return: None
+    """
+    is_robustness_indicators = 0
+    is_robustness_weights = 0
+    f_norm = None
+    f_agg = None
+    marginal_pdf = []
+
+    # Extracting relevant configuration values
+    config = Configuration.from_dict(input_config)
+    input_matrix = pd.DataFrame(config.input_matrix)
+    index_column_name = input_matrix.index.name
+    index_column_values = input_matrix.index.tolist()
+    polar = config.polarity
+    robustness = config.robustness.robustness
+    mc_runs = config.monte_carlo_sampling.monte_carlo_runs
+
+    f_agg, f_norm, is_robustness_indicators, is_robustness_weights, marginal_pdf = verify_input(config, f_agg, f_norm,
+                                                                                                is_robustness_indicators,
+                                                                                                is_robustness_weights,
+                                                                                                marginal_pdf, mc_runs,
+                                                                                                robustness)
+
+    # Check the input matrix for duplicated rows in the alternatives, rescale negative indicator values and
+    # drop the column containing the alternatives
+    input_matrix_no_alternatives = check_input_matrix(input_matrix)
+
+    if is_robustness_indicators == 0:
+        num_indicators = input_matrix_no_alternatives.shape[1]
+        # Process indicators and weights based on input parameters in the configuration
+        polar, weights = get_polar_and_weights(config, input_matrix_no_alternatives, is_robustness_indicators,
+                                               is_robustness_weights, mc_runs, num_indicators, polar)
+        return run_mcda_without_indicator_uncertainty(config, index_column_name, index_column_values,
+                                                      input_matrix_no_alternatives, weights, f_norm, f_agg,
+                                                      is_robustness_weights)
+    else:
+        num_non_exact_and_non_poisson = len(marginal_pdf) - marginal_pdf.count('exact') - marginal_pdf.count('poisson')
+        num_indicators = (input_matrix_no_alternatives.shape[1] - num_non_exact_and_non_poisson)
+        polar, weights = get_polar_and_weights(config, input_matrix_no_alternatives, is_robustness_indicators,
+                                               is_robustness_weights, mc_runs, num_indicators, polar)
+        return run_mcda_with_indicator_uncertainty(config, input_matrix_no_alternatives, index_column_name,
+                                                   index_column_values, mc_runs, RANDOM_SEED,
+                                                   config.sensitivity.sensitivity_on, f_agg, f_norm,
+                                                   weights, polar, marginal_pdf)
+
+
+def get_polar_and_weights(config, input_matrix_no_alternatives, is_robustness_indicators, is_robustness_weights,
+                          mc_runs, num_indicators, polar):
+    # Process indicators and weights based on input parameters in the configuration
+    polar, weights = process_indicators_and_weights(config, input_matrix_no_alternatives, is_robustness_indicators,
+                                                    is_robustness_weights, polar, mc_runs, num_indicators)
+    try:
+        check_indicator_weights_polarities(num_indicators, polar, config)
+    except ValueError as e:
+        logging.error(str(e), stack_info=True)
+        raise
+    return polar, weights
+
+
+def verify_input(config, f_agg, f_norm, is_robustness_indicators, is_robustness_weights, marginal_pdf, mc_runs,
+                 robustness):
+    # Check for sensitivity-related configuration errors
+    if config.sensitivity.sensitivity_on == SensitivityAnalysis.NO.value:
+        f_norm = config.sensitivity.normalization
+        f_agg = config.sensitivity.aggregation
+        check_valid_values(config.sensitivity.normalization, SensitivityNormalization,
+                           'The available normalization functions are: minmax, target, standardized, rank.')
+        check_valid_values(config.sensitivity.aggregation, SensitivityAggregation,
+                           """The available aggregation functions are: weighted_sum, geometric, harmonic, minimum.
+                           Watch the correct spelling in the configuration file.""")
+        logger.info("ProMCDA will only use one pair of norm/agg functions: " + f_norm + '/' + f_agg)
+    else:
+        logger.info("ProMCDA will use a set of different pairs of norm/agg functions")
+
+    # Check for robustness-related configuration errors
+    if robustness == RobustnessAnalysis.NONE.value:
+        logger.info("ProMCDA will without uncertainty on the indicators or weights")
+        logger.info("Read input matrix without uncertainties!")
+    else:
+        check_config_error((config.robustness.robustness == RobustnessAnalysis.NONE.value and
+                            config.robustness.on_weights_level != RobustnessWightLevels.NONE.value),
+                           'Robustness analysis is expected using weights but none is specified! Please clarify.')
+
+        check_config_error((config.robustness.robustness == RobustnessAnalysis.WEIGHTS.value and
+                            config.robustness.on_weights_level == RobustnessWightLevels.NONE.value),
+                           'Robustness analysis is requested on the weights: but on all or single? Please clarify.')
+
+        check_config_error((config.robustness.robustness == RobustnessAnalysis.INDICATORS.value and
+                            config.robustness.on_weights_level != RobustnessWightLevels.NONE.value),
+                           'Robustness analysis is requested: but on weights or indicators? Please clarify.')
+
+        # Check settings for robustness analysis on weights or indicators
+        if config.robustness.robustness == RobustnessAnalysis.WEIGHTS.value and config.robustness.on_weights_level != RobustnessWightLevels.NONE.value:
+            logger.info(f"""ProMCDA will consider uncertainty on the weights.
+            Number of Monte Carlo runs: {mc_runs}
+            logger.info("The random seed used is: {RANDOM_SEED}""")
+            is_robustness_weights = 1
+
+        if config.robustness.robustness == RobustnessAnalysis.INDICATORS.value and config.robustness.on_weights_level == RobustnessWightLevels.NONE.value:
+            logger.info(f"""ProMCDA will consider uncertainty on the indicators. 
+            Number of Monte Carlo runs: {mc_runs}
+            logger.info("The random seed used is: {RANDOM_SEED}""")
+            is_robustness_indicators = 1
+
+        marginal_pdf = config.monte_carlo_sampling.marginal_distributions
+        logger.info("Read input matrix with uncertainty of the indicators!")
+    return f_agg, f_norm, is_robustness_indicators, is_robustness_weights, marginal_pdf
+
+
+def read_matrix_from_file(column_names_list: list[str], file_from_stream) -> {}:
+    result_dict = utils_for_main.read_matrix_from_file(file_from_stream).to_dict()
+    if len(column_names_list) != len(result_dict.keys()):
+        return {"error": "Number of provided column names does not match the CSV columns"}, 400
+    return {col: result_dict[col] for col in column_names_list if col in result_dict}
+
+
+if __name__ == '__main__':
+    t = time.time()
+    config_path = parse_args()
+    input_config = get_config(config_path)
+    main_using_model(input_config)
+    elapsed = time.time() - t
+    logger.info("All calculations finished in seconds {}".format(elapsed))