Source code for pmrf.fitting._base

from abc import ABC, abstractmethod
from dataclasses import dataclass
import importlib
import logging
from typing import Any, Sequence

import matplotlib.pyplot as plt
import jax
import json
import skrf
import h5py
import jsonpickle
from skrf import Network
try:
    from mpi4py import MPI
    rank = MPI.COMM_WORLD.Get_rank()
except ImportError:
    rank = 0

from pmrf.models import Model
from pmrf.frequency import Frequency
from pmrf.constants import FeatureT
from pmrf._util import LevelFilteredLogger, iter_submodules, load_class_from_string
from pmrf.frequency import Frequency, MULTIPLIER_DICT
from pmrf.constants import FeatureInputT
from pmrf import extract_features, wrap
from pmrf.network_collection import NetworkCollection

def Fitter(
    name: str,
    *args,
    **kwargs
) -> 'BaseFitter':
    """Fitter factory function.
    
    This allows the creator of a fitter by simply specifying the fitter type and having all arguments forwarded.
    See the relevant fitter classes for detailed documentation.

    Args:
        name (str): The name of the fitter to create, specified as either e.g. 'ScipyMinimize' or 'scipy-minimize'.

    Returns:
        BaseFitter: The concrete fitter instance.
    """
    cls = get_fitter_class(name)
    return cls(*args, **kwargs)
    
@dataclass
class FitSettings:
    frequency: Frequency | None = None
    features: list[FeatureT] | None = None
    fitter_kwargs: dict | None = None
    solver_kwargs: dict | None = None    


[docs]
class BaseFitter(ABC):
    """
    An abstract base class that provides the foundation for all fitting algorithms in `pmrf`.
    """

[docs]
    def __init__(
        self,
        model: Model,
        measured: str | Network | NetworkCollection,
        frequency: Frequency | None = None,
        features: FeatureInputT | None = None,
        output_path: str = 'output',
        output_root: str = 'fit',
        sparam_kind: str = 'both',
    ) -> None:
        """Initializes the BaseFitter.

        Args:
            model (Model):                                              The parametric `pmrf` Model to be fitted.
            measured (skrf.Network | prf.NetworkCollection):            The measured network data to fit the model against.
                                                                        Can be a scikit-rf `Network` or a paramrf `NetworkCollection`.
                                                                        For the latter case the network names should be referenced during
                                                                        feature extraction by specifying features as a dictionary.
                                                                        See the documentation for the `features` argument below.                                                                        
            features (FeatureInputT | None, optional):                  Defines the features to be extracted from the model and network(s).
                                                                        Defaults to `None`, in which case real and imaginary features for all ports are used.
                                                                        Can be a single feature e.g. 's11', a list of features (e.g., `['s11', 's11_mag']`),
                                                                        or a dictionary with either of the above as value. In the dictionary case,
                                                                        keys must be network names in the collection passed by `measured`, which must also
                                                                        correspond to submodels which are attributes of the model. For example,
                                                                        {'name1', ('s11'), {'name2', ('s21')} can be passed.
                                                                        Note that if a collection of networks is passed, but a feature dictionary is not,
                                                                        it is assumed that those feature(s) should be extract for each networks/submodel.
                                                                        See `extract_features(..)` more details.
            frequency (Frequency | None, optional):                     The frequency axis to perform the fit on. Defaults to `None`, in which case
                                                                        the measured frequency is used. Note that if a `NetworkCollection` is passed,
                                                                        all networks must have the same frequency.
            output_path (str | None):                                   The path for fitters to write output data to. Not used by all fitters. Defaults to `None`.
            output_root (str | None):                                   The root name used for output files in the output path. Not used by all fitters. Defaults to `None`.
            sparam_kind (str | None):                                   The S-parameter data kind to use for port-expansion in feature extraction. Can either be 'transmission', 'reflection' or 'both'.
                                                                        See `extract_features` for more details.
        """
        # Set the default features and ensure it is not a scalar
        features = features if features is not None else [port_feature for m, n in model.port_tuples for port_feature in (f's{m+1}{n+1}_re', f's{m+1}{n+1}_im')]
        if not isinstance(features, Sequence) and not isinstance(features, dict):
            features = [features]
        if isinstance(measured, NetworkCollection) and not isinstance(features, dict):
            features = {k: features for k in measured.names()}

        # All frequencies must be the same across all measurements (at least currently..). We copy the input dict
        measured = measured.copy()
        if frequency is not None:
            measured_freq = frequency
            measured = measured.interpolate(frequency)
        else:
            try:
                measured_freq = measured.frequency
            except:
                raise ValueError("All networks must have the same frequency")
        
        # Initialize settings
        self.frequency = frequency or Frequency.from_skrf(measured_freq)
        self.features = features
        self.sparam_kind = sparam_kind
        self.output_path = output_path
        self.output_root = output_root
        
        self.initial_model: Model = model
        self.measured: skrf.Network | NetworkCollection = measured
        self.measured_features = extract_features(measured, None, features, sparam_kind=sparam_kind)
        if rank == 0:
            self.logger = logging.getLogger("pmrf.fitting")
        else:
            self.logger = LevelFilteredLogger(null_level=logging.WARNING)

        self.results: FitResults | None = None

        
    def _settings(self, solver_kwargs=None, fitter_kwargs=None) -> FitSettings:
        return FitSettings(frequency=self.frequency, features=self.features, fitter_kwargs=fitter_kwargs, solver_kwargs=solver_kwargs)
    

[docs]
    @abstractmethod
    def run(self, *args, **kwargs) -> 'FitResults':
        """Executes the fitting algorithm.

        This method must be implemented by all concrete subclasses. It is the
        main entry point to start the optimization or sampling process.

        Returns:
            FitResults: An object containing the results of the fit.
        """
        pass

    
    def _make_feature_function(self, as_numpy=False):
        general_feature_fn = wrap(extract_features, self.initial_model, self.frequency, as_numpy=as_numpy)
        feature_fn = lambda theta: general_feature_fn(theta, self.features, sparam_kind=self.sparam_kind)
        return jax.jit(feature_fn)

    

[docs]
@dataclass
class FitResults:
    measured: skrf.Network | NetworkCollection | None = None
    initial_model: Model | None = None
    fitted_model: Model | None = None
    solver_results: Any = None
    settings: FitSettings | None = None
    fitter: BaseFitter | None = None


[docs]
    def plot_s_db(self, use_initial_model=False):
        """
        Plots the S-parameters (Magnitude in dB) of the Measured vs Fitted data.
        Handles both single Network and dictionary of Networks.
        """
        model = self.initial_model if use_initial_model else self.fitted_model
        
        if self.measured is None or model is None:
            print("Missing measured data or fitted model.")
            return

        if self.settings is None:
            print("Missing settings (frequency data) to generate fitted networks.")
            return

        # 1. Normalize input into a list of tuples: (Name, Measured_Network, Fitted_Network)
        data_to_plot = []
        
        if isinstance(self.measured, NetworkCollection):
            for meas_nw in self.measured:
                # Retrieve the specific sub-model using the key name
                try:
                    sub_model = getattr(model, meas_nw.name)
                    fit_nw = sub_model.to_skrf(self.settings.frequency)
                    data_to_plot.append((meas_nw.name, meas_nw, fit_nw))
                except AttributeError:
                    print(f"Warning: Could not find sub-model attribute '{key}' in fitted_model.")
        else:
            # Single network case
            fit_nw = model.to_skrf(self.settings.frequency)
            data_to_plot.append(("Main Model", self.measured, fit_nw))

        if not data_to_plot:
            return

        # 2. Determine Grid Dimensions
        n_rows = len(data_to_plot)
        
        # We assume the first network is representative of port counts for layout purposes,
        # but we will handle variable ports safely in the loop.
        max_ports = max(d[1].number_of_ports for d in data_to_plot)
        n_cols = max_ports * max_ports
        
        # Create Figure
        # Adjust figsize: approx 4 inches per subplot width, 3.5 inches per row height
        fig, axes = plt.subplots(
            nrows=n_rows, 
            ncols=n_cols, 
            figsize=(4 * n_cols, 3.5 * n_rows), 
            squeeze=False, # Ensures axes is always a 2D array
            # constrained_layout=True
        )

        # 3. Plotting Loop
        for row_idx, (label, meas, fit) in enumerate(data_to_plot):
            n_ports = meas.number_of_ports
            
            # Loop through all S-parameter combinations (S11, S12, S21, S22...)
            # We flatten the port grid (i, j) into the subplot row
            plot_col_idx = 0
            
            for i in range(n_ports):
                for j in range(n_ports):
                    ax = axes[row_idx, plot_col_idx]               
                    
                    # Plot Fitted (Solid line)
                    # Ensure the fitted network has the same ports or handle gracefully
                    if i < fit.number_of_ports and j < fit.number_of_ports:
                        fit.plot_s_db(m=i, n=j, ax=ax, label="Model")

                    # Plot Measured (Dashed line)
                    meas.plot_s_db(m=i, n=j, ax=ax, label="Measured", linestyle='--', color='k')
                    
                    # Visual Polish
                    s_param_label = f"S{i+1}{j+1}"
                    ax.set_title(f"{label} - {s_param_label}")
                    ax.grid(True, which="major", linestyle="-", alpha=0.5)
                    
                    # Only add legend to the first plot of the row to reduce clutter
                    if plot_col_idx == 0:
                        ax.legend(fontsize='small')
                    else:
                        # Clean up redundant legends if scikit-rf adds them automatically
                        ax.get_legend().remove() if ax.get_legend() else None

                    plot_col_idx += 1

            # Hide any unused subplots in this row (if this network has fewer ports than the max)
            for k in range(plot_col_idx, n_cols):
                axes[row_idx, k].axis('off')

        fig.tight_layout()



[docs]
    def encode_solver_results(self, group: h5py.Group):
        data = None
        if self.solver_results is not None:
            try:
                data = jsonpickle.encode(self.solver_results)
            except Exception as e:
                logging.error(f"Failed to encode solver results: {e}")
        group['data'] = data

    

[docs]
    @classmethod
    def decode_solver_results(cls, group: h5py.Group) -> Any:
        if 'data' in group:
            try:
                return jsonpickle.decode(group['data'][()])
            except Exception as e:
                logging.error(f"Failed to decode solver results: {e}")
        return None

    

[docs]
    def save_hdf(self, path: str, metadata: dict | None = None):
        version = 4
        
        with h5py.File(path, 'w') as f:
            # Metadata
            metadata_grp = f.create_group('metadata')
            internal_metadata_grp = metadata_grp.create_group('__pmrf__')
            internal_metadata_grp['fit_results_cls'] = str(self.__class__.__module__ + "." + self.__class__.__qualname__)
            internal_metadata_grp['version'] = version
            if self.solver_results is not None:
                internal_metadata_grp['solver_results_cls'] = self.solver_results.__module__ + "." + self.__class__.__qualname__
            
            if not metadata is None:
                def save_dict_to_group(d: dict, group: h5py.Group):
                    for k, v in d.items():
                        if isinstance(v, dict):
                            subgrp = group.create_group(k)
                            save_dict_to_group(v, subgrp)
                        else:
                            group[k] = json.dumps(v)        
                save_dict_to_group(metadata, metadata_grp)

            # Models
            if self.fitted_model is not None:
                self.fitted_model.write_hdf(f.create_group('fitted_model'))
            if self.initial_model is not None:
                self.initial_model.write_hdf(f.create_group('initial_model'))

            # Measured data
            # TODO save network params
            def write_network(group: h5py.Group, ntwk: skrf.Network):
                group['name'] = ntwk.name or 'network'
                group.create_dataset('s', data=ntwk.s)
                group.create_dataset('f', data=ntwk.f)
                group.create_dataset('z0', data=ntwk.z0)
                if ntwk.params is not None:
                    measured_params_grp = group.create_group('params')
                    for key, value in ntwk.params.items():
                        measured_params_grp[key] = value

            if self.measured is not None:
                measured_grp = f.create_group('measured')
                if isinstance(self.measured, skrf.Network):
                    write_network(measured_grp, self.measured)
                else:
                    for ntwk in self.measured:
                        ntwk_grp = measured_grp.create_group(ntwk.name)
                        write_network(ntwk_grp, ntwk)
                        
            # Solver results
            if self.solver_results is not None:
                solver_results_grp = f.create_group('solver_results')
                self.encode_solver_results(solver_results_grp)                

            # Other input
            ## Setup
            input_grp = f.create_group('settings')                    

            ## Other settings
            if self.settings.frequency is not None:
                frequency_grp = input_grp.create_group('frequency')
                frequency_grp['f'] = self.settings.frequency.f
                frequency_grp['f_scaled'] = self.settings.frequency.f_scaled
                frequency_grp['unit'] = self.settings.frequency.unit
            if self.settings.features is not None:
                input_grp.create_dataset('features', data=json.dumps(self.settings.features))
            if self.settings.fitter_kwargs is not None:
                input_grp.create_dataset('fitter_kwargs', data=jsonpickle.encode(self.settings.fitter_kwargs))            
            if self.settings.solver_kwargs is not None:
                input_grp.create_dataset('solver_kwargs', data=jsonpickle.encode(self.settings.solver_kwargs))            



[docs]
    @classmethod
    def load_hdf(cls, path: str) -> "FitResults":
        with h5py.File(path, 'r') as f:
            # Metadata
            if 'metadata' in f:
                metadata_grp = f['metadata']
                
                if 'fitter' in metadata_grp and 'version' in metadata_grp['fitter']:
                    internal_metadata_grp = metadata_grp['fitter']
                else:
                    internal_metadata_grp = metadata_grp['__pmrf__']
                
                if 'version' in internal_metadata_grp:
                    version = internal_metadata_grp['version'][()]
                else:
                    version = 4 # bug for some
                fit_results_cls_path = internal_metadata_grp['fit_results_cls'][()]
                fit_results_cls_path = fit_results_cls_path.decode('utf-8') if isinstance(fit_results_cls_path, bytes) else fit_results_cls_path
                try:
                    cls = load_class_from_string(fit_results_cls_path)
                except ImportError:
                    logging.warning(f"Could not import class from path '{fit_results_cls_path}'. Using FitResults instead.")            

            # Model fit
            if version == 1:
                fitted_model = Model.read_hdf(f['model']) if 'model' in f else None
            elif version == 2:
                fitted_model = Model.read_hdf(f['fit_model']) if 'fit_model' in f else None
            elif version >= 3:
                fitted_model = Model.read_hdf(f['fitted_model']) if 'fitted_model' in f else None
            
            # Solver results
            solver_results = cls.decode_solver_results(f['solver_results']) if 'solver_results' in f else None

            # Settings
            if version <= 3:
                settings_grp = f['input']
            else:
                settings_grp = f['settings']
                
            if version <= 3:            
                initial_model = Model.read_hdf(settings_grp['model']) if 'model' in settings_grp else None
            else:
                initial_model = Model.read_hdf(f['initial_model']) if 'initial_model' in f else None

            ## Measured networks
            measured = None
            measured_grp = None
            if version <= 3 and 'measured' in settings_grp:
                measured_grp = settings_grp['measured']
            elif 'measured' in f:
                measured_grp = f['measured']

            def group_to_dict(group: h5py.Group):
                result = {}
                for key, item in group.items():
                    if isinstance(item, h5py.Group):
                        result[key] = group_to_dict(item)  # recurse
                    else:  # Dataset
                        result[key] = item[()]  # read dataset into memory
                return result                
            
            def read_network(group: h5py.Group):
                name = group['name'][()]
                name = name.decode('utf-8') if isinstance(name, bytes) else name
                s = group['s'][()]
                f_data = group['f'][()]
                z0 = group['z0'][()]
                if 'params' in group:
                    params = group_to_dict(group['params'])
                else:
                    params = None
                return skrf.Network(s=s, f=f_data, z0=z0, name=name, params=params)
            
            if measured_grp is not None:
                if 's' in measured_grp and 'f' in measured_grp and 'z0' in measured_grp:
                    measured = read_network(measured_grp)
                else:
                    params = group_to_dict(measured_grp['params']) if 'params' in measured_grp else None
                    measured = NetworkCollection(params=params)
                    for label in measured_grp.keys():
                        network = read_network(measured_grp[label])
                        measured.add(network)

            ## Frequency and features
            frequency = None
            features = None
            if 'frequency' in settings_grp:
                freq_grp = settings_grp['frequency']
                unit = freq_grp['unit'][()]
                unit = unit.decode('utf-8') if isinstance(unit, bytes) else unit
                if 'f_scaled' in freq_grp:
                    f_scaled_arr = freq_grp['f_scaled'][()]
                    frequency = Frequency.from_f(f=f_scaled_arr, unit=unit)
                else:
                    f_arr = freq_grp['f'][()]
                    frequency = Frequency.from_f(f_arr / MULTIPLIER_DICT[unit.lower()], unit=unit)
            if 'features' in settings_grp:
                features = json.loads(settings_grp["features"][()])

            ## Solver args, kwargs and fit args, kwargs
            solver_kwargs, fitter_kwargs = None, None
            if 'solver_kwargs' in settings_grp:
                solver_kwargs = jsonpickle.decode(settings_grp['solver_kwargs'][()])
            if 'fitter_kwargs' in settings_grp:
                fitter_kwargs = jsonpickle.decode(settings_grp['fitter_kwargs'][()])
                
            settings = FitSettings(frequency, features, fitter_kwargs, solver_kwargs)
            return cls(
                measured=measured,
                initial_model=initial_model,
                fitted_model=fitted_model,
                solver_results=solver_results,
                settings=settings,
            )


    
def is_frequentist(solver) -> bool:
    from pmrf.fitting._frequentist import FrequentistFitter
    cls = get_fitter_class(solver)
    return issubclass(cls, FrequentistFitter)

def is_bayesian(solver) -> bool:
    from pmrf.fitting._bayesian import BayesianFitter
    cls = get_fitter_class(solver)
    return issubclass(cls, BayesianFitter)

def is_inference_kind(solver, inference: str):
    if inference == 'frequentist':
        return is_frequentist(solver)
    elif inference == 'bayesian':
        return is_bayesian(solver)
    else:
        raise Exception(f"Unknown inference type '{inference}'")

def get_fitter_class(solver: str):
    solver = solver.replace('scipy', 'sciPy')
    solver = solver.replace('polychord', 'polyChord')

    class_names = [solver + 'Fitter']
    class_names.append(''.join(part[0].upper() + part[1:] for part in solver.split('-')) + 'Fitter')
    try:
        for submodule_name, _ in iter_submodules('pmrf.fitting.fitters'):
            try:
                fitter_submodel = importlib.import_module(submodule_name)
            except:
                continue
            for class_name in class_names:
                if hasattr(fitter_submodel, class_name):
                    return getattr(fitter_submodel, class_name)
    except (ImportError, AttributeError):
        raise Exception(f'Could not find solver named {solver}')