`0f66b70`

probes: route every happy-path return through safe_finalize

Authored by

espadonne 3 weeks ago

Status	File	+	-
M	`src/dlm_sway/probes/adapter_ablation.py`	2	2
M	`src/dlm_sway/probes/adapter_revert.py`	2	2
M	`src/dlm_sway/probes/calibration_drift.py`	2	2
M	`src/dlm_sway/probes/delta_kl.py`	2	2
M	`src/dlm_sway/probes/leakage.py`	2	2
M	`src/dlm_sway/probes/paraphrase_invariance.py`	2	2
M	`src/dlm_sway/probes/preference_flip.py`	3	3
M	`src/dlm_sway/probes/prompt_collapse.py`	2	2
M	`src/dlm_sway/probes/section_internalization.py`	2	2
M	`src/dlm_sway/probes/style_fingerprint.py`	2	2

src/dlm_sway/probes/adapter_ablation.pymodified

  import numpy as np
  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.core.scoring import ScalableDifferentialBackend
  from dlm_sway.probes._divergence import Divergence, divergence
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
          sat_score = 1.0 if ok_sat else 0.3
          score = 0.4 * lin_score + 0.3 * sat_score + 0.3 * over_score
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/adapter_revert.pymodified

  from pydantic import BaseModel, ConfigDict, Field
  from dlm_sway.core.errors import BackendNotAvailableError
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
          score = max(0.0, 1.0 - rate / max(spec.assert_revert_rate_lt, 1e-6))
          score = float(np.clip(score, 0.0, 1.0))
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/calibration_drift.pymodified

  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes._calibration_pack import BUILT_IN_PACK
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
          drift_component = max(0.0, min(1.0, (mean_delta + 1.0) / 1.5))
          score = 0.6 * regress_component + 0.4 * drift_component
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/delta_kl.pymodified

  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes._divergence import Divergence, divergence, js_ln2
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
  from dlm_sway.probes.null_adapter import get_null_stats
              bound = js_ln2() if spec.divergence == "js" else 1.0
              score = min(1.0, raw_mean / bound) if bound > 0.0 else 0.0
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/leakage.pymodified

  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
  PerturbationKind = Literal["typo", "case_flip", "drop_punct"]
          fragility_bonus = min(1.0, max(0.0, mean_fragility / max(spec.min_fragility, 1e-6)))
          score = 0.7 * recall_score + 0.3 * fragility_bonus
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/paraphrase_invariance.pymodified

  from pydantic import BaseModel, ConfigDict, Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
  Intent = Literal["generalize", "memorize", "both"]
          verdict, score, msg = _decide(spec, mean_verb, mean_par, ratio)
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/preference_flip.pymodified

  from pydantic import BaseModel, ConfigDict, Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
                  (ft - base) for base, ft in zip(base_margins, ft_margins, strict=True)
+             )
              verdict = Verdict.WARN
 -            return ProbeResult(
 +            return safe_finalize(
                  name=spec.name,
                  kind=spec.kind,
                  verdict=verdict,
          flip_rate = len(flipped_idx) / len(base_wrong_idx)
          verdict = Verdict.PASS if flip_rate >= spec.assert_flip_rate_gte else Verdict.FAIL
          score = min(1.0, flip_rate / max(spec.assert_flip_rate_gte, 1e-6))
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/prompt_collapse.pymodified

  import numpy as np
  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes._divergence import Divergence, divergence
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
              if half_life is not None
              else "could not fit exponential decay (too flat or non-monotonic)"
+         )
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/section_internalization.pymodified

  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.core.scoring import ScoringBackend
  from dlm_sway.core.sections import Section, SectionKind
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
          passing_frac = passing / len(eligible)
          verdict = Verdict.PASS if passing_frac >= spec.assert_passing_section_frac else Verdict.FAIL
          score = passing_frac
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,

src/dlm_sway/probes/style_fingerprint.pymodified

  from numpy.typing import NDArray
  from pydantic import Field
 -from dlm_sway.core.result import ProbeResult, Verdict
 +from dlm_sway.core.result import ProbeResult, Verdict, safe_finalize
  from dlm_sway.probes.base import Probe, ProbeSpec, RunContext
  _SENTENCE_SPLIT = re.compile(r"(?<=[.!?])\s+")
          verdict = Verdict.PASS if shift >= spec.assert_shift_gte else Verdict.FAIL
          score = float(np.clip((shift + 1.0) / 2.0, 0.0, 1.0))
 -        return ProbeResult(
 +        return safe_finalize(
              name=spec.name,
              kind=spec.kind,
              verdict=verdict,