`8eba0b9`

Close vllm export proof gaps

Authored by

espadonne 2 weeks ago

SHA: 8eba0b91b20bc993f051d7ae68634411b188a81d
Parents: c6f6b00
Tree: 266f4d4

4 changed files

Status	File	+	-
M	`src/dlm/cli/commands.py`	4	4
M	`tests/integration/export/_runtime_smoke.py`	29	0
A	`tests/integration/export/test_vllm_smoke.py`	62	0
M	`tests/unit/export/targets/test_vllm_argv.py`	29	0

src/dlm/cli/commands.pymodified

      if resolved_target.name == "vllm" and export_dispatch.accepts_audio:
          console.print(
              "[red]export:[/red] --target vllm is not wired for audio-language "
 -            "documents yet; this Sprint 41 slice only supports text bases."
 +            "documents yet; the current vllm export path only supports text bases."
+         )
          raise typer.Exit(code=2)
      if resolved_target.name == "mlx-serve" and export_dispatch.accepts_audio:
          console.print(
              "[red]export:[/red] --target mlx-serve is not wired for audio-language "
 -            "documents yet; this Sprint 41 slice only supports text bases."
 +            "documents yet; the current mlx-serve export path only supports text bases."
+         )
          raise typer.Exit(code=2)
      if export_dispatch.accepts_audio:
      if resolved_target.name == "vllm" and export_dispatch.accepts_images:
          console.print(
              "[red]export:[/red] --target vllm is not wired for vision-language "
 -            "documents yet; this Sprint 41 slice only supports text bases."
 +            "documents yet; the current vllm export path only supports text bases."
+         )
          raise typer.Exit(code=2)
      if resolved_target.name == "mlx-serve" and export_dispatch.accepts_images:
          console.print(
              "[red]export:[/red] --target mlx-serve is not wired for vision-language "
 -            "documents yet; this Sprint 41 slice only supports text bases."
 +            "documents yet; the current mlx-serve export path only supports text bases."
+         )
          raise typer.Exit(code=2)
      if export_dispatch.accepts_images:

tests/integration/export/_runtime_smoke.pymodified

  from __future__ import annotations
 +import importlib.util
  import os
 +import platform
 +import shutil
  import socket
 +import sys
  from collections.abc import Iterator
  from contextlib import contextmanager
  from pathlib import Path
      return (vendor_root / "build" / "bin" / "llama-server").is_file()
 +def require_safe_vllm_smoke_host() -> None:
 +    """Skip when the host/runtime combo is not safe for live vLLM smoke."""
 +    reason = vllm_smoke_skip_reason()
 +    if reason is not None:
 +        pytest.skip(reason)
++
++
 +def vllm_smoke_skip_reason() -> str | None:
 +    """Return the skip reason for live vLLM smoke, or None when allowed."""
 +    if shutil.which("vllm") is None:
 +        return "vllm CLI not on PATH."
 +    if importlib.util.find_spec("vllm") is None:
 +        return "vllm Python package not importable."
 +    if (
 +        os.environ.get("DLM_RUN_VLLM_SMOKE") != "1"
 +        and sys.platform == "darwin"
 +        and platform.machine() == "arm64"
 +    ):
 +        return (
 +            "vllm-metal smoke requires DLM_RUN_VLLM_SMOKE=1 on Apple Silicon; "
 +            "engine init can otherwise trigger host-wide memory pressure."
 +        )
 +    return None
++
++
  @contextmanager
  def cleared_offline_env() -> Iterator[None]:
      """Temporarily clear the offline HF env so cached snapshots can resolve."""

tests/integration/export/test_vllm_smoke.pyadded

 +"""Live `vllm` export smoke using the Sprint 14.5 trained store."""
++
 +from __future__ import annotations
++
 +import os
 +from typing import TYPE_CHECKING
++
 +import pytest
 +from typer.testing import CliRunner
++
 +from tests.integration.export._runtime_smoke import (
 +    cleared_offline_env,
 +    require_loopback_bind,
 +    vllm_smoke_skip_reason,
 +)
++
 +if TYPE_CHECKING:
 +    from tests.fixtures.trained_store import TrainedStoreHandle
++
 +_VLLM_SKIP_REASON = vllm_smoke_skip_reason()
++
 +pytestmark = [
 +    pytest.mark.slow,
 +    pytest.mark.skipif(_VLLM_SKIP_REASON is not None, reason=_VLLM_SKIP_REASON or ""),
 +]
++
++
 +@pytest.mark.slow
 +def test_export_target_vllm_smokes_live(trained_store: TrainedStoreHandle) -> None:
 +    require_loopback_bind()
++
 +    from dlm.cli.app import app
 +    from dlm.export.manifest import load_export_manifest
 +    from dlm.store.manifest import load_manifest
++
 +    os.environ["DLM_HOME"] = str(trained_store.home)
++
 +    with cleared_offline_env():
 +        runner = CliRunner()
 +        result = runner.invoke(
 +            app,
 +            [
 +                "export",
 +                str(trained_store.doc),
 +                "--target",
 +                "vllm",
 +            ],
 +        )
++
 +    assert result.exit_code == 0, result.output
++
 +    export_dir = trained_store.store.exports / "vllm"
 +    manifest = load_export_manifest(export_dir)
 +    store_manifest = load_manifest(trained_store.store.manifest)
++
 +    assert (export_dir / "vllm_launch.sh").is_file()
 +    assert (export_dir / "vllm_config.json").is_file()
 +    assert (export_dir / "adapters" / "adapter").is_dir()
 +    assert manifest.target == "vllm"
 +    assert store_manifest.exports, "store export summary missing"
 +    assert store_manifest.exports[-1].target == "vllm"
 +    assert store_manifest.exports[-1].smoke_output_first_line

tests/unit/export/targets/test_vllm_argv.pymodified

              {"adapter_version": 4, "name": "tone", "path": "adapters/tone"},
+         ]
 +    def test_adapter_mix_override_stages_one_mixed_module(self, tmp_path: Path) -> None:
 +        store = _setup_named_store(tmp_path)
 +        mixed = tmp_path / "mixed"
 +        _write_adapter(mixed)
++
 +        prepared = prepare_vllm_export(
 +            store=store,
 +            spec=_SPEC,
 +            served_model_name="dlm-mixed",
 +            training_sequence_len=1024,
 +            adapter_name=None,
 +            adapter_path_override=mixed,
 +            declared_adapter_names=("knowledge", "tone"),
 +        )
++
 +        script = prepared.launch_script_path.read_text(encoding="utf-8")
 +        assert "--served-model-name dlm-mixed" in script
 +        assert "--max-model-len 1024" in script
 +        assert 'mixed="$SCRIPT_DIR/adapters/mixed"' in script
 +        assert 'knowledge="$SCRIPT_DIR/adapters/knowledge"' not in script
 +        assert 'tone="$SCRIPT_DIR/adapters/tone"' not in script
++
 +        config = json.loads(
 +            (prepared.export_dir / VLLM_CONFIG_FILENAME).read_text(encoding="utf-8")
 +        )
 +        assert config["lora_modules"] == [
 +            {"adapter_version": 1, "name": "mixed", "path": "adapters/mixed"}
 +        ]
++
      def test_apple_silicon_export_records_conservative_runtime_env(
          self, tmp_path: Path, monkeypatch: object
      ) -> None: