`11ca4a1`

feat(vendor): add llama.cpp submodule pinned at b8816 + refresh pre-tokenizer labels

Authored by mfwolffe <wolffemf@dukes.jmu.edu> 3 weeks ago

Status	File	+
A	`.gitmodules`	3
M	`pyproject.toml`	2
A	`vendor/llama.cpp`	1
A	`vendor/llama_cpp_pretokenizer_hashes.json`	76

.gitmodulesadded

 +[submodule "vendor/llama.cpp"]
 +	path = vendor/llama.cpp
 +	url = https://github.com/ggml-org/llama.cpp

pyproject.tomlmodified

  line-length = 100
  target-version = "py311"
  src = ["src", "tests"]
 +# Vendored third-party code (llama.cpp) — don't lint or format it.
 +extend-exclude = ["vendor/llama.cpp"]
  [tool.ruff.lint]
  select = [

vendor/llama.cppadded

`@@ -0,0 +1,1 @@`
	1	+Subproject commit 3f7c29d318e317b63f54c558bc69803963d7d88c

vendor/llama_cpp_pretokenizer_hashes.jsonadded

 +[
 +  "a.x-4.0",
 +  "afmoe",
 +  "bailingmoe",
 +  "bailingmoe2",
 +  "bert-bge",
 +  "bert-bge-large",
 +  "bloom",
 +  "chameleon",
 +  "chatglm-bpe",
 +  "codeshell",
 +  "command-r",
 +  "dbrx",
 +  "deepseek-coder",
 +  "deepseek-llm",
 +  "deepseek-r1-qwen",
 +  "deepseek-v3",
 +  "exaone",
 +  "exaone-moe",
 +  "exaone4",
 +  "f2llmv2",
 +  "falcon",
 +  "falcon-h1",
 +  "falcon3",
 +  "gigachat",
 +  "glm4",
 +  "gpt-2",
 +  "gpt-4o",
 +  "gpt3-finnish",
 +  "granite-docling",
 +  "grok-2",
 +  "hunyuan",
 +  "hunyuan-dense",
 +  "jais",
 +  "jais-2",
 +  "jina-v1-en",
 +  "jina-v2-code",
 +  "jina-v2-de",
 +  "jina-v2-en",
 +  "jina-v2-es",
 +  "jina-v5-nano",
 +  "joyai-llm",
 +  "kanana2",
 +  "kimi-k2",
 +  "kormo",
 +  "lfm2",
 +  "llama-bpe",
 +  "llama4",
 +  "megrez",
 +  "mellum",
 +  "midm-2.0",
 +  "minerva-7b",
 +  "minimax-m2",
 +  "modern-bert",
 +  "mpt",
 +  "olmo",
 +  "phi-2",
 +  "pixtral",
 +  "poro-chat",
 +  "qwen2",
 +  "qwen35",
 +  "refact",
 +  "roberta-bpe",
 +  "seed-coder",
 +  "smaug-bpe",
 +  "smollm",
 +  "solar-open",
 +  "stablelm2",
 +  "starcoder",
 +  "superbpe",
 +  "tekken",
 +  "tiny_aya",
 +  "trillion",
 +  "viking",
 +  "youtu"
 +]