Spaces:

Orion-zhen
/

tokenize-it

Running

Orion-zhen commited on 15 days ago

Commit

3d321a0

verified ·

1 Parent(s): 6e18009

Upload 4 files

Files changed (5) hide show

.gitattributes CHANGED Viewed

@@ -40,3 +40,4 @@ models/GLM-4-0414/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 models/Mistral-Small-3.1-2503/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 models/Command-A-03-2025/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 models/Aya-expanse/tokenizer.json filter=lfs diff=lfs merge=lfs -text

 models/Mistral-Small-3.1-2503/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 models/Command-A-03-2025/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 models/Aya-expanse/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+models/Mistral-Small-3.1-2503/tekken.json filter=lfs diff=lfs merge=lfs -text

models/Mistral-Small-3.1-2503/config.json CHANGED Viewed

+{
+  "architectures": [
+    "Mistral3ForConditionalGeneration"
+  ],
+  "image_token_index": 10,
+  "model_type": "mistral3",
+  "multimodal_projector_bias": false,
+  "projector_hidden_act": "gelu",
+  "spatial_merge_size": 2,
+  "text_config": {
+    "attention_dropout": 0.0,
+    "head_dim": 128,
+    "hidden_act": "silu",
+    "hidden_size": 5120,
+    "initializer_range": 0.02,
+    "intermediate_size": 32768,
+    "max_position_embeddings": 131072,
+    "model_type": "mistral",
+    "num_attention_heads": 32,
+    "num_hidden_layers": 40,
+    "num_key_value_heads": 8,
+    "rms_norm_eps": 1e-05,
+    "rope_theta": 1000000000.0,
+    "sliding_window": null,
+    "use_cache": true,
+    "vocab_size": 131072
+  },
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0.dev0",
+  "vision_config": {
+    "attention_dropout": 0.0,
+    "head_dim": 64,
+    "hidden_act": "gelu",
+    "hidden_size": 1024,
+    "image_size": 1540,
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "model_type": "pixtral",
+    "num_attention_heads": 16,
+    "num_channels": 3,
+    "num_hidden_layers": 24,
+    "patch_size": 14,
+    "rope_theta": 10000.0
+  },
+  "vision_feature_layer": -1
+}

models/Mistral-Small-3.1-2503/tekken.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c604f35d1035f534519622c0ec83fed6184978d4fdee92a5bd2a50bc05438094
+size 14801330

models/Mistral-Small-3.1-2503/tokenizer.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b76085f9923309d873994d444989f7eb6ec074b06f25b58f1e8d7b7741070949
+size 17078037

models/Mistral-Small-3.1-2503/tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff