mmarco-mMiniLMv2-L6-H384-v1-onnx-o4

Browse files

Files changed (11) hide show

.gitattributes +1 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/.gitattributes +36 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/README.md +55 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/config.json +33 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/model_optimized.onnx +3 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/ort_config.json +39 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/sentencepiece.bpe.model +3 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/source.txt +1 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/special_tokens_map.json +51 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/tokenizer.json +3 -0
mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/tokenizer_config.json +54 -0

.gitattributes CHANGED Viewed

@@ -35,3 +35,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 paraphrase-multilingual-MiniLM-L12-v2/unigram.json filter=lfs diff=lfs merge=lfs -text
 crossencoder-mMiniLMv2-L12-mmarcoFR_ONNX/tokenizer.json filter=lfs diff=lfs merge=lfs -text

 *tfevents* filter=lfs diff=lfs merge=lfs -text
 paraphrase-multilingual-MiniLM-L12-v2/unigram.json filter=lfs diff=lfs merge=lfs -text
 crossencoder-mMiniLMv2-L12-mmarcoFR_ONNX/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/tokenizer.json filter=lfs diff=lfs merge=lfs -text

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/.gitattributes ADDED Viewed

	@@ -0,0 +1,36 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/README.md ADDED Viewed

	@@ -0,0 +1,55 @@

+https://huggingface.co/nreimers/mmarco-mMiniLMv2-L6-H384-v1
+optimized with onnx o4
+```
+from pathlib import Path
+from transformers import AutoTokenizer
+from optimum.onnxruntime import ORTModelForSequenceClassification, ORTOptimizer
+from optimum.onnxruntime import AutoOptimizationConfig
+model = "nreimers/mmarco-mMiniLMv2-L6-H384-v1"
+tokenizer = AutoTokenizer.from_pretrained(model)
+ort_model = ORTModelForSequenceClassification.from_pretrained(model, export=True)
+save_dir = Path("/tmp/optimized_models")
+save_dir.mkdir(exist_ok=True, parents=True)
+optimizer = ORTOptimizer.from_pretrained(ort_model)
+optimizer.optimize(
+    optimization_config=AutoOptimizationConfig.O4(),
+    save_dir=save_dir,
+)
+```
+Run it with onnx
+```
+import torch
+from transformers import AutoTokenizer
+from transformers.pipelines.text_classification import ClassificationFunction
+from optimum.pipelines import pipeline as ort_pipeline
+from optimum.onnxruntime import ORTModelForSequenceClassification
+model = "Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4"
+device = torch.device(0) if torch.cuda.is_available() else -1
+tokenizer = AutoTokenizer.from_pretrained(model)
+ort_model = ORTModelForSequenceClassification.from_pretrained(
+    model, file_name="model_optimized.onnx")
+cross_encoder = ort_pipeline(
+    task="text-classification",
+    model=ort_model,
+    tokenizer=tokenizer,
+    device=device,
+    function_to_apply=ClassificationFunction.SIGMOID,
+    padding=True,
+    truncation=True)
+cross_encoder([{
+    "text":
+    "Quel est le but de la vie ?",
+    "text_pair":
+    "Le but de la vie est une question subjective et dépend de la croyance et de la perspective personnelle de chaque individu. Pour certains, le but peut être de trouver la bonheur et le contentement personnel, pour d'autres cela peut être de faire une différence positive dans le monde, de vivre en harmonie avec les autres, de découvrir la signification et le propre but de leur existence, entre autres. En fin de compte, le but de la vie est déterminé par chaque individu eux-mêmes."
+}])
+```

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "nreimers/mmarco-mMiniLMv2-L6-H384-v1",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 384,
+  "id2label": {
+    "0": "LABEL_0"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "label2id": {
+    "LABEL_0": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/model_optimized.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0eaae91d96a80ccd9af77c8cd0ab7c5b799c8aa9180ed83b8b4528311a812660
+size 214017536

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/ort_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "one_external_file": true,
+  "opset": null,
+  "optimization": {
+    "disable_attention": null,
+    "disable_attention_fusion": false,
+    "disable_bias_gelu": null,
+    "disable_bias_gelu_fusion": false,
+    "disable_bias_skip_layer_norm": null,
+    "disable_bias_skip_layer_norm_fusion": false,
+    "disable_embed_layer_norm": true,
+    "disable_embed_layer_norm_fusion": true,
+    "disable_gelu": null,
+    "disable_gelu_fusion": false,
+    "disable_group_norm_fusion": true,
+    "disable_layer_norm": null,
+    "disable_layer_norm_fusion": false,
+    "disable_packed_kv": true,
+    "disable_rotary_embeddings": false,
+    "disable_shape_inference": false,
+    "disable_skip_layer_norm": null,
+    "disable_skip_layer_norm_fusion": false,
+    "enable_gelu_approximation": true,
+    "enable_gemm_fast_gelu_fusion": false,
+    "enable_transformers_specific_optimizations": true,
+    "fp16": true,
+    "no_attention_mask": false,
+    "optimization_level": 2,
+    "optimize_for_gpu": true,
+    "optimize_with_onnxruntime_only": null,
+    "use_mask_index": false,
+    "use_multi_head_attention": false,
+    "use_raw_attention_mask": false
+  },
+  "optimum_version": "1.14.1",
+  "quantization": {},
+  "transformers_version": "4.35.2",
+  "use_external_data_format": false
+}

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f59925fcb90c92b894cb93e51bb9b4a6105c5c249fe54ce1c704420ac39b81af
+size 17082756

mmarco-mMiniLMv2-L6-H384-v1-onnx-o4/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}