updating saved model after name change from encoders to layers in MegaModel

Files changed (2) hide show

config.json CHANGED Viewed

@@ -12,13 +12,15 @@
   "chunk_size": -1,
   "classifier_dropout": null,
   "dropout_prob": 0.1,
   "ema_projection_size": 16,
   "eos_token_id": 2,
   "hidden_dropout_prob": 0.1,
   "hidden_size": 128,
   "initializer_range": 0.02,
   "intermediate_size": 256,
-  "layer_norm_eps": 1e-12,
   "max_positions": 10000,
   "model_type": "mega",
   "nffn_activation_dropout_prob": 0.0,
@@ -27,12 +29,13 @@
   "normalization_type": "scalenorm",
   "normalize_before_ffn": true,
   "normalize_before_mega": true,
   "num_hidden_layers": 4,
   "pad_token_id": 1,
   "relative_positional_bias": "rotary",
   "shared_representation_size": 64,
   "torch_dtype": "float32",
-  "transformers_version": "4.27.0.dev0",
   "truncation": null,
   "type_vocab_size": 2,
   "use_cache": true,

   "chunk_size": -1,
   "classifier_dropout": null,
   "dropout_prob": 0.1,
+  "ema_beta_range": 0.02,
+  "ema_delta_alpha_range": 0.2,
+  "ema_gamma_omega_range": 1.0,
   "ema_projection_size": 16,
   "eos_token_id": 2,
   "hidden_dropout_prob": 0.1,
   "hidden_size": 128,
   "initializer_range": 0.02,
   "intermediate_size": 256,
   "max_positions": 10000,
   "model_type": "mega",
   "nffn_activation_dropout_prob": 0.0,
   "normalization_type": "scalenorm",
   "normalize_before_ffn": true,
   "normalize_before_mega": true,
+  "num_attention_heads": 1,
   "num_hidden_layers": 4,
   "pad_token_id": 1,
   "relative_positional_bias": "rotary",
   "shared_representation_size": 64,
   "torch_dtype": "float32",
+  "transformers_version": "4.28.0.dev0",
   "truncation": null,
   "type_vocab_size": 2,
   "use_cache": true,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:148c0df0aca6894b870a3b4ef483148d9131957231b64f6068ba7861b8eb5e29
-size 29332668

 version https://git-lfs.github.com/spec/v1
+oid sha256:69f1dfc6152299b92c6729e6ea7c955b70f07fe63dafc799e0386690e2349df6
+size 29332476