Spaces:

medmekk
/

TorchAO_Quantization

Running on A100

MekkCyber commited on Oct 22, 2024

Commit

23210c5

1 Parent(s): 29baea6

updating quantization

Files changed (1) hide show

app.py CHANGED Viewed

@@ -74,9 +74,9 @@ def quantize_model(model_name, quantization_type, group_size=128, auth_token=Non
     else :
         quantization_config = TorchAoConfig(quantization_type)
     if device == "cuda" :
-        model = load_model_gpu(model_name, quantization_config, auth_token)
     else :
-        model = load_model_cpu(model_name, quantization_config, auth_token)
     return model

     else :
         quantization_config = TorchAoConfig(quantization_type)
     if device == "cuda" :
+        model = load_model_gpu(model_name, quantization_config=quantization_config, auth_token=auth_token)
     else :
+        model = load_model_cpu(model_name, quantization_config=quantization_config, auth_token=auth_token)
     return model