Spaces:

ggml-org
/

gguf-my-repo

Running on A10G

SixOpen commited on Jun 10, 2024

Commit

46483c1

1 Parent(s): 5082a24

Imatrix

Files changed (4) hide show

Dockerfile CHANGED Viewed

@@ -60,4 +60,5 @@ ENV PYTHONPATH=${HOME}/app \
     PATH=/usr/local/nvidia/bin:${PATH}
-ENTRYPOINT ["/bin/bash", "-c", "cd llama.cpp && LLAMA_CUDA=1 make -j quantize gguf-split imatrix && cd .. && /bin/sh start.sh"]


60	PATH=/usr/local/nvidia/bin:${PATH}
61
62
63	+ ENTRYPOINT /bin/sh start.sh
64	+

app.py CHANGED Viewed

@@ -132,7 +132,7 @@ def process_model(model_id, q_method, use_imatrix, imatrix_q_method, private_rep
             if train_data_file:
                 train_data_path = train_data_file.name
             else:
-                train_data_path = "imatrix_calibration.txt"
             print(f"Training data file path: {train_data_path}")

             if train_data_file:
                 train_data_path = train_data_file.name
             else:
+                train_data_path = "groups_merged.txt" #fallback calibration dataset
             print(f"Training data file path: {train_data_path}")

groups_merged.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

start.sh CHANGED Viewed

+cd llama.cpp
+make -j quantize gguf-split imatrix
+cd ..
 python app.py