Spaces:

idkash1
/

detect-edits-in-ai-generated-text

Sleeping

idkash1 commited on Mar 20

Commit

0c743a6

verified ·

1 Parent(s): 42a5a6d

Update human_text_detect.py

Files changed (1) hide show

human_text_detect.py CHANGED Viewed

@@ -93,21 +93,22 @@ def detect_human_text(model_name, topic, text):
     min_tokens_per_sentence = 10
     max_tokens_per_sentence = 100
-    cache_dir = f"/tmp/cacheHuggingface/{model_name}"
     # Init model
     print('Init tokenizer')
     lm_name = 'gpt2-xl' if model_name == 'GPT2XL' else 'microsoft/phi-2'
-    tokenizer = AutoTokenizer.from_pretrained(lm_name) #, cache_dir=cache_dir
-    # print("Save tokenizer")
-    # tokenizer.save_pretrained(cache_dir)
     print('Init model')
-    model = AutoModelForCausalLM.from_pretrained(lm_name) #, cache_dir=cache_dir
-    # print("Save model")
-    # model.save_pretrained(cache_dir)
     print('Init PerplexityEvaluator')
     sentence_detector = PerplexityEvaluator(model, tokenizer)

     min_tokens_per_sentence = 10
     max_tokens_per_sentence = 100
+    cache_dir_tokenizer = f"/data/cacheHuggingface/{model_name}/tokenizer"
     # Init model
     print('Init tokenizer')
     lm_name = 'gpt2-xl' if model_name == 'GPT2XL' else 'microsoft/phi-2'
+    tokenizer = AutoTokenizer.from_pretrained(lm_name, cache_dir=cache_dir_tokenizer)
+    print("Save tokenizer")
+    tokenizer.save_pretrained(cache_dir_tokenizer)
     print('Init model')
+    cache_dir_model = f"/data/cacheHuggingface/{model_name}/model"
+    model = AutoModelForCausalLM.from_pretrained(lm_name, cache_dir=cache_dir_model)
+    print("Save model")
+    model.save_pretrained(cache_dir_model)
     print('Init PerplexityEvaluator')
     sentence_detector = PerplexityEvaluator(model, tokenizer)