Spaces:

bhardwaj08sarthak
/

STEM-Question-Generator

Running

bhardwaj08sarthak commited on Sep 25

Commit

0ee77d5

verified ·

1 Parent(s): 71fa3f5

Update all_datasets.py

Files changed (1) hide show

all_datasets.py CHANGED Viewed

@@ -1,18 +1,19 @@
-#%%
-from datasets import load_dataset
-import pandas as pd
-import os
-os.chdir(os.path.dirname(__file__))
-clean_math = pd.read_json(
-    "deepmind_math.jsonl",
-    lines=True,
-    orient="records"
-)
-GSM8k = load_dataset('openai/gsm8k','main', split= 'train')
-MMMLU = load_dataset('cais/mmlu', 'college_mathematics', split='test+validation')
-MMMU = load_dataset('MMMU/MMMU', 'Math', split='test+validation')
-Olympiad_math = load_dataset('Hothan/OlympiadBench', 'TP_TO_maths_en_COMP', split='train')
-Olympiad_math2 = load_dataset('Hothan/OlympiadBench', 'OE_TO_maths_en_COMP', split='train')
-ScienceQA = load_dataset("derek-thomas/ScienceQA", split="train")
-PubmedQA = load_dataset('qiaojin/PubMedQA','pqa_unlabeled', split='train')
-# %%

+#%%
+from datasets import load_dataset
+import pandas as pd
+from pathlib import Path
+BASE_DIR = Path(__file__).resolve().parent
+JSONL_PATH = BASE_DIR / "deepmind_math.jsonl"
+clean_math = pd.read_json(
+    JSONL_PATH,
+    lines=True,
+    orient="records"
+)
+GSM8k = load_dataset('openai/gsm8k','main', split= 'train')
+MMMLU = load_dataset('cais/mmlu', 'college_mathematics', split='test+validation')
+MMMU = load_dataset('MMMU/MMMU', 'Math', split='test+validation')
+Olympiad_math = load_dataset('Hothan/OlympiadBench', 'TP_TO_maths_en_COMP', split='train')
+Olympiad_math2 = load_dataset('Hothan/OlympiadBench', 'OE_TO_maths_en_COMP', split='train')
+ScienceQA = load_dataset("derek-thomas/ScienceQA", split="train")
+PubmedQA = load_dataset('qiaojin/PubMedQA','pqa_unlabeled', split='train')
+# %%