Spaces:

LLM360
/

TxT360

Running

App Files Files Community

victormiller commited on Oct 2, 2024

Commit

e3fd33e

verified ·

1 Parent(s): 87a6313

Update curated.py

Browse files

Files changed (1) hide show

curated.py +10 -60

curated.py CHANGED Viewed

@@ -511,12 +511,7 @@ def get_freelaw_data(data_source: str = "Freelaw", doc_id: int = 3, target: str
         target=target,
     )
-freelaw_examples = Div(
-    Div(
-        get_freelaw_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_se_data(data_source: str = "StackExchange", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -540,12 +535,7 @@ def get_se_data(data_source: str = "StackExchange", doc_id: int = 3, target: str
         target=target,
     )
-se_examples = Div(
-    Div(
-        get_se_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_phil_data(data_source: str = "PhilPapers", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -568,12 +558,7 @@ def get_phil_data(data_source: str = "PhilPapers", doc_id: int = 3, target: str
         target=target,
     )
-phil_examples = Div(
-    Div(
-        get_phil_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_arx_data(data_source: str = "Arxiv", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -597,12 +582,7 @@ def get_arx_data(data_source: str = "Arxiv", doc_id: int = 3, target: str = "foo
         target=target,
     )
-arx_examples = Div(
-    Div(
-        get_arx_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_S2ORC_data(data_source: str = "S2ORC", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -625,12 +605,7 @@ def get_S2ORC_data(data_source: str = "S2ORC", doc_id: int = 3, target: str = "f
         target=target,
     )
-s2o_examples = Div(
-    Div(
-        get_S2ORC_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_S2ORCA_data(data_source: str = "S2ORC Abstract", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -653,12 +628,7 @@ def get_S2ORCA_data(data_source: str = "S2ORC Abstract", doc_id: int = 3, target
         target=target,
     )
-s2oa_examples = Div(
-    Div(
-        get_S2ORCA_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_pubmed_data(data_source: str = "Pubmed", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -682,12 +652,7 @@ def get_pubmed_data(data_source: str = "Pubmed", doc_id: int = 3, target: str =
         target=target,
     )
-pubmed_examples = Div(
-    Div(
-        get_pubmed_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_dmm_data(data_source: str = "DM Math", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -711,12 +676,7 @@ def get_dmm_data(data_source: str = "DM Math", doc_id: int = 3, target: str = "f
         target=target,
     )
-dmm_examples = Div(
-    Div(
-        get_dmm_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_pg19_data(data_source: str = "PG19", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -739,12 +699,7 @@ def get_pg19_data(data_source: str = "PG19", doc_id: int = 3, target: str = "foo
         target=target,
     )
-pg19_examples = Div(
-    Div(
-        get_pg19_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 def get_eu_data(data_source: str = "Europarl", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
@@ -767,12 +722,7 @@ def get_eu_data(data_source: str = "Europarl", doc_id: int = 3, target: str = "f
         target=target,
     )
-eu_examples = Div(
-    Div(
-        get_eu_data(target=gen_random_id()),
-        style="border: 1px solid #ccc; padding: 20px;",
-    ),
-)
 filtering_process = Div(
     Section(

         target=target,
     )
+freelaw_examples = DV("data/curated_samples/freelaw_extract.json", 0, "Freelaw")
 def get_se_data(data_source: str = "StackExchange", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+se_examples = DV("data/curated_samples/stackexchange_extract.json", 0, "StackExchange")
 def get_phil_data(data_source: str = "PhilPapers", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+phil_examples = DV("data/curated_samples/philpapers_raw.json", 0, "PhilPapers")
 def get_arx_data(data_source: str = "Arxiv", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+arx_examples = DV("data/curated_samples/arxiv_extract.json", 0, "Arxiv")
 def get_S2ORC_data(data_source: str = "S2ORC", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+s2o_examples = DV("data/curated_samples/s2orc_raw.json", 0, "S2ORC")
 def get_S2ORCA_data(data_source: str = "S2ORC Abstract", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+s2oa_examples = DV("data/curated_samples/s2orc_abstract_raw.json", 0, "S2ORC Abstract")
 def get_pubmed_data(data_source: str = "Pubmed", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+pubmed_examples = DV("data/curated_samples/pubmed_extract.json", 0, "PubMed")
 def get_dmm_data(data_source: str = "DM Math", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+dmm_examples = DV("data/curated_samples/dm_maths_extract.json", 0, "DM Math")
 def get_pg19_data(data_source: str = "PG19", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+pg19_examples = DV("data/curated_samples/pg19_raw.json", 0, "PG19")
 def get_eu_data(data_source: str = "Europarl", doc_id: int = 3, target: str = "foo"):
     doc_id = max(0, min(int(doc_id), 9))
         target=target,
     )
+eu_examples = DV("data/curated_samples/europarl_raw.json", 0, "Europarl")
 filtering_process = Div(
     Section(