Spaces:

JeffYang52415
/

LLMEval-Dataset-Parser

Running

App Files Files Community

JeffYang52415 commited on Dec 28, 2024

Commit

952a3b5

unverified ·

1 Parent(s): b65e855

feat: add mgsm parser

Browse files

Files changed (2) hide show

llmdataparser/mgsm_parser.py +109 -0
tests/test_mgsm_parser.py +184 -0

llmdataparser/mgsm_parser.py ADDED Viewed

	@@ -0,0 +1,109 @@

+from dataclasses import dataclass
+from typing import Any, ClassVar
+from llmdataparser.base_parser import HuggingFaceDatasetParser, HuggingFaceParseEntry
+from llmdataparser.prompts import MGSM_SYSTEM_PROMPT
+@dataclass(frozen=True, kw_only=True, slots=True)
+class MGSMParseEntry(HuggingFaceParseEntry):
+    """Custom entry class for MGSM, with fields specific to this dataset parser."""
+    numerical_answer: int | float
+    equation_solution: str | None
+    language: str
+    @classmethod
+    def create(
+        cls,
+        prompt: str,
+        answer: str,
+        raw_question: str,
+        raw_answer: str,
+        numerical_answer: int | float,
+        equation_solution: str | None,
+        task_name: str,
+        language: str,
+    ) -> "MGSMParseEntry":
+        return cls(
+            prompt=prompt,
+            answer=answer,
+            raw_question=raw_question,
+            raw_answer=raw_answer,
+            numerical_answer=numerical_answer,
+            equation_solution=equation_solution,
+            task_name=task_name,
+            language=language,
+        )
+class MGSMDatasetParser(HuggingFaceDatasetParser[MGSMParseEntry]):
+    """Parser for the MGSM (Multilingual Grade School Math) dataset."""
+    _data_source: ClassVar[str] = "juletxara/mgsm"
+    _default_task: ClassVar[str] = "en"
+    _task_names: ClassVar[list[str]] = [
+        "bn",
+        "de",
+        "en",
+        "es",
+        "fr",
+        "ja",
+        "ru",
+        "sw",
+        "te",
+        "th",
+        "zh",
+    ]
+    _default_system_prompt: ClassVar[str] = MGSM_SYSTEM_PROMPT
+    def process_entry(
+        self, row: dict[str, Any], task_name: str | None = None, **kwargs: Any
+    ) -> MGSMParseEntry:
+        """
+        Process a single MGSM entry.
+        Args:
+            row: Dictionary containing the MGSM entry fields
+            task_name: Language code for the current task
+        Returns:
+            MGSMParseEntry: Processed entry with prompt, answer, and metadata
+        """
+        task = task_name or self._get_current_task(row)
+        raw_question = row["question"]
+        raw_answer = row["answer"] if row["answer"] else ""
+        numerical_answer = row["answer_number"]
+        equation_solution = row["equation_solution"]
+        # Construct the prompt with the system prompt and question
+        prompt = f"{self._system_prompt}\n{raw_question}"
+        # Use numerical answer as string for the answer field if no detailed answer is provided
+        answer = raw_answer if raw_answer else str(numerical_answer)
+        return MGSMParseEntry.create(
+            prompt=prompt,
+            answer=answer,
+            raw_question=raw_question,
+            raw_answer=raw_answer,
+            numerical_answer=numerical_answer,
+            equation_solution=equation_solution,
+            task_name=task,
+            language=task,
+        )
+if __name__ == "__main__":
+    from pprint import pprint
+    parser = MGSMDatasetParser()
+    parser.load(task_name="en")  # Load French dataset
+    parser.parse()
+    parsed_data = parser.get_parsed_data
+    pprint(parsed_data[0].prompt)
+    pprint(parsed_data[0].answer)
+    pprint(parsed_data[0].raw_question)
+    pprint(parsed_data[0].numerical_answer)
+    pprint(parsed_data[0].language)

tests/test_mgsm_parser.py ADDED Viewed

	@@ -0,0 +1,184 @@

+import pytest
+from llmdataparser.mgsm_parser import MGSMDatasetParser, MGSMParseEntry
+@pytest.fixture
+def mgsm_parser():
+    """Create a MGSM parser instance for testing."""
+    return MGSMDatasetParser()
+@pytest.fixture
+def loaded_mgsm_parser(mgsm_parser):
+    """Create and load a MGSM parser instance with test split."""
+    mgsm_parser.load(task_name="en", split="test")
+    return mgsm_parser
+@pytest.fixture
+def sample_mgsm_entries():
+    """Create sample MGSM dataset entries for testing."""
+    return [
+        {
+            "question": "John has 5 apples and buys 3 more. How many apples does he have now?",
+            "answer": "Let's solve step by step:\n1) Initial apples = 5\n2) Bought apples = 3\n3) Total = 5 + 3 = 8\nJohn has 8 apples now.",
+            "answer_number": 8,
+            "equation_solution": "5 + 3 = 8",
+            "language": "en",
+        },
+        {
+            "question": "Juan tiene 5 manzanas y compra 3 más. ¿Cuántas manzanas tiene ahora?",
+            "answer": "Resolvamos paso a paso:\n1) Manzanas iniciales = 5\n2) Manzanas compradas = 3\n3) Total = 5 + 3 = 8\nJuan tiene 8 manzanas ahora.",
+            "answer_number": 8,
+            "equation_solution": "5 + 3 = 8",
+            "language": "es",
+        },
+        {
+            "question": "ジョンはリンゴを5個持っていて、さらに3個買います。今何個持っていますか？",
+            "answer": None,  # Testing case with missing detailed answer
+            "answer_number": 8,
+            "equation_solution": "5 + 3 = 8",
+            "language": "ja",
+        },
+    ]
+def test_mgsm_parse_entry_creation_valid():
+    """Test valid creation of MGSMParseEntry with all fields."""
+    entry = MGSMParseEntry.create(
+        prompt="Test prompt",
+        answer="Test answer",
+        raw_question="Test question",
+        raw_answer="Test answer",
+        numerical_answer=42,
+        equation_solution="21 * 2 = 42",
+        task_name="en",
+        language="en",
+    )
+    assert isinstance(entry, MGSMParseEntry)
+    assert entry.prompt == "Test prompt"
+    assert entry.answer == "Test answer"
+    assert entry.raw_question == "Test question"
+    assert entry.raw_answer == "Test answer"
+    assert entry.numerical_answer == 42
+    assert entry.equation_solution == "21 * 2 = 42"
+    assert entry.task_name == "en"
+    assert entry.language == "en"
+def test_process_entry_with_detailed_answer(mgsm_parser, sample_mgsm_entries):
+    """Test processing entry with detailed answer in English."""
+    entry = mgsm_parser.process_entry(sample_mgsm_entries[0], task_name="en")
+    assert isinstance(entry, MGSMParseEntry)
+    assert entry.numerical_answer == 8
+    assert entry.equation_solution == "5 + 3 = 8"
+    assert "step by step" in entry.answer
+    assert entry.language == "en"
+    assert entry.task_name == "en"
+def test_process_entry_without_detailed_answer(mgsm_parser, sample_mgsm_entries):
+    """Test processing entry without detailed answer (Japanese)."""
+    entry = mgsm_parser.process_entry(sample_mgsm_entries[2], task_name="ja")
+    assert isinstance(entry, MGSMParseEntry)
+    assert entry.numerical_answer == 8
+    assert entry.equation_solution == "5 + 3 = 8"
+    assert entry.answer == "8"  # Should use numerical_answer as string
+    assert entry.language == "ja"
+    assert entry.task_name == "ja"
+def test_process_entry_spanish(mgsm_parser, sample_mgsm_entries):
+    """Test processing Spanish entry."""
+    entry = mgsm_parser.process_entry(sample_mgsm_entries[1], task_name="es")
+    assert isinstance(entry, MGSMParseEntry)
+    assert entry.numerical_answer == 8
+    assert entry.equation_solution == "5 + 3 = 8"
+    assert "paso a paso" in entry.answer  # Spanish for "step by step"
+    assert entry.language == "es"
+    assert entry.task_name == "es"
+def test_mgsm_parser_initialization(mgsm_parser):
+    """Test MGSM parser initialization and properties."""
+    assert isinstance(mgsm_parser.task_names, list)
+    assert len(mgsm_parser.task_names) == 11  # 11 supported languages
+    assert mgsm_parser._data_source == "juletxara/mgsm"
+    assert mgsm_parser._default_task == "en"
+    assert all(lang in mgsm_parser.task_names for lang in ["en", "es", "ja", "zh"])
+    assert (
+        mgsm_parser.get_huggingface_link
+        == "https://huggingface.co/datasets/juletxara/mgsm"
+    )
+@pytest.mark.integration
+def test_load_dataset(loaded_mgsm_parser):
+    """Test loading the MGSM dataset."""
+    assert loaded_mgsm_parser.raw_data is not None
+    assert loaded_mgsm_parser.split_names == ["test"]
+    assert loaded_mgsm_parser._current_task == "en"
+def test_parser_string_representation(loaded_mgsm_parser):
+    """Test string representation of MGSM parser."""
+    repr_str = str(loaded_mgsm_parser)
+    assert "MGSMDatasetParser" in repr_str
+    assert "juletxara/mgsm" in repr_str
+    assert "en" in repr_str
+    assert "loaded" in repr_str
+@pytest.mark.integration
+def test_different_languages_parsing(mgsm_parser):
+    """Test parsing different language versions."""
+    # Load and parse English
+    mgsm_parser.load(task_name="en", split="test")
+    mgsm_parser.parse(split_names="test", force=True)
+    en_count = len(mgsm_parser.get_parsed_data)
+    # Load and parse Spanish
+    mgsm_parser.load(task_name="es", split="test")
+    mgsm_parser.parse(split_names="test", force=True)
+    es_count = len(mgsm_parser.get_parsed_data)
+    assert en_count > 0
+    assert es_count > 0
+    assert en_count == es_count  # Should have same number of problems in each language
+@pytest.mark.parametrize("language", ["en", "es", "ja", "zh", "ru"])
+def test_supported_languages(mgsm_parser, language):
+    """Test that each supported language can be processed."""
+    test_entry = {
+        "question": f"Test question in {language}",
+        "answer": f"Test answer in {language}",
+        "answer_number": 42,
+        "equation_solution": "21 * 2 = 42",
+    }
+    entry = mgsm_parser.process_entry(test_entry, task_name=language)
+    assert entry.language == language
+    assert entry.task_name == language
+    assert entry.numerical_answer == 42
+def test_system_prompt_override(mgsm_parser):
+    """Test overriding the default system prompt."""
+    custom_prompt = "Custom system prompt for testing"
+    parser = MGSMDatasetParser(system_prompt=custom_prompt)
+    test_entry = {
+        "question": "Test question",
+        "answer": "Test answer",
+        "answer_number": 42,
+        "equation_solution": "42",
+    }
+    entry = parser.process_entry(test_entry, task_name="en")
+    assert custom_prompt in entry.prompt