u-math-leaderboard

Running

App Files Files Community

Konstantin Chernyshev commited on Feb 13

Commit

ea5ca15

1 Parent(s): f7d4dba

chore: remove ScatterPlot -s

Browse files

Files changed (1) hide show

app.py +34 -34

app.py CHANGED Viewed

@@ -216,46 +216,46 @@ with demo:
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏆 U-MATH", elem_id="u-math-benchmark-tab-table", id=0):
             leaderboard_umath = init_leaderboard(LEADERBOARD_U_MATH_DF, U_MATH_COLUMNS_DICT)
-            gr.ScatterPlot(
-                value=LEADERBOARD_U_MATH_DF,
-                title="U-MATH: Text vs Visual Accuracy",
-                x=U_MATH_COLUMNS_DICT["u_math_text_acc"].pretty_name,
-                y=U_MATH_COLUMNS_DICT["u_math_visual_acc"].pretty_name,
-                color=U_MATH_COLUMNS_DICT["model_family"].pretty_name,
-                tooltip=[U_MATH_COLUMNS_DICT["full_model_name"].pretty_name, U_MATH_COLUMNS_DICT["u_math_acc"].pretty_name],
-                elem_classes="scatter-plot",
-                height=500,
-            )
         with gr.TabItem("🏅 μ-MATH (Meta-Benchmark)", elem_id="mu-math-benchmark-tab-table", id=1):
             leaderboard_mumath = init_leaderboard(LEADERBOARD_MU_MATH_DF, MU_MATH_COLUMNS_DICT)
-            gr.ScatterPlot(
-                value=LEADERBOARD_MU_MATH_DF,
-                title="μ-MATH: True Positive Rate (Recall) vs True Negative Rate (Specificity)",
-                x=MU_MATH_COLUMNS_DICT["mu_math_tpr"].pretty_name,
-                y=MU_MATH_COLUMNS_DICT["mu_math_tnr"].pretty_name,
-                color=MU_MATH_COLUMNS_DICT["model_family"].pretty_name,
-                tooltip=[MU_MATH_COLUMNS_DICT["full_model_name"].pretty_name, MU_MATH_COLUMNS_DICT["mu_math_f1"].pretty_name],
-                elem_classes="scatter-plot",
-                height=500,
-            )
         with gr.TabItem("📊 U-MATH vs μ-MATH", elem_id="u-math-vs-mu-math-tab-table", id=2):
             leaderboard_aggregated = init_leaderboard(LEADERBOARD_U_MATH_MU_MATH_JOINED_DF, U_MATH_AND_MU_MATH_COLUMNS_DICT)
-            gr.ScatterPlot(
-                value=LEADERBOARD_U_MATH_MU_MATH_JOINED_DF,
-                title="U-MATH Accuracy (Solving) vs μ-MATH F1 Score (Judging)",
-                x=U_MATH_AND_MU_MATH_COLUMNS_DICT["u_math_acc"].pretty_name,
-                y=U_MATH_AND_MU_MATH_COLUMNS_DICT["mu_math_f1"].pretty_name,
-                color=U_MATH_AND_MU_MATH_COLUMNS_DICT["model_family"].pretty_name,
-                tooltip=[
-                    U_MATH_AND_MU_MATH_COLUMNS_DICT["full_model_name"].pretty_name,
-                    U_MATH_AND_MU_MATH_COLUMNS_DICT["u_math_text_acc"].pretty_name,
-                    U_MATH_AND_MU_MATH_COLUMNS_DICT["u_math_visual_acc"].pretty_name,
-                ],
-                elem_classes="scatter-plot",
-                height=500,
-            )
         with gr.TabItem("📝 About", elem_id="about-tab-table", id=3):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")

     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏆 U-MATH", elem_id="u-math-benchmark-tab-table", id=0):
             leaderboard_umath = init_leaderboard(LEADERBOARD_U_MATH_DF, U_MATH_COLUMNS_DICT)
+            # gr.ScatterPlot(
+            #     value=LEADERBOARD_U_MATH_DF,
+            #     title="U-MATH: Text vs Visual Accuracy",
+            #     x=U_MATH_COLUMNS_DICT["u_math_text_acc"].pretty_name,
+            #     y=U_MATH_COLUMNS_DICT["u_math_visual_acc"].pretty_name,
+            #     color=U_MATH_COLUMNS_DICT["model_family"].pretty_name,
+            #     tooltip=[U_MATH_COLUMNS_DICT["full_model_name"].pretty_name, U_MATH_COLUMNS_DICT["u_math_acc"].pretty_name],
+            #     elem_classes="scatter-plot",
+            #     height=500,
+            # )
         with gr.TabItem("🏅 μ-MATH (Meta-Benchmark)", elem_id="mu-math-benchmark-tab-table", id=1):
             leaderboard_mumath = init_leaderboard(LEADERBOARD_MU_MATH_DF, MU_MATH_COLUMNS_DICT)
+            # gr.ScatterPlot(
+            #     value=LEADERBOARD_MU_MATH_DF,
+            #     title="μ-MATH: True Positive Rate (Recall) vs True Negative Rate (Specificity)",
+            #     x=MU_MATH_COLUMNS_DICT["mu_math_tpr"].pretty_name,
+            #     y=MU_MATH_COLUMNS_DICT["mu_math_tnr"].pretty_name,
+            #     color=MU_MATH_COLUMNS_DICT["model_family"].pretty_name,
+            #     tooltip=[MU_MATH_COLUMNS_DICT["full_model_name"].pretty_name, MU_MATH_COLUMNS_DICT["mu_math_f1"].pretty_name],
+            #     elem_classes="scatter-plot",
+            #     height=500,
+            # )
         with gr.TabItem("📊 U-MATH vs μ-MATH", elem_id="u-math-vs-mu-math-tab-table", id=2):
             leaderboard_aggregated = init_leaderboard(LEADERBOARD_U_MATH_MU_MATH_JOINED_DF, U_MATH_AND_MU_MATH_COLUMNS_DICT)
+            # gr.ScatterPlot(
+            #     value=LEADERBOARD_U_MATH_MU_MATH_JOINED_DF,
+            #     title="U-MATH Accuracy (Solving) vs μ-MATH F1 Score (Judging)",
+            #     x=U_MATH_AND_MU_MATH_COLUMNS_DICT["u_math_acc"].pretty_name,
+            #     y=U_MATH_AND_MU_MATH_COLUMNS_DICT["mu_math_f1"].pretty_name,
+            #     color=U_MATH_AND_MU_MATH_COLUMNS_DICT["model_family"].pretty_name,
+            #     tooltip=[
+            #         U_MATH_AND_MU_MATH_COLUMNS_DICT["full_model_name"].pretty_name,
+            #         U_MATH_AND_MU_MATH_COLUMNS_DICT["u_math_text_acc"].pretty_name,
+            #         U_MATH_AND_MU_MATH_COLUMNS_DICT["u_math_visual_acc"].pretty_name,
+            #     ],
+            #     elem_classes="scatter-plot",
+            #     height=500,
+            # )
         with gr.TabItem("📝 About", elem_id="about-tab-table", id=3):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")