MageBench-Leaderboard

Running

App Files Files Community

daiqi commited on Dec 4, 2024

Commit

96c4b54

verified ·

1 Parent(s): 5b280bc

Update app.py

Browse files

Files changed (1) hide show

app.py +55 -34

app.py CHANGED Viewed

@@ -107,7 +107,7 @@ def init_leaderboard(dataframe):
         interactive=False,
     )
 demo = gr.Blocks(css=custom_css)
 with demo:
@@ -121,7 +121,9 @@ with demo:
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")
         with gr.TabItem("🚀 Submit here! ", elem_id="llm-benchmark-tab-table", id=3):
             with gr.Column():
                 with gr.Row():
@@ -151,40 +153,59 @@ with demo:
                 link_input = gr.Textbox(label="Link (str)", placeholder="请输入链接")
-                submit_button = gr.Button("Submit Eval")
-                submission_result = gr.Markdown()
-                def submit_eval(score, name, base_model, env, target_research, subset, link):
-                    # 在这里处理提交逻辑，可以将信息保存到数据库或进行其他处理
-                    result = {
-                        "Score": score,
-                        "Name": name,
-                        "BaseModel": base_model,
-                        "Env": env,
-                        "Target-research": target_research,
-                        "Subset": subset,
-                        "Link": link,
-                        "State": "Checking"
-                    }
-                    out_path = "test-output.json"
-                    with open(out_path, "w") as f:
-                        f.write(json.dumps(result))
-                    print("Uploading eval file")
-                    API.upload_file(
-                        path_or_fileobj=out_path,
-                        path_in_repo=out_path,
-                        repo_id="microsoft/MageBench-Leaderboard",
-                        repo_type="space",
-                        commit_message=f"Add {result} to checking queue",
-                    )
-                    return result
-                submit_button.click(
-                    submit_eval,
-                    [score_input, name_input, base_model_input, env_dropdown, target_research_dropdown, subset_dropdown, link_input],
-                    submission_result
                 )
             #     with gr.Column():
             #         with gr.Accordion(
             #             f"✅ Finished Evaluations ({len(finished_eval_queue_df)})",

         interactive=False,
     )
+all_submissions = []
 demo = gr.Blocks(css=custom_css)
 with demo:
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")
         with gr.TabItem("🚀 Submit here! ", elem_id="llm-benchmark-tab-table", id=3):
             with gr.Column():
                 with gr.Row():
                 link_input = gr.Textbox(label="Link (str)", placeholder="请输入链接")
+                submit_button = gr.Button("Submit One Eval")
+                submit_all_button = gr.Button("Submit All")
+            submission_result = gr.Markdown("## Submited results")
+            def submit_eval(score, name, base_model, env, target_research, subset, link):
+                # 处理单条数据提交
+                result = {
+                    "Score": score,
+                    "Name": name,
+                    "BaseModel": base_model,
+                    "Env": env,
+                    "Target-research": target_research,
+                    "Subset": subset,
+                    "Link": link,
+                    "State": "Checking"
+                }
+                # 将结果添加到全局变量中
+                all_submissions.append(result)
+                # 更新页面展示
+                display_text = "\n".join([json.dumps(submission) for submission in all_submissions])
+                return display_text
+            def submit_all():
+                # 将所有结果一次性上传
+                out_path = "test-output.json"
+                with open(out_path, "w") as f:
+                    f.write(json.dumps(all_submissions))
+                print("Uploading eval file")
+                API.upload_file(
+                    path_or_fileobj=out_path,
+                    path_in_repo=out_path,
+                    repo_id="microsoft/MageBench-Leaderboard",
+                    repo_type="space",
+                    commit_message=f"Add submissions to checking queue",
                 )
+                all_submissions = []
+                return "All submissions uploaded successfully!"
+            # 单条数据提交按钮点击事件
+            submit_button.click(
+                submit_eval,
+                [score_input, name_input, base_model_input, env_dropdown, target_research_dropdown, subset_dropdown, link_input],
+                submission_result
+            )
+            # 所有数据提交按钮点击事件
+            submit_all_button.click(
+                submit_all,
+                inputs=[],
+                outputs=submission_result
+            )
             #     with gr.Column():
             #         with gr.Accordion(
             #             f"✅ Finished Evaluations ({len(finished_eval_queue_df)})",