Spaces:

sakaltcommunity
/

Traningafri

Sleeping

Sakalti commited on Nov 12, 2024

Commit

cfd58cc

verified ·

1 Parent(s): 4012ee4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 # 必要なライブラリをインストールしておいてください
-# pip install streamlit transformers torch huggingface_hub
 import streamlit as st
 from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
@@ -30,10 +30,10 @@ if st.button("トレーニング開始"):
         model = AutoModelForCausalLM.from_pretrained(model_name)
         tokenizer = AutoTokenizer.from_pretrained(model_name)
-        # データセットの準備
         st.write("データセットのロード中...")
         from datasets import load_dataset
-        dataset = load_dataset(dataset_name, split="swahili")
         # トレーニング用のデータセットの準備
         def tokenize_function(examples):

 # 必要なライブラリをインストールしておいてください
+# pip install streamlit transformers torch huggingface_hub datasets
 import streamlit as st
 from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
         model = AutoModelForCausalLM.from_pretrained(model_name)
         tokenizer = AutoTokenizer.from_pretrained(model_name)
+        # データセットの準備（スワヒリ語）
         st.write("データセットのロード中...")
         from datasets import load_dataset
+        dataset = load_dataset(dataset_name, 'swahili', split="train")  # 言語を指定
         # トレーニング用のデータセットの準備
         def tokenize_function(examples):