Spaces:

sirochild
/

mari-chat-3

Runtime error

App Files Files Community

sirochild commited on Aug 16

Commit

90babcf

verified ·

1 Parent(s): 1224dcb

Upload core_dialogue.py

Browse files

Files changed (1) hide show

core_dialogue.py +110 -22

core_dialogue.py CHANGED Viewed

@@ -16,7 +16,10 @@ class DialogueGenerator:
     def __init__(self):
         self.client = None
         self.model = None
         self._initialize_client()
     def _initialize_client(self):
         """Together.ai APIクライアントの初期化"""
@@ -35,6 +38,23 @@ class DialogueGenerator:
         except Exception as e:
             logger.error(f"Together.ai APIクライアントの初期化に失敗しました: {e}")
     def get_system_prompt_mari(self, use_ura_mode: bool = False) -> str:
         """環境変数からシステムプロンプトを取得、なければデフォルトを返す"""
         if use_ura_mode:
@@ -90,16 +110,9 @@ class DialogueGenerator:
         return os.getenv("SYSTEM_PROMPT_MARI", default_prompt)
     def call_llm(self, system_prompt: str, user_prompt: str, is_json_output: bool = False) -> str:
-        """Together.ai APIを呼び出す"""
         logger.info(f"🔗 call_llm開始 - is_json_output: {is_json_output}")
-        if not self.client:
-            logger.warning("⚠️ APIクライアントが利用できません - デモモード応答を返します")
-            # デモモード用の固定応答（隠された真実付き）
-            if is_json_output:
-                return '{"scene": "none"}'
-            return "[HIDDEN:（本当は話したいけど...）]は？何それ。あたしに話しかけてるの？"
         # 入力検証
         if not isinstance(system_prompt, str) or not isinstance(user_prompt, str):
             logger.error(f"プロンプトが文字列ではありません: system={type(system_prompt)}, user={type(user_prompt)}")
@@ -107,41 +120,116 @@ class DialogueGenerator:
                 return '{"scene": "none"}'
             return "…なんか変なこと言ってない？"
         try:
-            # Together.ai APIを呼び出し
             # JSON出力の場合は短く、通常の対話は適度な長さに制限
             max_tokens = 150 if is_json_output else 500
             logger.info(f"🔗 Together.ai API呼び出し開始 - model: {self.model}, max_tokens: {max_tokens}")
-            response = self.client.chat.completions.create(
-                model=self.model,
                 messages=[
                     {"role": "system", "content": system_prompt},
                     {"role": "user", "content": user_prompt}
                 ],
                 temperature=0.8,
                 max_tokens=max_tokens,
             )
-            logger.info("🔗 Together.ai API呼び出し完了")
             content = response.choices[0].message.content if response.choices else ""
-            logger.info(f"🔗 API応答内容: '{content[:100]}...' (長さ: {len(content)}文字)")
             if not content:
-                logger.warning("Together.ai API応答が空です")
-                if is_json_output:
-                    return '{"scene": "none"}'
-                return "[HIDDEN:（何て言えばいいか分からない...）]…言葉が出てこない。"
-            logger.info("🔗 call_llm正常完了")
             return content
         except Exception as e:
-            logger.error(f"Together.ai API呼び出しエラー: {e}")
-            if is_json_output:
-                return '{"scene": "none"}'
-            return "[HIDDEN:（システムが不調で困ってる...）]…システムの調子が悪いみたい。"
     def generate_dialogue(self, history: List[Tuple[str, str]], message: str,
                          affection: int, stage_name: str, scene_params: Dict[str, Any],

     def __init__(self):
         self.client = None
         self.model = None
+        self.groq_client = None
+        self.groq_model = None
         self._initialize_client()
+        self._initialize_groq_client()
     def _initialize_client(self):
         """Together.ai APIクライアントの初期化"""
         except Exception as e:
             logger.error(f"Together.ai APIクライアントの初期化に失敗しました: {e}")
+    def _initialize_groq_client(self):
+        """Groq APIクライアントの初期化（フォールバック用）"""
+        try:
+            groq_api_key = os.getenv("GROQ_API_KEY")
+            if not groq_api_key:
+                logger.warning("環境変数 GROQ_API_KEY が設定されていません。Groqフォールバックは利用できません。")
+                return
+            self.groq_client = OpenAI(
+                api_key=groq_api_key,
+                base_url="https://api.groq.com/openai/v1"
+            )
+            self.groq_model = "llama-3.1-70b-versatile"
+            logger.info("Groq APIクライアントの初期化が完了しました（フォールバック用）。")
+        except Exception as e:
+            logger.error(f"Groq APIクライアントの初期化に失敗しました: {e}")
     def get_system_prompt_mari(self, use_ura_mode: bool = False) -> str:
         """環境変数からシステムプロンプトを取得、なければデフォルトを返す"""
         if use_ura_mode:
         return os.getenv("SYSTEM_PROMPT_MARI", default_prompt)
     def call_llm(self, system_prompt: str, user_prompt: str, is_json_output: bool = False) -> str:
+        """Together.ai APIを呼び出し、15秒でタイムアウトした場合はGroq APIにフォールバック"""
         logger.info(f"🔗 call_llm開始 - is_json_output: {is_json_output}")
         # 入力検証
         if not isinstance(system_prompt, str) or not isinstance(user_prompt, str):
             logger.error(f"プロンプトが文字列ではありません: system={type(system_prompt)}, user={type(user_prompt)}")
                 return '{"scene": "none"}'
             return "…なんか変なこと言ってない？"
+        # まずTogether.ai APIを試行
+        together_result = self._call_together_api(system_prompt, user_prompt, is_json_output)
+        if together_result is not None:
+            return together_result
+        # Together.ai APIが失敗した場合、Groq APIにフォールバック
+        logger.warning("🔄 Together.ai APIが失敗、Groq APIにフォールバック")
+        groq_result = self._call_groq_api(system_prompt, user_prompt, is_json_output)
+        if groq_result is not None:
+            return groq_result
+        # 両方のAPIが失敗した場合のデモモード応答
+        logger.error("⚠️ 全てのAPIが利用できません - デモモード応答を返します")
+        if is_json_output:
+            return '{"scene": "none"}'
+        return "[HIDDEN:（本当は話したいけど...）]は？何それ。あたしに話しかけてるの？"
+    def _call_together_api(self, system_prompt: str, user_prompt: str, is_json_output: bool = False) -> Optional[str]:
+        """Together.ai APIを15秒タイムアウトで呼び出し（Windows対応）"""
+        if not self.client:
+            logger.warning("⚠️ Together.ai APIクライアントが利用できません")
+            return None
         try:
+            import time
+            import threading
+            from concurrent.futures import ThreadPoolExecutor, TimeoutError as FutureTimeoutError
             # JSON出力の場合は短く、通常の対話は適度な長さに制限
             max_tokens = 150 if is_json_output else 500
             logger.info(f"🔗 Together.ai API呼び出し開始 - model: {self.model}, max_tokens: {max_tokens}")
+            start_time = time.time()
+            def api_call():
+                """API呼び出しを別スレッドで実行"""
+                return self.client.chat.completions.create(
+                    model=self.model,
+                    messages=[
+                        {"role": "system", "content": system_prompt},
+                        {"role": "user", "content": user_prompt}
+                    ],
+                    temperature=0.8,
+                    max_tokens=max_tokens,
+                    timeout=15  # APIレベルでも15秒タイムアウト
+                )
+            # ThreadPoolExecutorを使用して15秒タイムアウトを実装
+            with ThreadPoolExecutor(max_workers=1) as executor:
+                future = executor.submit(api_call)
+                try:
+                    response = future.result(timeout=15)  # 15秒タイムアウト
+                    elapsed_time = time.time() - start_time
+                    logger.info(f"🔗 Together.ai API呼び出し完了 ({elapsed_time:.2f}秒)")
+                    content = response.choices[0].message.content if response.choices else ""
+                    logger.info(f"🔗 Together.ai API応答内容: '{content[:100]}...' (長さ: {len(content)}文字)")
+                    if not content:
+                        logger.warning("Together.ai API応答が空です")
+                        return None
+                    return content
+                except FutureTimeoutError:
+                    elapsed_time = time.time() - start_time
+                    logger.warning(f"⏰ Together.ai API呼び出しタイムアウト ({elapsed_time:.2f}秒)")
+                    return None
+        except Exception as e:
+            logger.error(f"Together.ai API呼び出しエラー: {e}")
+            return None
+    def _call_groq_api(self, system_prompt: str, user_prompt: str, is_json_output: bool = False) -> Optional[str]:
+        """Groq APIを呼び出し（フォールバック用）"""
+        if not self.groq_client:
+            logger.warning("⚠️ Groq APIクライアントが利用できません")
+            return None
+        try:
+            # JSON出力の場合は短く、通常の対話は適度な長さに制限
+            max_tokens = 150 if is_json_output else 500
+            logger.info(f"🔄 Groq API呼び出し開始 - model: {self.groq_model}, max_tokens: {max_tokens}")
+            response = self.groq_client.chat.completions.create(
+                model=self.groq_model,
                 messages=[
                     {"role": "system", "content": system_prompt},
                     {"role": "user", "content": user_prompt}
                 ],
                 temperature=0.8,
                 max_tokens=max_tokens,
+                timeout=10  # Groqは10秒タイムアウト
             )
+            logger.info("🔄 Groq API呼び出し完了")
             content = response.choices[0].message.content if response.choices else ""
+            logger.info(f"🔄 Groq API応答内容: '{content[:100]}...' (長さ: {len(content)}文字)")
             if not content:
+                logger.warning("Groq API応答が空です")
+                return None
             return content
         except Exception as e:
+            logger.error(f"Groq API呼び出しエラー: {e}")
+            return None
     def generate_dialogue(self, history: List[Tuple[str, str]], message: str,
                          affection: int, stage_name: str, scene_params: Dict[str, Any],