Spaces:

souljoy
/

ChatPDF

Runtime error

App Files Files Community

souljoy commited on Sep 14, 2023

Commit

5d931dc

1 Parent(s): 959d09a

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -6

app.py CHANGED Viewed

@@ -8,11 +8,13 @@ from cnocr import CnOcr
 import numpy as np
 import openai
 from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, Prompt
 ocr = CnOcr()  # 初始化ocr模型
 history_max_len = 500  # 机器人记忆的最大长度
 all_max_len = 2000  # 输入的最大长度
 def get_text_emb(open_ai_key, text):  # 文本向量化
     openai.api_key = open_ai_key  # 设置openai的key
@@ -29,7 +31,8 @@ def doc_index_self(open_ai_key, doc):  # 文档向量化
     for text in texts:  # 遍历每一行
         emb_list.append(get_text_emb(open_ai_key, text))  # 获取向量
     return texts, emb_list, gr.Textbox.update(visible=True), gr.Button.update(visible=True), gr.Markdown.update(
-        value="""操作说明 step 3：建立索引（by self）成功！ 🙋 可以开始对话啦~"""), gr.Chatbot.update(visible=True), 1
 def doc_index_llama(open_ai_key, txt):  # 建立索引
@@ -53,7 +56,8 @@ def doc_index_llama(open_ai_key, txt):  # 建立索引
     qa_template = Prompt(template)  # 将模板转换成Prompt对象
     query_engine = index.as_query_engine(text_qa_template=qa_template)  # 建立查询引擎
     return query_engine, gr.Textbox.update(visible=True), gr.Button.update(visible=True), gr.Markdown.update(
-        value="""操作说明 step 3：建立索引（by llama_index）成功！ 🙋 可以开始对话啦~"""), gr.Chatbot.update(visible=True), 0
 def get_response_by_self(open_ai_key, msg, bot, doc_text_list, doc_embeddings):  # 获取机器人回复
@@ -181,6 +185,20 @@ def up_file(files):  # 上传文件
         value="操作说明 step 2：确认PDF解析结果（可修正），点击“建立索引”，随后进行对话")
 with gr.Blocks() as demo:
     with gr.Row():
         with gr.Column():
@@ -198,14 +216,17 @@ with gr.Blocks() as demo:
         with gr.Column():
             md = gr.Markdown("""操作说明 step 1：点击左侧区域，上传PDF，进行解析""")  # 操作说明
             chat_bot = gr.Chatbot(visible=False)  # 聊天机器人
-            msg_txt = gr.Textbox(label='消息框', placeholder='输入消息，点击发送', visible=False)  # 消息框
             chat_bu = gr.Button(value='发送', visible=False)  # 发送按钮
     file.change(up_file, [file], [txt, index_self_bu, index_llama_bu, md])  # 上传文件
     index_self_bu.click(doc_index_self, [open_ai_key, txt],
-                        [doc_text_state, doc_emb_state, msg_txt, chat_bu, md, chat_bot, index_type])  # 提交解析结果
     index_llama_bu.click(doc_index_llama, [open_ai_key, txt],
-                         [query_engine, msg_txt, chat_bu, md, chat_bot, index_type])  # 提交解析结果
     chat_bu.click(get_response,
                   [open_ai_key, msg_txt, chat_bot, doc_text_state, doc_emb_state, query_engine, index_type],
                   [chat_bot])  # 发送消息

 import numpy as np
 import openai
 from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, Prompt
+from transformers import pipeline
 ocr = CnOcr()  # 初始化ocr模型
 history_max_len = 500  # 机器人记忆的最大长度
 all_max_len = 2000  # 输入的最大长度
+asr_model_id = "souljoy/whisper-tiny"  # 更新为你的模型ID
+asr_pipe = pipeline("automatic-speech-recognition", model=asr_model_id)
 def get_text_emb(open_ai_key, text):  # 文本向量化
     openai.api_key = open_ai_key  # 设置openai的key
     for text in texts:  # 遍历每一行
         emb_list.append(get_text_emb(open_ai_key, text))  # 获取向量
     return texts, emb_list, gr.Textbox.update(visible=True), gr.Button.update(visible=True), gr.Markdown.update(
+        value="""操作说明 step 3：建立索引（by self）成功！ 🙋 可以开始对话啦~"""), gr.Chatbot.update(visible=True), 1, gr.Audio.update(
+        visible=True)
 def doc_index_llama(open_ai_key, txt):  # 建立索引
     qa_template = Prompt(template)  # 将模板转换成Prompt对象
     query_engine = index.as_query_engine(text_qa_template=qa_template)  # 建立查询引擎
     return query_engine, gr.Textbox.update(visible=True), gr.Button.update(visible=True), gr.Markdown.update(
+        value="""操作说明 step 3：建立索引（by llama_index）成功！ 🙋 可以开始对话啦~"""), gr.Chatbot.update(
+        visible=True), 0, gr.Audio.update(visible=True)
 def get_response_by_self(open_ai_key, msg, bot, doc_text_list, doc_embeddings):  # 获取机器人回复
         value="操作说明 step 2：确认PDF解析结果（可修正），点击“建立索引”，随后进行对话")
+def transcribe_speech(filepath):
+    output = asr_pipe(
+        filepath,
+        max_new_tokens=256,
+        generate_kwargs={
+            "task": "transcribe",
+            "language": "chinese",
+        },  # 更新为你微调的语言
+        chunk_length_s=30,
+        batch_size=8,
+    )
+    return output["text"]
 with gr.Blocks() as demo:
     with gr.Row():
         with gr.Column():
         with gr.Column():
             md = gr.Markdown("""操作说明 step 1：点击左侧区域，上传PDF，进行解析""")  # 操作说明
             chat_bot = gr.Chatbot(visible=False)  # 聊天机器人
+            audio_inputs = gr.Audio(source="microphone", type="filepath", label="点击录音输入", visible=False)  # 录音输入
+            msg_txt = gr.Textbox(label='消息框', placeholder='输入消息', visible=False)  # 消息框
             chat_bu = gr.Button(value='发送', visible=False)  # 发送按钮
     file.change(up_file, [file], [txt, index_self_bu, index_llama_bu, md])  # 上传文件
     index_self_bu.click(doc_index_self, [open_ai_key, txt],
+                        [doc_text_state, doc_emb_state, msg_txt, chat_bu, md, chat_bot, index_type,
+                         audio_inputs])  # 提交解析结果
     index_llama_bu.click(doc_index_llama, [open_ai_key, txt],
+                         [query_engine, msg_txt, chat_bu, md, chat_bot, index_type, audio_inputs])  # 提交解析结果
+    audio_inputs.change(transcribe_speech, [audio_inputs], [msg_txt])  # 录音输入
     chat_bu.click(get_response,
                   [open_ai_key, msg_txt, chat_bot, doc_text_state, doc_emb_state, query_engine, index_type],
                   [chat_bot])  # 发送消息