Spaces:
Sleeping
Sleeping
| from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings | |
| from llama_index.embeddings.huggingface import HuggingFaceEmbedding | |
| from llama_index.llms.huggingface import HuggingFaceLLM | |
| #初始化一个HuggingFaceEmbedding对象,用于将文本转换为向量表示 | |
| embed_model = HuggingFaceEmbedding( | |
| #指定了一个预训练的sentence-transformer模型的路径 | |
| model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2" | |
| ) | |
| #将创建的嵌入模型赋值给全局设置的embed_model属性, | |
| #这样在后续的索引构建过程中就会使用这个模型。 | |
| Settings.embed_model = embed_model | |
| llm = HuggingFaceLLM( | |
| model_name="internlm/internlm2_5-1_8b-chat", | |
| tokenizer_name="internlm/internlm2_5-1_8b-chat", | |
| model_kwargs={"trust_remote_code":True}, | |
| tokenizer_kwargs={"trust_remote_code":True} | |
| ) | |
| #设置全局的llm属性,这样在索引查询时会使用这个模型。 | |
| Settings.llm = llm | |
| #从指定目录读取所有文档,并加载数据到内存中 | |
| documents = SimpleDirectoryReader(input_dir="./data").load_data() | |
| #创建一个VectorStoreIndex,并使用之前加载的文档来构建索引。 | |
| # 此索引将文档转换为向量,并存储这些向量以便于快速检索。 | |
| index = VectorStoreIndex.from_documents(documents) | |
| # 创建一个查询引擎,这个引擎可以接收查询并返回相关文档的响应。 | |
| query_engine = index.as_query_engine() | |
| response = query_engine.query("xtuner是什么?") | |
| print(response) |