Spaces:

huggingface
/

inference-playground

Running on CPU Upgrade

App Files Files Community

mishig HF Staff commited on Jul 23, 2024

Commit

b61328c

1 Parent(s): af961f3

System message as part of Conversation

Browse files

Files changed (3) hide show

src/lib/components/InferencePlayground/InferencePlayground.svelte +10 -10
src/lib/components/InferencePlayground/inferencePlaygroundUtils.ts +8 -8
src/lib/components/InferencePlayground/types.ts +1 -0

src/lib/components/InferencePlayground/InferencePlayground.svelte CHANGED Viewed

@@ -20,16 +20,17 @@
 	export let models: ModelEntryWithTokenizer[];
-	const startMessage: ChatCompletionInputMessage = { role: "user", content: "" };
 	let conversation: Conversation = {
 		model: models[0],
 		config: defaultGenerationConfig,
-		messages: [{ ...startMessage }],
 		streaming: true,
 	};
-	let systemMessage: ChatCompletionInputMessage = { role: "system", content: "" };
 	let hfToken: string | undefined = import.meta.env.VITE_HF_TOKEN;
 	let viewCode = false;
 	let showTokenModal = false;
@@ -41,7 +42,7 @@
 	$: systemPromptSupported = isSystemPromptSupported(conversation.model);
 	$: {
 		if (!systemPromptSupported) {
-			systemMessage = { role: "system", content: "" };
 		}
 	}
@@ -61,8 +62,8 @@
 	}
 	function reset() {
-		systemMessage.content = "";
-		conversation.messages = [{ ...startMessage }];
 	}
 	function abort() {
@@ -98,12 +99,11 @@
 							conversation.messages = [...conversation.messages];
 						}
 					},
-					abortController,
-					systemMessage
 				);
 			} else {
 				waitForNonStreaming = true;
-				const newMessage = await handleNonStreamingResponse(hf, conversation, systemMessage);
 				// check if the user did not abort the request
 				if (waitForNonStreaming) {
 					conversation.messages = [...conversation.messages, newMessage];
@@ -162,7 +162,7 @@
 				placeholder={systemPromptSupported
 					? "Enter a custom prompt"
 					: "System prompt is not supported with the chosen model."}
-				bind:value={systemMessage.content}
 				class="absolute inset-x-0 bottom-0 h-full resize-none bg-transparent px-3 pt-10 text-sm outline-none"
 			></textarea>
 		</div>

 	export let models: ModelEntryWithTokenizer[];
+	const startMessageUser: ChatCompletionInputMessage = { role: "user", content: "" };
+	const startMessageSystem: ChatCompletionInputMessage = { role: "system", content: "" };
 	let conversation: Conversation = {
 		model: models[0],
 		config: defaultGenerationConfig,
+		messages: [{ ...startMessageUser }],
+		systemMessage: startMessageSystem,
 		streaming: true,
 	};
 	let hfToken: string | undefined = import.meta.env.VITE_HF_TOKEN;
 	let viewCode = false;
 	let showTokenModal = false;
 	$: systemPromptSupported = isSystemPromptSupported(conversation.model);
 	$: {
 		if (!systemPromptSupported) {
+			conversation.systemMessage = { role: "system", content: "" };
 		}
 	}
 	}
 	function reset() {
+		conversation.systemMessage.content = "";
+		conversation.messages = [{ ...startMessageUser }];
 	}
 	function abort() {
 							conversation.messages = [...conversation.messages];
 						}
 					},
+					abortController
 				);
 			} else {
 				waitForNonStreaming = true;
+				const newMessage = await handleNonStreamingResponse(hf, conversation);
 				// check if the user did not abort the request
 				if (waitForNonStreaming) {
 					conversation.messages = [...conversation.messages, newMessage];
 				placeholder={systemPromptSupported
 					? "Enter a custom prompt"
 					: "System prompt is not supported with the chosen model."}
+				bind:value={conversation.systemMessage.content}
 				class="absolute inset-x-0 bottom-0 h-full resize-none bg-transparent px-3 pt-10 text-sm outline-none"
 			></textarea>
 		</div>

src/lib/components/InferencePlayground/inferencePlaygroundUtils.ts CHANGED Viewed

@@ -11,17 +11,17 @@ export async function handleStreamingResponse(
 	hf: HfInference,
 	conversation: Conversation,
 	onChunk: (content: string) => void,
-	abortController: AbortController,
-	systemMessage?: ChatCompletionInputMessage
 ): Promise<void> {
 	const messages = [
-		...(isSystemPromptSupported(conversation.model) && systemMessage?.content?.length ? [systemMessage] : []),
 		...conversation.messages,
 	];
 	let out = "";
 	for await (const chunk of hf.chatCompletionStream(
 		{
-			model: conversation.model.id,
 			messages,
 			temperature: conversation.config.temperature,
 			max_tokens: conversation.config.maxTokens,
@@ -37,16 +37,16 @@ export async function handleStreamingResponse(
 export async function handleNonStreamingResponse(
 	hf: HfInference,
-	conversation: Conversation,
-	systemMessage?: ChatCompletionInputMessage
 ): Promise<ChatCompletionInputMessage> {
 	const messages = [
-		...(isSystemPromptSupported(conversation.model) && systemMessage?.content?.length ? [systemMessage] : []),
 		...conversation.messages,
 	];
 	const response = await hf.chatCompletion({
-		model: conversation.model,
 		messages,
 		temperature: conversation.config.temperature,
 		max_tokens: conversation.config.maxTokens,

 	hf: HfInference,
 	conversation: Conversation,
 	onChunk: (content: string) => void,
+	abortController: AbortController
 ): Promise<void> {
+	const { model, systemMessage } = conversation;
 	const messages = [
+		...(isSystemPromptSupported(model) && systemMessage.content?.length ? [systemMessage] : []),
 		...conversation.messages,
 	];
 	let out = "";
 	for await (const chunk of hf.chatCompletionStream(
 		{
+			model: model.id,
 			messages,
 			temperature: conversation.config.temperature,
 			max_tokens: conversation.config.maxTokens,
 export async function handleNonStreamingResponse(
 	hf: HfInference,
+	conversation: Conversation
 ): Promise<ChatCompletionInputMessage> {
+	const { model, systemMessage } = conversation;
 	const messages = [
+		...(isSystemPromptSupported(model) && systemMessage.content?.length ? [systemMessage] : []),
 		...conversation.messages,
 	];
 	const response = await hf.chatCompletion({
+		model: model.id,
 		messages,
 		temperature: conversation.config.temperature,
 		max_tokens: conversation.config.maxTokens,

src/lib/components/InferencePlayground/types.ts CHANGED Viewed

@@ -6,6 +6,7 @@ export type Conversation = {
 	model: ModelEntryWithTokenizer;
 	config: GenerationConfig;
 	messages: ChatCompletionInputMessage[];
 	streaming: boolean;
 };

 	model: ModelEntryWithTokenizer;
 	config: GenerationConfig;
 	messages: ChatCompletionInputMessage[];
+	systemMessage: ChatCompletionInputMessage;
 	streaming: boolean;
 };