pluralchat

Running on Inf2

App Files Files Community

nsarrazin

victor HF Staff Mishig commited on Mar 27, 2024

Commit

4e43408

unverified ·

1 Parent(s): 0e4a83d

Expose sampling controls in assistants (#955) (#959)

Browse files

* Expose sampling controls in assistants (#955)

* Make sure all labels have the same font size

* styling

* Add better tooltips

* better padding & wrapping

* Revert "better padding & wrapping"

This reverts commit 1b44086465040f2cb6bc906983cfc8d95820d6fe.

* ui update

* tooltip on mobile

* lint

* Update src/lib/components/AssistantSettings.svelte

Co-authored-by: Mishig <mishig.davaadorj@coloradocollege.edu>

---------

Co-authored-by: Victor Mustar <victor.mustar@gmail.com>
Co-authored-by: Mishig <mishig.davaadorj@coloradocollege.edu>

Files changed (13) hide show

src/lib/components/AssistantSettings.svelte +128 -17
src/lib/components/HoverTooltip.svelte +12 -0
src/lib/server/endpoints/anthropic/endpointAnthropic.ts +9 -6
src/lib/server/endpoints/aws/endpointAws.ts +2 -2
src/lib/server/endpoints/endpoints.ts +2 -0
src/lib/server/endpoints/llamacpp/endpointLlamacpp.ts +9 -7
src/lib/server/endpoints/ollama/endpointOllama.ts +9 -7
src/lib/server/endpoints/openai/endpointOai.ts +16 -12
src/lib/server/endpoints/tgi/endpointTgi.ts +2 -2
src/lib/types/Assistant.ts +6 -0
src/routes/conversation/[id]/+server.ts +10 -3
src/routes/settings/(nav)/assistants/[assistantId]/edit/+page.server.ts +20 -0
src/routes/settings/(nav)/assistants/new/+page.server.ts +20 -0

src/lib/components/AssistantSettings.svelte CHANGED Viewed

@@ -9,11 +9,14 @@
 	import { base } from "$app/paths";
 	import CarbonPen from "~icons/carbon/pen";
 	import CarbonUpload from "~icons/carbon/upload";
 	import { useSettingsStore } from "$lib/stores/settings";
 	import { isHuggingChat } from "$lib/utils/isHuggingChat";
 	import IconInternet from "./icons/IconInternet.svelte";
 	import TokensCounter from "./TokensCounter.svelte";
 	type ActionData = {
 		error: boolean;
@@ -31,16 +34,22 @@
 	let files: FileList | null = null;
 	const settings = useSettingsStore();
-	let modelId =
-		assistant?.modelId ?? models.find((_model) => _model.id === $settings.activeModel)?.name;
 	let systemPrompt = assistant?.preprompt ?? "";
 	let dynamicPrompt = assistant?.dynamicPrompt ?? false;
 	let compress: typeof readAndCompressImage | null = null;
 	onMount(async () => {
 		const module = await import("browser-image-resizer");
 		compress = module.readAndCompressImage;
 	});
 	let inputMessage1 = assistant?.exampleInputs[0] ?? "";
@@ -89,11 +98,12 @@
 	const regex = /{{\s?url=(.+?)\s?}}/g;
 	$: templateVariables = [...systemPrompt.matchAll(regex)].map((match) => match[1]);
 </script>
 <form
 	method="POST"
-	class="flex h-full flex-col overflow-y-auto p-4 md:p-8"
 	enctype="multipart/form-data"
 	use:enhance={async ({ formData }) => {
 		loading = true;
@@ -246,21 +256,122 @@
 			<label>
 				<div class="mb-1 font-semibold">Model</div>
-				<select
-					name="modelId"
-					class="w-full rounded-lg border-2 border-gray-200 bg-gray-100 p-2"
-					bind:value={modelId}
 				>
-					{#each models.filter((model) => !model.unlisted) as model}
-						<option
-							value={model.id}
-							selected={assistant
-								? assistant?.modelId === model.id
-								: $settings.activeModel === model.id}>{model.displayName}</option
-						>
-					{/each}
-					<p class="text-xs text-red-500">{getError("modelId", form)}</p>
-				</select>
 			</label>
 			<label>

 	import { base } from "$app/paths";
 	import CarbonPen from "~icons/carbon/pen";
 	import CarbonUpload from "~icons/carbon/upload";
+	import CarbonHelpFilled from "~icons/carbon/help";
+	import CarbonSettingsAdjust from "~icons/carbon/settings-adjust";
 	import { useSettingsStore } from "$lib/stores/settings";
 	import { isHuggingChat } from "$lib/utils/isHuggingChat";
 	import IconInternet from "./icons/IconInternet.svelte";
 	import TokensCounter from "./TokensCounter.svelte";
+	import HoverTooltip from "./HoverTooltip.svelte";
 	type ActionData = {
 		error: boolean;
 	let files: FileList | null = null;
 	const settings = useSettingsStore();
+	let modelId = "";
 	let systemPrompt = assistant?.preprompt ?? "";
 	let dynamicPrompt = assistant?.dynamicPrompt ?? false;
+	let showModelSettings = Object.values(assistant?.generateSettings ?? {}).some((v) => !!v);
 	let compress: typeof readAndCompressImage | null = null;
 	onMount(async () => {
 		const module = await import("browser-image-resizer");
 		compress = module.readAndCompressImage;
+		if (assistant) {
+			modelId = assistant.modelId;
+		} else {
+			modelId = models.find((model) => model.id === $settings.activeModel)?.id ?? models[0].id;
+		}
 	});
 	let inputMessage1 = assistant?.exampleInputs[0] ?? "";
 	const regex = /{{\s?url=(.+?)\s?}}/g;
 	$: templateVariables = [...systemPrompt.matchAll(regex)].map((match) => match[1]);
+	$: selectedModel = models.find((m) => m.id === modelId);
 </script>
 <form
 	method="POST"
+	class="relative flex h-full flex-col overflow-y-auto p-4 md:p-8"
 	enctype="multipart/form-data"
 	use:enhance={async ({ formData }) => {
 		loading = true;
 			<label>
 				<div class="mb-1 font-semibold">Model</div>
+				<div class="flex gap-2">
+					<select
+						name="modelId"
+						class="w-full rounded-lg border-2 border-gray-200 bg-gray-100 p-2"
+						bind:value={modelId}
+					>
+						{#each models.filter((model) => !model.unlisted) as model}
+							<option value={model.id}>{model.displayName}</option>
+						{/each}
+						<p class="text-xs text-red-500">{getError("modelId", form)}</p>
+					</select>
+					<button
+						type="button"
+						class="flex aspect-square items-center gap-2 whitespace-nowrap rounded-lg border px-3 {showModelSettings
+							? 'border-blue-500/20 bg-blue-50 text-blue-600'
+							: ''}"
+						on:click={() => (showModelSettings = !showModelSettings)}
+						><CarbonSettingsAdjust class="text-xs" /></button
+					>
+				</div>
+				<div
+					class="mt-2 rounded-lg border border-blue-500/20 bg-blue-500/5 px-2 py-0.5"
+					class:hidden={!showModelSettings}
 				>
+					<p class="text-xs text-red-500">{getError("inputMessage1", form)}</p>
+					<div class="my-2 grid grid-cols-1 gap-2.5 sm:grid-cols-2 sm:grid-rows-2">
+						<label for="temperature" class="flex justify-between">
+							<span class="m-1 ml-0 flex items-center gap-1.5 whitespace-nowrap text-sm">
+								Temperature
+								<HoverTooltip
+									label="Temperature: Controls creativity, higher values allow more variety."
+								>
+									<CarbonHelpFilled
+										class="inline text-xxs text-gray-500 group-hover/tooltip:text-blue-600"
+									/>
+								</HoverTooltip>
+							</span>
+							<input
+								type="number"
+								name="temperature"
+								min="0.1"
+								max="2"
+								step="0.1"
+								class="w-20 rounded-lg border-2 border-gray-200 bg-gray-100 px-2 py-1"
+								placeholder={selectedModel?.parameters?.temperature?.toString() ?? "1"}
+								value={assistant?.generateSettings?.temperature ?? ""}
+							/>
+						</label>
+						<label for="top_p" class="flex justify-between">
+							<span class="m-1 ml-0 flex items-center gap-1.5 whitespace-nowrap text-sm">
+								Top P
+								<HoverTooltip
+									label="Top P: Sets word choice boundaries, lower values tighten focus."
+								>
+									<CarbonHelpFilled
+										class="inline text-xxs text-gray-500 group-hover/tooltip:text-blue-600"
+									/>
+								</HoverTooltip>
+							</span>
+							<input
+								type="number"
+								name="top_p"
+								class="w-20 rounded-lg border-2 border-gray-200 bg-gray-100 px-2 py-1"
+								min="0.05"
+								max="1"
+								step="0.05"
+								placeholder={selectedModel?.parameters?.top_p?.toString() ?? "1"}
+								value={assistant?.generateSettings?.top_p ?? ""}
+							/>
+						</label>
+						<label for="repetition_penalty" class="flex justify-between">
+							<span class="m-1 ml-0 flex items-center gap-1.5 whitespace-nowrap text-sm">
+								Repetition penalty
+								<HoverTooltip
+									label="Repetition penalty: Prevents reuse, higher values decrease repetition."
+								>
+									<CarbonHelpFilled
+										class="inline text-xxs text-gray-500 group-hover/tooltip:text-blue-600"
+									/>
+								</HoverTooltip>
+							</span>
+							<input
+								type="number"
+								name="repetition_penalty"
+								min="0.1"
+								max="2"
+								class="w-20 rounded-lg border-2 border-gray-200 bg-gray-100 px-2 py-1"
+								placeholder={selectedModel?.parameters?.repetition_penalty?.toString() ?? "1.0"}
+								value={assistant?.generateSettings?.repetition_penalty ?? ""}
+							/>
+						</label>
+						<label for="top_k" class="flex justify-between">
+							<span class="m-1 ml-0 flex items-center gap-1.5 whitespace-nowrap text-sm">
+								Top K <HoverTooltip
+									label="Top K: Restricts word options, lower values for predictability."
+								>
+									<CarbonHelpFilled
+										class="inline text-xxs text-gray-500 group-hover/tooltip:text-blue-600"
+									/>
+								</HoverTooltip>
+							</span>
+							<input
+								type="number"
+								name="top_k"
+								min="5"
+								max="100"
+								step="5"
+								class="w-20 rounded-lg border-2 border-gray-200 bg-gray-100 px-2 py-1"
+								placeholder={selectedModel?.parameters?.top_k?.toString() ?? "50"}
+								value={assistant?.generateSettings?.top_k ?? ""}
+							/>
+						</label>
+					</div>
+				</div>
 			</label>
 			<label>

src/lib/components/HoverTooltip.svelte ADDED Viewed

	@@ -0,0 +1,12 @@

+<script lang="ts">
+	export let label = "";
+</script>
+<div class="group/tooltip md:relative">
+	<slot />
+	<div
+		class="invisible absolute z-10 w-64 whitespace-normal rounded-md bg-black p-2 text-center text-white group-hover/tooltip:visible group-active/tooltip:visible max-sm:left-1/2 max-sm:-translate-x-1/2"
+	>
+		{label}
+	</div>
+</div>

src/lib/server/endpoints/anthropic/endpointAnthropic.ts CHANGED Viewed

@@ -32,7 +32,7 @@ export async function endpointAnthropic(
 		defaultQuery,
 	});
-	return async ({ messages, preprompt }) => {
 		let system = preprompt;
 		if (messages?.[0]?.from === "system") {
 			system = messages[0].content;
@@ -49,15 +49,18 @@ export async function endpointAnthropic(
 		}[];
 		let tokenId = 0;
 		return (async function* () {
 			const stream = anthropic.messages.stream({
 				model: model.id ?? model.name,
 				messages: messagesFormatted,
-				max_tokens: model.parameters?.max_new_tokens,
-				temperature: model.parameters?.temperature,
-				top_p: model.parameters?.top_p,
-				top_k: model.parameters?.top_k,
-				stop_sequences: model.parameters?.stop,
 				system,
 			});
 			while (true) {

 		defaultQuery,
 	});
+	return async ({ messages, preprompt, generateSettings }) => {
 		let system = preprompt;
 		if (messages?.[0]?.from === "system") {
 			system = messages[0].content;
 		}[];
 		let tokenId = 0;
+		const parameters = { ...model.parameters, ...generateSettings };
 		return (async function* () {
 			const stream = anthropic.messages.stream({
 				model: model.id ?? model.name,
 				messages: messagesFormatted,
+				max_tokens: parameters?.max_new_tokens,
+				temperature: parameters?.temperature,
+				top_p: parameters?.top_p,
+				top_k: parameters?.top_k,
+				stop_sequences: parameters?.stop,
 				system,
 			});
 			while (true) {

src/lib/server/endpoints/aws/endpointAws.ts CHANGED Viewed

@@ -36,7 +36,7 @@ export async function endpointAws(
 		region,
 	});
-	return async ({ messages, preprompt, continueMessage }) => {
 		const prompt = await buildPrompt({
 			messages,
 			continueMessage,
@@ -46,7 +46,7 @@ export async function endpointAws(
 		return textGenerationStream(
 			{
-				parameters: { ...model.parameters, return_full_text: false },
 				model: url,
 				inputs: prompt,
 			},

 		region,
 	});
+	return async ({ messages, preprompt, continueMessage, generateSettings }) => {
 		const prompt = await buildPrompt({
 			messages,
 			continueMessage,
 		return textGenerationStream(
 			{
+				parameters: { ...model.parameters, ...generateSettings, return_full_text: false },
 				model: url,
 				inputs: prompt,
 			},

src/lib/server/endpoints/endpoints.ts CHANGED Viewed

@@ -10,12 +10,14 @@ import {
 	endpointAnthropic,
 	endpointAnthropicParametersSchema,
 } from "./anthropic/endpointAnthropic";
 // parameters passed when generating text
 export interface EndpointParameters {
 	messages: Omit<Conversation["messages"][0], "id">[];
 	preprompt?: Conversation["preprompt"];
 	continueMessage?: boolean; // used to signal that the last message will be extended
 }
 interface CommonEndpoint {

 	endpointAnthropic,
 	endpointAnthropicParametersSchema,
 } from "./anthropic/endpointAnthropic";
+import type { Model } from "$lib/types/Model";
 // parameters passed when generating text
 export interface EndpointParameters {
 	messages: Omit<Conversation["messages"][0], "id">[];
 	preprompt?: Conversation["preprompt"];
 	continueMessage?: boolean; // used to signal that the last message will be extended
+	generateSettings?: Partial<Model["parameters"]>;
 }
 interface CommonEndpoint {

src/lib/server/endpoints/llamacpp/endpointLlamacpp.ts CHANGED Viewed

@@ -19,7 +19,7 @@ export function endpointLlamacpp(
 	input: z.input<typeof endpointLlamacppParametersSchema>
 ): Endpoint {
 	const { url, model } = endpointLlamacppParametersSchema.parse(input);
-	return async ({ messages, preprompt, continueMessage }) => {
 		const prompt = await buildPrompt({
 			messages,
 			continueMessage,
@@ -27,6 +27,8 @@ export function endpointLlamacpp(
 			model,
 		});
 		const r = await fetch(`${url}/completion`, {
 			method: "POST",
 			headers: {
@@ -35,12 +37,12 @@ export function endpointLlamacpp(
 			body: JSON.stringify({
 				prompt,
 				stream: true,
-				temperature: model.parameters.temperature,
-				top_p: model.parameters.top_p,
-				top_k: model.parameters.top_k,
-				stop: model.parameters.stop,
-				repeat_penalty: model.parameters.repetition_penalty,
-				n_predict: model.parameters.max_new_tokens,
 				cache_prompt: true,
 			}),
 		});

 	input: z.input<typeof endpointLlamacppParametersSchema>
 ): Endpoint {
 	const { url, model } = endpointLlamacppParametersSchema.parse(input);
+	return async ({ messages, preprompt, continueMessage, generateSettings }) => {
 		const prompt = await buildPrompt({
 			messages,
 			continueMessage,
 			model,
 		});
+		const parameters = { ...model.parameters, ...generateSettings };
 		const r = await fetch(`${url}/completion`, {
 			method: "POST",
 			headers: {
 			body: JSON.stringify({
 				prompt,
 				stream: true,
+				temperature: parameters.temperature,
+				top_p: parameters.top_p,
+				top_k: parameters.top_k,
+				stop: parameters.stop,
+				repeat_penalty: parameters.repetition_penalty,
+				n_predict: parameters.max_new_tokens,
 				cache_prompt: true,
 			}),
 		});

src/lib/server/endpoints/ollama/endpointOllama.ts CHANGED Viewed

@@ -14,7 +14,7 @@ export const endpointOllamaParametersSchema = z.object({
 export function endpointOllama(input: z.input<typeof endpointOllamaParametersSchema>): Endpoint {
 	const { url, model, ollamaName } = endpointOllamaParametersSchema.parse(input);
-	return async ({ messages, preprompt, continueMessage }) => {
 		const prompt = await buildPrompt({
 			messages,
 			continueMessage,
@@ -22,6 +22,8 @@ export function endpointOllama(input: z.input<typeof endpointOllamaParametersSch
 			model,
 		});
 		const r = await fetch(`${url}/api/generate`, {
 			method: "POST",
 			headers: {
@@ -32,12 +34,12 @@ export function endpointOllama(input: z.input<typeof endpointOllamaParametersSch
 				model: ollamaName ?? model.name,
 				raw: true,
 				options: {
-					top_p: model.parameters.top_p,
-					top_k: model.parameters.top_k,
-					temperature: model.parameters.temperature,
-					repeat_penalty: model.parameters.repetition_penalty,
-					stop: model.parameters.stop,
-					num_predict: model.parameters.max_new_tokens,
 				},
 			}),
 		});

 export function endpointOllama(input: z.input<typeof endpointOllamaParametersSchema>): Endpoint {
 	const { url, model, ollamaName } = endpointOllamaParametersSchema.parse(input);
+	return async ({ messages, preprompt, continueMessage, generateSettings }) => {
 		const prompt = await buildPrompt({
 			messages,
 			continueMessage,
 			model,
 		});
+		const parameters = { ...model.parameters, ...generateSettings };
 		const r = await fetch(`${url}/api/generate`, {
 			method: "POST",
 			headers: {
 				model: ollamaName ?? model.name,
 				raw: true,
 				options: {
+					top_p: parameters.top_p,
+					top_k: parameters.top_k,
+					temperature: parameters.temperature,
+					repeat_penalty: parameters.repetition_penalty,
+					stop: parameters.stop,
+					num_predict: parameters.max_new_tokens,
 				},
 			}),
 		});

src/lib/server/endpoints/openai/endpointOai.ts CHANGED Viewed

@@ -38,7 +38,7 @@ export async function endpointOai(
 	});
 	if (completion === "completions") {
-		return async ({ messages, preprompt, continueMessage }) => {
 			const prompt = await buildPrompt({
 				messages,
 				continueMessage,
@@ -46,21 +46,23 @@ export async function endpointOai(
 				model,
 			});
 			return openAICompletionToTextGenerationStream(
 				await openai.completions.create({
 					model: model.id ?? model.name,
 					prompt,
 					stream: true,
-					max_tokens: model.parameters?.max_new_tokens,
-					stop: model.parameters?.stop,
-					temperature: model.parameters?.temperature,
-					top_p: model.parameters?.top_p,
-					frequency_penalty: model.parameters?.repetition_penalty,
 				})
 			);
 		};
 	} else if (completion === "chat_completions") {
-		return async ({ messages, preprompt }) => {
 			let messagesOpenAI = messages.map((message) => ({
 				role: message.from,
 				content: message.content,
@@ -74,16 +76,18 @@ export async function endpointOai(
 				messagesOpenAI[0].content = preprompt ?? "";
 			}
 			return openAIChatToTextGenerationStream(
 				await openai.chat.completions.create({
 					model: model.id ?? model.name,
 					messages: messagesOpenAI,
 					stream: true,
-					max_tokens: model.parameters?.max_new_tokens,
-					stop: model.parameters?.stop,
-					temperature: model.parameters?.temperature,
-					top_p: model.parameters?.top_p,
-					frequency_penalty: model.parameters?.repetition_penalty,
 				})
 			);
 		};

 	});
 	if (completion === "completions") {
+		return async ({ messages, preprompt, continueMessage, generateSettings }) => {
 			const prompt = await buildPrompt({
 				messages,
 				continueMessage,
 				model,
 			});
+			const parameters = { ...model.parameters, ...generateSettings };
 			return openAICompletionToTextGenerationStream(
 				await openai.completions.create({
 					model: model.id ?? model.name,
 					prompt,
 					stream: true,
+					max_tokens: parameters?.max_new_tokens,
+					stop: parameters?.stop,
+					temperature: parameters?.temperature,
+					top_p: parameters?.top_p,
+					frequency_penalty: parameters?.repetition_penalty,
 				})
 			);
 		};
 	} else if (completion === "chat_completions") {
+		return async ({ messages, preprompt, generateSettings }) => {
 			let messagesOpenAI = messages.map((message) => ({
 				role: message.from,
 				content: message.content,
 				messagesOpenAI[0].content = preprompt ?? "";
 			}
+			const parameters = { ...model.parameters, ...generateSettings };
 			return openAIChatToTextGenerationStream(
 				await openai.chat.completions.create({
 					model: model.id ?? model.name,
 					messages: messagesOpenAI,
 					stream: true,
+					max_tokens: parameters?.max_new_tokens,
+					stop: parameters?.stop,
+					temperature: parameters?.temperature,
+					top_p: parameters?.top_p,
+					frequency_penalty: parameters?.repetition_penalty,
 				})
 			);
 		};

src/lib/server/endpoints/tgi/endpointTgi.ts CHANGED Viewed

@@ -16,7 +16,7 @@ export const endpointTgiParametersSchema = z.object({
 export function endpointTgi(input: z.input<typeof endpointTgiParametersSchema>): Endpoint {
 	const { url, accessToken, model, authorization } = endpointTgiParametersSchema.parse(input);
-	return async ({ messages, preprompt, continueMessage }) => {
 		const prompt = await buildPrompt({
 			messages,
 			preprompt,
@@ -26,7 +26,7 @@ export function endpointTgi(input: z.input<typeof endpointTgiParametersSchema>):
 		return textGenerationStream(
 			{
-				parameters: { ...model.parameters, return_full_text: false },
 				model: url,
 				inputs: prompt,
 				accessToken,

 export function endpointTgi(input: z.input<typeof endpointTgiParametersSchema>): Endpoint {
 	const { url, accessToken, model, authorization } = endpointTgiParametersSchema.parse(input);
+	return async ({ messages, preprompt, continueMessage, generateSettings }) => {
 		const prompt = await buildPrompt({
 			messages,
 			preprompt,
 		return textGenerationStream(
 			{
+				parameters: { ...model.parameters, ...generateSettings, return_full_text: false },
 				model: url,
 				inputs: prompt,
 				accessToken,

src/lib/types/Assistant.ts CHANGED Viewed

@@ -19,6 +19,12 @@ export interface Assistant extends Timestamps {
 		allowedDomains: string[];
 		allowedLinks: string[];
 	};
 	dynamicPrompt?: boolean;
 	searchTokens: string[];
 }

 		allowedDomains: string[];
 		allowedLinks: string[];
 	};
+	generateSettings?: {
+		temperature?: number;
+		top_p?: number;
+		repetition_penalty?: number;
+		top_k?: number;
+	};
 	dynamicPrompt?: boolean;
 	searchTokens: string[];
 }

src/routes/conversation/[id]/+server.ts CHANGED Viewed

@@ -338,8 +338,11 @@ export async function POST({ request, locals, params, getClientAddress }) {
 			// check if assistant has a rag
 			const assistant = await collections.assistants.findOne<
-				Pick<Assistant, "rag" | "dynamicPrompt">
-			>({ _id: conv.assistantId }, { projection: { rag: 1, dynamicPrompt: 1 } });
 			const assistantHasRAG =
 				ENABLE_ASSISTANTS_RAG === "true" &&
@@ -403,12 +406,15 @@ export async function POST({ request, locals, params, getClientAddress }) {
 			const previousText = messageToWriteTo.content;
 			try {
 				const endpoint = await model.getEndpoint();
 				for await (const output of await endpoint({
 					messages: processedMessages,
 					preprompt,
 					continueMessage: isContinue,
 				})) {
 					// if not generated_text is here it means the generation is not done
 					if (!output.generated_text) {
@@ -448,10 +454,11 @@ export async function POST({ request, locals, params, getClientAddress }) {
 					}
 				}
 			} catch (e) {
 				update({ type: "status", status: "error", message: (e as Error).message });
 			} finally {
 				// check if no output was generated
-				if (messageToWriteTo.content === previousText) {
 					update({
 						type: "status",
 						status: "error",

 			// check if assistant has a rag
 			const assistant = await collections.assistants.findOne<
+				Pick<Assistant, "rag" | "dynamicPrompt" | "generateSettings">
+			>(
+				{ _id: conv.assistantId },
+				{ projection: { rag: 1, dynamicPrompt: 1, generateSettings: 1 } }
+			);
 			const assistantHasRAG =
 				ENABLE_ASSISTANTS_RAG === "true" &&
 			const previousText = messageToWriteTo.content;
+			let hasError = false;
 			try {
 				const endpoint = await model.getEndpoint();
 				for await (const output of await endpoint({
 					messages: processedMessages,
 					preprompt,
 					continueMessage: isContinue,
+					generateSettings: assistant?.generateSettings,
 				})) {
 					// if not generated_text is here it means the generation is not done
 					if (!output.generated_text) {
 					}
 				}
 			} catch (e) {
+				hasError = true;
 				update({ type: "status", status: "error", message: (e as Error).message });
 			} finally {
 				// check if no output was generated
+				if (!hasError && messageToWriteTo.content === previousText) {
 					update({
 						type: "status",
 						status: "error",

src/routes/settings/(nav)/assistants/[assistantId]/edit/+page.server.ts CHANGED Viewed

@@ -25,6 +25,20 @@ const newAsssistantSchema = z.object({
 	ragDomainList: z.preprocess(parseStringToList, z.string().array()),
 	ragAllowAll: z.preprocess((v) => v === "true", z.boolean()),
 	dynamicPrompt: z.preprocess((v) => v === "on", z.boolean()),
 });
 const uploadAvatar = async (avatar: File, assistantId: ObjectId): Promise<string> => {
@@ -143,6 +157,12 @@ export const actions: Actions = {
 					},
 					dynamicPrompt: parse.data.dynamicPrompt,
 					searchTokens: generateSearchTokens(parse.data.name),
 				},
 			}
 		);

 	ragDomainList: z.preprocess(parseStringToList, z.string().array()),
 	ragAllowAll: z.preprocess((v) => v === "true", z.boolean()),
 	dynamicPrompt: z.preprocess((v) => v === "on", z.boolean()),
+	temperature: z
+		.union([z.literal(""), z.coerce.number().min(0.1).max(2)])
+		.transform((v) => (v === "" ? undefined : v)),
+	top_p: z
+		.union([z.literal(""), z.coerce.number().min(0.05).max(1)])
+		.transform((v) => (v === "" ? undefined : v)),
+	repetition_penalty: z
+		.union([z.literal(""), z.coerce.number().min(0.1).max(2)])
+		.transform((v) => (v === "" ? undefined : v)),
+	top_k: z
+		.union([z.literal(""), z.coerce.number().min(5).max(100)])
+		.transform((v) => (v === "" ? undefined : v)),
 });
 const uploadAvatar = async (avatar: File, assistantId: ObjectId): Promise<string> => {
 					},
 					dynamicPrompt: parse.data.dynamicPrompt,
 					searchTokens: generateSearchTokens(parse.data.name),
+					generateSettings: {
+						temperature: parse.data.temperature,
+						top_p: parse.data.top_p,
+						repetition_penalty: parse.data.repetition_penalty,
+						top_k: parse.data.top_k,
+					},
 				},
 			}
 		);

src/routes/settings/(nav)/assistants/new/+page.server.ts CHANGED Viewed

@@ -25,6 +25,20 @@ const newAsssistantSchema = z.object({
 	ragDomainList: z.preprocess(parseStringToList, z.string().array()),
 	ragAllowAll: z.preprocess((v) => v === "true", z.boolean()),
 	dynamicPrompt: z.preprocess((v) => v === "on", z.boolean()),
 });
 const uploadAvatar = async (avatar: File, assistantId: ObjectId): Promise<string> => {
@@ -125,6 +139,12 @@ export const actions: Actions = {
 			},
 			dynamicPrompt: parse.data.dynamicPrompt,
 			searchTokens: generateSearchTokens(parse.data.name),
 		});
 		// add insertedId to user settings

 	ragDomainList: z.preprocess(parseStringToList, z.string().array()),
 	ragAllowAll: z.preprocess((v) => v === "true", z.boolean()),
 	dynamicPrompt: z.preprocess((v) => v === "on", z.boolean()),
+	temperature: z
+		.union([z.literal(""), z.coerce.number().min(0.1).max(2)])
+		.transform((v) => (v === "" ? undefined : v)),
+	top_p: z
+		.union([z.literal(""), z.coerce.number().min(0.05).max(1)])
+		.transform((v) => (v === "" ? undefined : v)),
+	repetition_penalty: z
+		.union([z.literal(""), z.coerce.number().min(0.1).max(2)])
+		.transform((v) => (v === "" ? undefined : v)),
+	top_k: z
+		.union([z.literal(""), z.coerce.number().min(5).max(100)])
+		.transform((v) => (v === "" ? undefined : v)),
 });
 const uploadAvatar = async (avatar: File, assistantId: ObjectId): Promise<string> => {
 			},
 			dynamicPrompt: parse.data.dynamicPrompt,
 			searchTokens: generateSearchTokens(parse.data.name),
+			generateSettings: {
+				temperature: parse.data.temperature,
+				top_p: parse.data.top_p,
+				repetition_penalty: parse.data.repetition_penalty,
+				top_k: parse.data.top_k,
+			},
 		});
 		// add insertedId to user settings