Spaces:

DesertWolf
/

test3

Paused

App Files Files Community

test3 / tests /llm_translation /test_azure_o_series.py

DesertWolf

Upload folder using huggingface_hub

447ebeb verified 5 months ago

raw

history blame contribute delete

7.35 kB

	import json
	import os
	import sys
	from datetime import datetime
	from unittest.mock import AsyncMock, patch, MagicMock

	sys.path.insert(
	0, os.path.abspath("../..")
	) # Adds the parent directory to the system path


	import httpx
	import pytest
	from respx import MockRouter

	import litellm
	from litellm import Choices, Message, ModelResponse
	from base_llm_unit_tests import BaseLLMChatTest, BaseOSeriesModelsTest


	class TestAzureOpenAIO1(BaseOSeriesModelsTest, BaseLLMChatTest):
	def get_base_completion_call_args(self):
	return {
	"model": "azure/o1",
	"api_key": os.getenv("AZURE_OPENAI_O1_KEY"),
	"api_base": "https://openai-prod-test.openai.azure.com",
	"api_version": "2024-12-01-preview"
	}

	def get_client(self):
	from openai import AzureOpenAI

	return AzureOpenAI(
	api_key="my-fake-o1-key",
	base_url="https://openai-prod-test.openai.azure.com",
	api_version="2024-02-15-preview",
	)

	def test_tool_call_no_arguments(self, tool_call_no_arguments):
	"""Test that tool calls with no arguments is translated correctly. Relevant issue: https://github.com/BerriAI/litellm/issues/6833"""
	pass

	def test_basic_tool_calling(self):
	pass

	def test_prompt_caching(self):
	"""Temporary override. o1 prompt caching is not working."""
	pass

	def test_override_fake_stream(self):
	"""Test that native streaming is not supported for o1."""
	router = litellm.Router(
	model_list=[
	{
	"model_name": "azure/o1-preview",
	"litellm_params": {
	"model": "azure/o1-preview",
	"api_key": "my-fake-o1-key",
	"api_base": "https://openai-gpt-4-test-v-1.openai.azure.com",
	},
	"model_info": {
	"supports_native_streaming": True,
	},
	}
	]
	)

	## check model info

	model_info = litellm.get_model_info(
	model="azure/o1-preview", custom_llm_provider="azure"
	)
	assert model_info["supports_native_streaming"] is True

	fake_stream = litellm.AzureOpenAIO1Config().should_fake_stream(
	model="azure/o1-preview", stream=True
	)
	assert fake_stream is False


	class TestAzureOpenAIO3(BaseOSeriesModelsTest):
	def get_base_completion_call_args(self):
	return {
	"model": "azure/o3-mini",
	"api_key": "my-fake-o1-key",
	"api_base": "https://openai-gpt-4-test-v-1.openai.azure.com",
	}

	def get_client(self):
	from openai import AzureOpenAI

	return AzureOpenAI(
	api_key="my-fake-o1-key",
	base_url="https://openai-gpt-4-test-v-1.openai.azure.com",
	api_version="2024-02-15-preview",
	)


	def test_azure_o3_streaming():
	"""
	Test that o3 models handles fake streaming correctly.
	"""
	from openai import AzureOpenAI
	from litellm import completion

	client = AzureOpenAI(
	api_key="my-fake-o1-key",
	base_url="https://openai-gpt-4-test-v-1.openai.azure.com",
	api_version="2024-02-15-preview",
	)

	with patch.object(
	client.chat.completions.with_raw_response, "create"
	) as mock_create:
	try:
	completion(
	model="azure/o3-mini",
	messages=[{"role": "user", "content": "Hello, world!"}],
	stream=True,
	client=client,
	)
	except (
	Exception
	) as e: # expect output translation error as mock response doesn't return a json
	print(e)
	assert mock_create.call_count == 1
	assert "stream" in mock_create.call_args.kwargs


	def test_azure_o_series_routing():
	"""
	Allows user to pass model="azure/o_series/<any-deployment-name>" for explicit o_series model routing.
	"""
	from openai import AzureOpenAI
	from litellm import completion

	client = AzureOpenAI(
	api_key="my-fake-o1-key",
	base_url="https://openai-gpt-4-test-v-1.openai.azure.com",
	api_version="2024-02-15-preview",
	)

	with patch.object(
	client.chat.completions.with_raw_response, "create"
	) as mock_create:
	try:
	completion(
	model="azure/o_series/my-random-deployment-name",
	messages=[{"role": "user", "content": "Hello, world!"}],
	stream=True,
	client=client,
	)
	except (
	Exception
	) as e: # expect output translation error as mock response doesn't return a json
	print(e)
	assert mock_create.call_count == 1
	assert "stream" not in mock_create.call_args.kwargs


	@patch("litellm.main.azure_o1_chat_completions._get_openai_client")
	def test_openai_o_series_max_retries_0(mock_get_openai_client):
	import litellm

	litellm.set_verbose = True
	response = litellm.completion(
	model="azure/o1-preview",
	messages=[{"role": "user", "content": "hi"}],
	max_retries=0,
	)

	mock_get_openai_client.assert_called_once()
	assert mock_get_openai_client.call_args.kwargs["max_retries"] == 0


	@pytest.mark.asyncio
	async def test_azure_o1_series_response_format_extra_params():
	"""
	Tool calling should work for all azure o_series models.
	"""
	litellm._turn_on_debug()

	from openai import AsyncAzureOpenAI

	litellm.set_verbose = True

	client = AsyncAzureOpenAI(
	api_key="fake-api-key",
	base_url="https://openai-prod-test.openai.azure.com/openai/deployments/o1/chat/completions?api-version=2025-01-01-preview",
	api_version="2025-01-01-preview"
	)

	tools = [{'type': 'function', 'function': {'name': 'get_current_time', 'description': 'Get the current time in a given location.', 'parameters': {'type': 'object', 'properties': {'location': {'type': 'string', 'description': 'The city name, e.g. San Francisco'}}, 'required': ['location']}}}]
	response_format = {'type': 'json_object'}
	tool_choice = "auto"
	with patch.object(
	client.chat.completions.with_raw_response, "create"
	) as mock_client:
	try:
	await litellm.acompletion(
	client=client,
	model="azure/o_series/<my-deployment-name>",
	api_key="xxxxx",
	api_base="https://openai-prod-test.openai.azure.com/openai/deployments/o1/chat/completions?api-version=2025-01-01-preview",
	api_version="2024-12-01-preview",
	messages=[{"role": "user", "content": "Hello! return a json object"}],
	tools=tools,
	response_format=response_format,
	tool_choice=tool_choice
	)
	except Exception as e:
	print(f"Error: {e}")

	mock_client.assert_called_once()
	request_body = mock_client.call_args.kwargs

	print("request_body: ", json.dumps(request_body, indent=4))
	assert request_body["tools"] == tools
	assert request_body["response_format"] == response_format
	assert request_body["tool_choice"] == tool_choice