Spaces:

Luigi
/

rts-commander

Sleeping

App Files Files Community

rts-commander / tests /scripts /debug_model_loading.py

Luigi

Organize project structure: move test scripts to tests/scripts and documentation to docs/reports

d28c36c about 1 month ago

raw

history blame contribute delete

3.98 kB

	"""
	Script de débogage pour identifier le problème de chargement du modèle Qwen2.5 0.5B
	"""

	import sys
	import os
	import traceback

	print("🔍 DÉBOGAGE DU CHARGEMENT DU MODÈLE QWEN2.5 0.5B")
	print("=" * 60)

	# Vérifier l'existence du modèle
	model_path = "qwen2.5-0.5b-instruct-q4_0.gguf"
	if not os.path.exists(model_path):
	print("❌ Modèle non trouvé à l'emplacement attendu")
	print(f" Recherché: {os.path.abspath(model_path)}")
	sys.exit(1)

	print(f"✅ Modèle trouvé: {os.path.abspath(model_path)}")
	print(f"📏 Taille: {os.path.getsize(model_path) / (1024*1024):.1f} MB")

	# Test 1: Importation de llama_cpp
	print("\n🧪 TEST 1: Importation de llama_cpp")
	try:
	import llama_cpp
	print("✅ llama_cpp importé avec succès")
	print(f" Version: {llama_cpp.__version__}")
	except Exception as e:
	print(f"❌ Erreur d'importation: {e}")
	traceback.print_exc()
	sys.exit(1)

	# Test 2: Test de chargement simple
	print("\n🧪 TEST 2: Chargement direct du modèle")
	try:
	from llama_cpp import Llama

	# Essayer différentes configurations
	configs = [
	{"n_threads": 1, "n_ctx": 2048},
	{"n_threads": 2, "n_ctx": 2048},
	{"n_threads": 1, "n_ctx": 1024},
	{"n_threads": 1, "n_ctx": 512},
	]

	for i, config in enumerate(configs, 1):
	print(f"\n Configuration {i}: threads={config['n_threads']}, ctx={config['n_ctx']}")
	try:
	llm = Llama(
	model_path=model_path,
	n_ctx=config['n_ctx'],
	n_threads=config['n_threads']
	)
	print(" ✅ Modèle chargé avec succès")

	# Test d'inférence simple
	print(" 🧠 Test d'inférence...")
	response = llm(
	"Réponds avec 'TEST_RÉUSSI': ",
	max_tokens=10,
	temperature=0.1,
	echo=False
	)

	# Gérer la réponse (peut être un générateur ou un dict)
	if hasattr(response, '__iter__') and not isinstance(response, dict):
	# C'est un générateur, prendre le premier élément
	response = next(response)

	if isinstance(response, dict) and 'choices' in response:
	text = response['choices'][0]['text'].strip()
	print(f" 📝 Réponse: {text}")
	if "TEST_RÉUSSI" in text:
	print(" ✅ Test d'inférence réussi!")
	break
	else:
	print(f" ⚠️ Format de réponse inattendu: {type(response)}")

	except Exception as e:
	print(f" ❌ Erreur: {e}")
	traceback.print_exc()

	else:
	print("❌ Toutes les configurations ont échoué")

	except Exception as e:
	print(f"❌ Erreur lors du chargement: {e}")
	traceback.print_exc()

	# Test 3: Vérification de l'environnement
	print("\n🧪 TEST 3: Vérification de l'environnement")
	print(f" Python: {sys.version}")
	print(f" Répertoire de travail: {os.getcwd()}")
	print(f" Variables d'environnement PATH: {os.environ.get('PATH', 'Non défini')}")

	# Test 4: Vérification des permissions
	print("\n🧪 TEST 4: Vérification des permissions")
	try:
	# Tester la lecture du fichier
	with open(model_path, 'rb') as f:
	header = f.read(100)
	print(f" ✅ Fichier lisible, header: {header[:20]}...")

	# Tester les permissions
	import stat
	st = os.stat(model_path)
	permissions = stat.filemode(st.st_mode)
	print(f" Permissions: {permissions}")

	# Vérifier l'espace mémoire
	import shutil
	total, used, free = shutil.disk_usage(".")
	print(f" Espace disque libre: {free / (1024**3):.1f} GB")

	except Exception as e:
	print(f" ❌ Erreur de lecture: {e}")

	print("\n" + "=" * 60)
	print("🔍 RÉSUMÉ DU DÉBOGAGE")
	print("=" * 60)