Spaces:

Bils
/

AIPromoStudio

Sleeping

Bils commited on Feb 24

Commit

ee1b035

verified ·

1 Parent(s): b87869d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -207,9 +207,12 @@ def generate_music(prompt: str, audio_length: int):
         model_key = "facebook/musicgen-large"
         musicgen_model, musicgen_processor = get_musicgen_model(model_key)
         device = "cuda" if torch.cuda.is_available() else "cpu"
-        inputs = musicgen_processor(text=[prompt], padding=True, return_tensors="pt").to(device)
         with torch.inference_mode():
             outputs = musicgen_model.generate(**inputs, max_new_tokens=audio_length)
         audio_data = outputs[0, 0].cpu().numpy()
         normalized_audio = (audio_data / max(abs(audio_data)) * 32767).astype("int16")
         output_path = os.path.join(tempfile.gettempdir(), "musicgen_large_generated_music.wav")

         model_key = "facebook/musicgen-large"
         musicgen_model, musicgen_processor = get_musicgen_model(model_key)
         device = "cuda" if torch.cuda.is_available() else "cpu"
+        # Process the input and move each tensor to the proper device
+        inputs = musicgen_processor(text=[prompt], padding=True, return_tensors="pt")
+        inputs = {k: v.to(device) for k, v in inputs.items()}
         with torch.inference_mode():
             outputs = musicgen_model.generate(**inputs, max_new_tokens=audio_length)
+        # Post-process the output to create a WAV file
         audio_data = outputs[0, 0].cpu().numpy()
         normalized_audio = (audio_data / max(abs(audio_data)) * 32767).astype("int16")
         output_path = os.path.join(tempfile.gettempdir(), "musicgen_large_generated_music.wav")