Spaces:

ankandrew
/

nisqa-v2.0

Running on Zero

ankandrew commited on Oct 7

Commit

3fafc46

verified ·

1 Parent(s): c924184

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ import torch
 import numpy as np
 import librosa
 from torchmetrics.functional.audio.nisqa import non_intrusive_speech_quality_assessment as tm_nisqa
 SR = 16000
@@ -29,6 +30,7 @@ def explain_dim(name: str):
         "Loudness": "Perceived loudness appropriateness (higher = more appropriate)."
     }[name]
 def predict_nisqa(audio):
     if isinstance(audio, tuple):
         _sr, y = audio
@@ -36,8 +38,11 @@ def predict_nisqa(audio):
     else:
         y, _ = librosa.load(audio, sr=SR, mono=True)
-    wav = torch.tensor(y, dtype=torch.float32)
-    mos, noisiness, discontinuity, coloration, loudness = tm_nisqa(wav, SR).detach().cpu().numpy().tolist()
     metrics = [
         ("MOS (overall)", mos, label_mos(mos), "Higher = better perceived quality."),

 import numpy as np
 import librosa
 from torchmetrics.functional.audio.nisqa import non_intrusive_speech_quality_assessment as tm_nisqa
+import spaces
 SR = 16000
         "Loudness": "Perceived loudness appropriateness (higher = more appropriate)."
     }[name]
+@spaces.GPU()
 def predict_nisqa(audio):
     if isinstance(audio, tuple):
         _sr, y = audio
     else:
         y, _ = librosa.load(audio, sr=SR, mono=True)
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+    wav = torch.tensor(y, dtype=torch.float32, device=device)
+        mos, noisiness, discontinuity, coloration, loudness = (
+        tm_nisqa(wav, SR).detach().to("cpu").numpy().tolist()
+    )
     metrics = [
         ("MOS (overall)", mos, label_mos(mos), "Higher = better perceived quality."),