NoMoreCopyrightOrg
/

flux-test2

Model card Files Files and versions

John6666 commited on Mar 12

Commit

8b61e71

·

verified ·

1 Parent(s): a5cb0bf

Upload 2 files

Files changed (2) hide show

handler.py +10 -10
requirements.txt +3 -3

handler.py CHANGED Viewed

@@ -24,17 +24,17 @@ class EndpointHandler:
         ).to("cuda")
         self.pipe.enable_vae_slicing()
         self.pipe.enable_vae_tiling()
-        #self.pipe.transformer.fuse_qkv_projections()
-        #self.pipe.vae.fuse_qkv_projections()
-        #self.pipe.transformer.to(memory_format=torch.channels_last)
-        #self.pipe.vae.to(memory_format=torch.channels_last)
         apply_cache_on_pipe(self.pipe, residual_diff_threshold=0.12)
-        #self.pipe.transformer = torch.compile(
-        #    self.pipe.transformer, mode="max-autotune-no-cudagraphs",
-        #)
-        #self.pipe.vae = torch.compile(
-        #    self.pipe.vae, mode="max-autotune-no-cudagraphs",
-        #)
         self.pipe.transformer = autoquant(self.pipe.transformer, error_on_unseen=False)
         self.pipe.vae = autoquant(self.pipe.vae, error_on_unseen=False)

         ).to("cuda")
         self.pipe.enable_vae_slicing()
         self.pipe.enable_vae_tiling()
+        self.pipe.transformer.fuse_qkv_projections()
+        self.pipe.vae.fuse_qkv_projections()
+        self.pipe.transformer.to(memory_format=torch.channels_last)
+        self.pipe.vae.to(memory_format=torch.channels_last)
         apply_cache_on_pipe(self.pipe, residual_diff_threshold=0.12)
+        self.pipe.transformer = torch.compile(
+            self.pipe.transformer, mode="max-autotune-no-cudagraphs",
+        )
+        self.pipe.vae = torch.compile(
+            self.pipe.vae, mode="max-autotune-no-cudagraphs",
+        )
         self.pipe.transformer = autoquant(self.pipe.transformer, error_on_unseen=False)
         self.pipe.vae = autoquant(self.pipe.vae, error_on_unseen=False)

requirements.txt CHANGED Viewed

@@ -3,8 +3,8 @@ torch==2.6.0+cu126
 torchvision
 torchaudio
 huggingface_hub
-torchao>=0.9.0
-diffusers>=0.32.2
 peft
 transformers<=4.48.3
 numpy<2
@@ -13,4 +13,4 @@ Pillow
 sentencepiece
 protobuf
 triton
-para-attn

 torchvision
 torchaudio
 huggingface_hub
+torchao==0.9.0
+diffusers==0.32.2
 peft
 transformers<=4.48.3
 numpy<2
 sentencepiece
 protobuf
 triton
+para-attn==0.3.23