Spaces:

zerogpu-aoti
/

FLUX.1-dev-fa3-aoti

Sleeping

cbensimon HF Staff commited on Jul 3

Commit

ce8b907

1 Parent(s): 49c2af2

Further optimize + quantize

Files changed (2) hide show

app.py CHANGED Viewed

@@ -15,6 +15,8 @@ import gradio as gr
 import spaces
 import torch
 from diffusers import FluxPipeline
 from zerogpu import aoti_compile
@@ -26,6 +28,12 @@ print('FluxPipeline.from_pretrained', -(t0 - (t0 := datetime.now())))
 @spaces.GPU(duration=1500)
 def compile_transformer():
     def _example_tensor(*shape):
         return torch.randn(*shape, device='cuda', dtype=torch.bfloat16)

 import spaces
 import torch
 from diffusers import FluxPipeline
+from torchao.quantization import quantize_
+from torchao.quantization import Float8DynamicActivationFloat8WeightConfig
 from zerogpu import aoti_compile
 @spaces.GPU(duration=1500)
 def compile_transformer():
+    pipeline.transformer.fuse_qkv_projections()
+    pipeline.vae.fuse_qkv_projections()
+    pipeline.vae.to(memory_format=torch.channels_last)
+    quantize_(pipeline.transformer, Float8DynamicActivationFloat8WeightConfig())
     def _example_tensor(*shape):
         return torch.randn(*shape, device='cuda', dtype=torch.bfloat16)

requirements.txt CHANGED Viewed

@@ -3,3 +3,4 @@ diffusers
 transformers
 sentencepiece
 protobuf

 transformers
 sentencepiece
 protobuf
+torchao