Spaces:

chunking-ai
/

smoldocling-preview

Paused

taprosoft commited on Mar 17

Commit

22e6cb5

1 Parent(s): 73d7517

fix: resize image

Files changed (1) hide show

backends/smoldocling.py CHANGED Viewed

@@ -3,7 +3,6 @@
 # pip install docling_core
 # pip install transformers
-import spaces
 import torch
 from docling_core.types.doc import DoclingDocument
 from docling_core.types.doc.document import DocTagsDocument
@@ -34,7 +33,6 @@ messages = [
 ]
-@spaces.GPU(duration=120)
 def convert_smoldocling(path: str, file_name: str):
     doc = PDF(path)
     output_md = ""
@@ -42,6 +40,12 @@ def convert_smoldocling(path: str, file_name: str):
     for image in doc.images[:MAX_PAGES]:
         # convert ndarray to Image
         image = Image.fromarray(image)
         # Prepare inputs
         prompt = processor.apply_chat_template(messages, add_generation_prompt=True)

 # pip install docling_core
 # pip install transformers
 import torch
 from docling_core.types.doc import DoclingDocument
 from docling_core.types.doc.document import DocTagsDocument
 ]
 def convert_smoldocling(path: str, file_name: str):
     doc = PDF(path)
     output_md = ""
     for image in doc.images[:MAX_PAGES]:
         # convert ndarray to Image
         image = Image.fromarray(image)
+        # resize image to maximum width of 1200
+        max_width = 1200
+        if image.width > max_width:
+            image = image.resize(
+                (max_width, int(max_width * image.height / image.width))
+            )
         # Prepare inputs
         prompt = processor.apply_chat_template(messages, add_generation_prompt=True)