Use external img url to replace local img (#25)

Browse files

- Use external img url to replace local img (c380804c76a3117855b431bd4376b0cae2176810)

Files changed (1) hide show

README.md +21 -21

README.md CHANGED Viewed

@@ -44,7 +44,7 @@ PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vi
 </div>
 <div align="center">
-<img src="./imgs/allmetric.png" width="800"/>
 </div>
 ## Introduction
@@ -67,7 +67,7 @@ PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vi
 <!-- PaddleOCR-VL decomposes the complex task of document parsing into a two stages. The first stage, PP-DocLayoutV2, is responsible for layout analysis, where it localizes semantic regions and predicts their reading order. Subsequently, the second stage, PaddleOCR-VL-0.9B, leverages these layout predictions to perform fine-grained recognition of diverse content, including text, tables, formulas, and charts. Finally, a lightweight post-processing module aggregates the outputs from both stages and formats the final document into structured Markdown and JSON. -->
 <div align="center">
-<img src="./imgs/paddleocrvl.png" width="800"/>
 </div>
@@ -150,7 +150,7 @@ for res in output:
 ##### PaddleOCR-VL achieves SOTA performance for overall, text, formula, tables and reading order on OmniDocBench v1.5
 <div align="center">
-<img src="./imgs/omni15.png" width="800"/>
 </div>
@@ -161,7 +161,7 @@ for res in output:
 <div align="center">
-<img src="./imgs/omni10.png" width="800"/>
 </div>
@@ -178,7 +178,7 @@ for res in output:
 PaddleOCR-VL’s robust and versatile capability in handling diverse document types, establishing it as the leading method in the OmniDocBench-OCR-block performance evaluation.
 <div align="center">
-<img src="./imgs/omnibenchocr.png" width="800"/>
 </div>
@@ -187,7 +187,7 @@ PaddleOCR-VL’s robust and versatile capability in handling diverse document ty
 In-house-OCR provides a evaluation of performance across multiple languages and text types. Our model demonstrates outstanding accuracy with the lowest edit distances in all evaluated scripts.
 <div align="center">
-<img src="./imgs/inhouseocr.png" width="800"/>
 </div>
@@ -199,7 +199,7 @@ In-house-OCR provides a evaluation of performance across multiple languages and
 Our self-built evaluation set contains diverse types of table images, such as Chinese, English, mixed Chinese-English, and tables with various characteristics like full, partial, or no borders, book/manual formats, lists, academic papers, merged cells, as well as low-quality, watermarked, etc. PaddleOCR-VL achieves remarkable performance across all categories.
 <div align="center">
-<img src="./imgs/inhousetable.png" width="600"/>
 </div>
 #### 3. Formula
@@ -209,7 +209,7 @@ Our self-built evaluation set contains diverse types of table images, such as Ch
 In-house-Formula evaluation set contains simple prints, complex prints, camera scans, and handwritten formulas. PaddleOCR-VL demonstrates the best performance in every category.
 <div align="center">
-<img src="./imgs/inhouse-formula.png" width="500"/>
 </div>
@@ -220,7 +220,7 @@ In-house-Formula evaluation set contains simple prints, complex prints, camera s
 The evaluation set is broadly categorized into 11 chart categories, including bar-line hybrid, pie, 100% stacked bar, area, bar, bubble, histogram, line, scatterplot, stacked area, and stacked bar. PaddleOCR-VL not only outperforms expert OCR VLMs but also surpasses some 72B-level multimodal language models.
 <div align="center">
-<img src="./imgs/inhousechart.png" width="400"/>
 </div>
@@ -235,42 +235,42 @@ The evaluation set is broadly categorized into 11 chart categories, including ba
 ### Comprehensive Document Parsing
 <div align="center">
-<img src="./imgs/overview1.jpg" width="600"/>
-<img src="./imgs/overview2.jpg" width="600"/>
-<img src="./imgs/overview3.jpg" width="600"/>
-<img src="./imgs/overview4.jpg" width="600"/>
 </div>
 ### Text
 <div align="center">
-<img src="./imgs/text_english_arabic.jpg" width="300" style="display: inline-block;"/>
-<img src="./imgs/text_handwriting_02.jpg" width="300" style="display: inline-block;"/>
 </div>
 ### Table
 <div align="center">
-<img src="./imgs/table_01.jpg" width="300" style="display: inline-block;"/>
-<img src="./imgs/table_02.jpg" width="300" style="display: inline-block;"/>
 </div>
 ### Formula
 <div align="center">
-<img src="./imgs/formula_EN.jpg" width="300" style="display: inline-block;"/>
-<img src="./imgs/formula_ZH.jpg" width="300" style="display: inline-block;"/>
 </div>
 ### Chart
 <div align="center">
-  <img src="./imgs/chart_01.jpg" width="300" style="display: inline-block;"/>
-  <img src="./imgs/chart_02.jpg" width="300" style="display: inline-block;"/>
 </div>

 </div>
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/allmetric.png" width="800"/>
 </div>
 ## Introduction
 <!-- PaddleOCR-VL decomposes the complex task of document parsing into a two stages. The first stage, PP-DocLayoutV2, is responsible for layout analysis, where it localizes semantic regions and predicts their reading order. Subsequently, the second stage, PaddleOCR-VL-0.9B, leverages these layout predictions to perform fine-grained recognition of diverse content, including text, tables, formulas, and charts. Finally, a lightweight post-processing module aggregates the outputs from both stages and formats the final document into structured Markdown and JSON. -->
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/paddleocrvl.png" width="800"/>
 </div>
 ##### PaddleOCR-VL achieves SOTA performance for overall, text, formula, tables and reading order on OmniDocBench v1.5
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/omni15.png" width="800"/>
 </div>
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/omni10.png" width="800"/>
 </div>
 PaddleOCR-VL’s robust and versatile capability in handling diverse document types, establishing it as the leading method in the OmniDocBench-OCR-block performance evaluation.
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/omnibenchocr.png" width="800"/>
 </div>
 In-house-OCR provides a evaluation of performance across multiple languages and text types. Our model demonstrates outstanding accuracy with the lowest edit distances in all evaluated scripts.
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/inhouseocr.png" width="800"/>
 </div>
 Our self-built evaluation set contains diverse types of table images, such as Chinese, English, mixed Chinese-English, and tables with various characteristics like full, partial, or no borders, book/manual formats, lists, academic papers, merged cells, as well as low-quality, watermarked, etc. PaddleOCR-VL achieves remarkable performance across all categories.
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/inhousetable.png" width="600"/>
 </div>
 #### 3. Formula
 In-house-Formula evaluation set contains simple prints, complex prints, camera scans, and handwritten formulas. PaddleOCR-VL demonstrates the best performance in every category.
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/inhouse-formula.png" width="500"/>
 </div>
 The evaluation set is broadly categorized into 11 chart categories, including bar-line hybrid, pie, 100% stacked bar, area, bar, bubble, histogram, line, scatterplot, stacked area, and stacked bar. PaddleOCR-VL not only outperforms expert OCR VLMs but also surpasses some 72B-level multimodal language models.
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/inhousechart.png" width="400"/>
 </div>
 ### Comprehensive Document Parsing
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/overview1.jpg" width="600"/>
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/overview2.jpg" width="600"/>
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/overview3.jpg" width="600"/>
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/overview4.jpg" width="600"/>
 </div>
 ### Text
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/text_english_arabic.jpg" width="300" style="display: inline-block;"/>
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/text_handwriting_02.jpg" width="300" style="display: inline-block;"/>
 </div>
 ### Table
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/table_01.jpg" width="300" style="display: inline-block;"/>
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/table_02.jpg" width="300" style="display: inline-block;"/>
 </div>
 ### Formula
 <div align="center">
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/formula_EN.jpg" width="300" style="display: inline-block;"/>
+<img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/formula_ZH.jpg" width="300" style="display: inline-block;"/>
 </div>
 ### Chart
 <div align="center">
+  <img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/chart_01.jpg" width="300" style="display: inline-block;"/>
+  <img src="https://huggingface.co/datasets/PaddlePaddle/PaddleOCR-VL_demo/resolve/main/imgs/chart_02.jpg" width="300" style="display: inline-block;"/>
 </div>