Image-Text-to-Text
PaddleOCR
Safetensors
English
Chinese
multilingual
paddleocr_vl
ERNIE4.5
PaddlePaddle
image-to-text
ocr
document-parse
layout
table
formula
chart
seal
spotting
conversational
custom_code
Instructions to use PaddlePaddle/PaddleOCR-VL-1.6 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- PaddleOCR
How to use PaddlePaddle/PaddleOCR-VL-1.6 with PaddleOCR:
# See https://www.paddleocr.ai/latest/version3.x/pipeline_usage/PaddleOCR-VL.html to installation from paddleocr import PaddleOCRVL pipeline = PaddleOCRVL(pipeline_version="v1.6") output = pipeline.predict("path/to/document_image.png") for res in output: res.print() res.save_to_json(save_path="output") res.save_to_markdown(save_path="output") - Notebooks
- Google Colab
- Kaggle
功能请求:支持阿姆哈拉语及其他低资源语言
#2
by Yaredoffice - opened
希望未来版本的 PaddleOCR-VL 能够支持阿姆哈拉语以及其他代表性不足的语言。
我测试了 PaddleOCR-VL-1.6,根据我的观察,它似乎目前还不支持阿姆哈拉语 OCR,也没有看到针对阿姆哈拉语的专门训练支持。当然,这可以理解,因为该模型并没有明确声称支持阿姆哈拉语。我只是想把这个建议作为社区反馈提出,供未来版本考虑。
阿姆哈拉语以及其他埃塞俄比亚文字体系语言的支持将非常有价值,尤其是在文档理解、历史文本、扫描表格、教育资料以及低资源语言数字化等方面。
感谢你们在 PaddleOCR-VL 上所做的出色工作。
Yaredoffice changed discussion title from Feature request: Amharic and other low-resource language support to 功能请求:支持阿姆哈拉语及其他低资源语言