精选· 重要性 4/5

PaddlePaddle/PaddleOCR：将PDF与图像转为结构化数据，支持100+语言

GitHub Trending (AI repos)·大约 2 个月前·PaddlePaddle·约 1 分钟阅读

中文导读

PaddleOCR是一个强大且轻量的OCR工具包，能将任意PDF或图像文档转化为结构化数据，便于AI（尤其是LLM）处理，支持100多种语言。

PaddlePaddle/PaddleOCR86,247

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.

在 GitHub 查看完整介绍

原文出处

PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

PaddlePaddle/PaddleOCR：将PDF与图像转为结构化数据，支持100+语言

相关阅读

Bluesky AI助手Attie扩展为开放社交研究工具

Midjourney 收购占星社交应用 Co-Star，拓展产品线

硅谷在中国AI开放权重模型问题上严重分裂