news pappernews papper

百度飞桨PaddleOCR 2.9发布:文档场景信息抽取能力大幅提升

百度飞桨(PaddlePaddle)近日发布了其开源光学字符识别(OCR)工具库PaddleOCR的最新版本2.9。该版本在文档场景信息抽取能力方面取得了显著突破,并新增多个实用的OCR基础模型,进一步提升了PaddleOCR的易用性和功能性。

文档场景信息抽取能力的提升是PaddleOCR 2.9的一大亮点。 该版本推出了PP-ChatOCRv3-doc开源版,该模型在版面解析和信息抽取方面取得了显著提升,能够更精准地识别和提取文档中的结构化信息。这对于需要对文档进行数字化处理的场景,例如书籍、合同、发票、报告等,具有重要的意义。

PaddleOCR 2.9还整合了17个OCR相关模型,包括版面区域检测、表格识别、公式识别等,形成了6条模型产线。 用户可以通过Python API一键调用这些模型,方便快捷地进行各种OCR任务。

为了降低开发门槛,提高开发效率,PaddleOCR 2.9还支持低代码全流程开发。 用户可以使用统一命令或图形界面进行模型的使用、组合与定制,无需编写复杂的代码即可完成OCR任务。

此外,PaddleOCR 2.9还支持高性能推理、服务化部署和端侧部署等多种部署方式, 能够适应不同的应用场景。该版本还兼容多种主流硬件平台,如英伟达GPU、昆仑芯、昇腾、寒武纪等,实现无缝切换。

PaddleOCR 2.9的技术原理基于飞桨(PaddlePaddle)深度学习平台, 利用强大的深度学习能力和易用性,实现了对文档场景信息的高效提取。该版本采用了版面分析技术,包括版面区域检测、文字检测等,识别文档结构;并利用图像矫正、增强等技术改善图像质量,提高后续识别的准确性。此外,PaddleOCR 2.9还基于CRNN、DB等先进的文本识别网络,实现对图像中文字的准确识别,并通过深度学习模型识别和解析表格结构,提取表格数据。

PaddleOCR 2.9的应用场景非常广泛, 包括:

  • 文档数字化: 将纸质文档转换为电子版,包括书籍、合同、发票、报告等,方便存储和检索。
  • 智能办公: 在办公自动化系统中,自动识别和处理文档中的数据,提高工作效率。
  • 身份验证: 在身份认证系统中,读取和验证身份证、驾驶证等证件上的信息。
  • 物流管理: 在物流行业中,自动识别快递单号、条形码等信息,提高物流分拣的效率。
  • 金融服务: 在银行和金融行业中,自动识别支票、账单、合同等文档中的关键信息。

PaddleOCR 2.9的发布,标志着百度飞桨在OCR领域取得了新的突破。 该版本不仅提升了文档场景信息抽取能力,还简化了开发流程,提高了易用性,将进一步推动OCR技术在各行业的应用。

PaddleOCR 2.9的项目地址:

https://github.com/PaddlePaddle/PaddleOCR

PaddleOCR 2.9的发布,为OCR技术的应用开辟了更广阔的道路, 也将为各行业带来更多智能化和高效化的解决方案。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注