Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

news pappernews papper
0

百度飞桨PaddleOCR 2.9发布:文档场景信息抽取能力大幅提升

百度飞桨(PaddlePaddle)近日发布了其开源光学字符识别(OCR)工具库PaddleOCR的最新版本2.9。该版本在文档场景信息抽取能力方面取得了显著突破,并新增多个实用的OCR基础模型,进一步提升了PaddleOCR的易用性和功能性。

文档场景信息抽取能力的提升是PaddleOCR 2.9的一大亮点。 该版本推出了PP-ChatOCRv3-doc开源版,该模型在版面解析和信息抽取方面取得了显著提升,能够更精准地识别和提取文档中的结构化信息。这对于需要对文档进行数字化处理的场景,例如书籍、合同、发票、报告等,具有重要的意义。

PaddleOCR 2.9还整合了17个OCR相关模型,包括版面区域检测、表格识别、公式识别等,形成了6条模型产线。 用户可以通过Python API一键调用这些模型,方便快捷地进行各种OCR任务。

为了降低开发门槛,提高开发效率,PaddleOCR 2.9还支持低代码全流程开发。 用户可以使用统一命令或图形界面进行模型的使用、组合与定制,无需编写复杂的代码即可完成OCR任务。

此外,PaddleOCR 2.9还支持高性能推理、服务化部署和端侧部署等多种部署方式, 能够适应不同的应用场景。该版本还兼容多种主流硬件平台,如英伟达GPU、昆仑芯、昇腾、寒武纪等,实现无缝切换。

PaddleOCR 2.9的技术原理基于飞桨(PaddlePaddle)深度学习平台, 利用强大的深度学习能力和易用性,实现了对文档场景信息的高效提取。该版本采用了版面分析技术,包括版面区域检测、文字检测等,识别文档结构;并利用图像矫正、增强等技术改善图像质量,提高后续识别的准确性。此外,PaddleOCR 2.9还基于CRNN、DB等先进的文本识别网络,实现对图像中文字的准确识别,并通过深度学习模型识别和解析表格结构,提取表格数据。

PaddleOCR 2.9的应用场景非常广泛, 包括:

  • 文档数字化: 将纸质文档转换为电子版,包括书籍、合同、发票、报告等,方便存储和检索。
  • 智能办公: 在办公自动化系统中,自动识别和处理文档中的数据,提高工作效率。
  • 身份验证: 在身份认证系统中,读取和验证身份证、驾驶证等证件上的信息。
  • 物流管理: 在物流行业中,自动识别快递单号、条形码等信息,提高物流分拣的效率。
  • 金融服务: 在银行和金融行业中,自动识别支票、账单、合同等文档中的关键信息。

PaddleOCR 2.9的发布,标志着百度飞桨在OCR领域取得了新的突破。 该版本不仅提升了文档场景信息抽取能力,还简化了开发流程,提高了易用性,将进一步推动OCR技术在各行业的应用。

PaddleOCR 2.9的项目地址:

https://github.com/PaddlePaddle/PaddleOCR

PaddleOCR 2.9的发布,为OCR技术的应用开辟了更广阔的道路, 也将为各行业带来更多智能化和高效化的解决方案。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注