百度推出超轻量文字识别模型 PP-OCRv5:0.07B 参数,性能超越 GPT-4o

百度发布超轻量文字识别模型PP-OCRv5:0.07B参数,性能秒杀GPT-4o

百度 PP-OCRv5 文字识别 AI 模型 0.07B GPT-4o

​​智融视界2025年09月14日 10:19消息,百度发布PP-OCRv5,仅0.07B参数,部分测试超越GPT-4o。

   IT之家9月13日消息,百度于9月10日在HuggingFace平台推出了新一代文字识别解决方案PP-OCRv5。这一发布展示了百度在自然语言处理和计算机视觉领域的持续投入与技术积累,也反映出其在全球开源社区中的活跃度。PP-OCRv5的推出,不仅为开发者提供了更高效、准确的文字识别工具,也为相关应用场景带来了更多可能性。在当前AI技术快速发展的背景下,此类技术的持续优化和开放共享,对推动行业进步具有积极意义。

   百度介绍称,PP-OCRv5是一个为解决大型视觉语言模型(VLMs)不足而开发的专用OCR模型,它提供了一个高效、精准且轻量级的解决方案。

   PP-OCRv5 通过保持模块化、两阶段的流程,专门针对高速、精确的文本检测和识别,解决了大型 VLMs 的精确文本定位和边界框精度局限性问题。

   PP-OCRv5 的亮点如下:

   效率:该模型参数量仅为 0.07B,能够在 CPU 和边缘设备上实现更高性能,其移动版本在英特尔 Xeon Gold 6271C CPU 上每秒可处理超过 370 个字符。

   性能:PP-OCRv5 在 OCR 特定基准测试中优于通用型 VLM 模型,如 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o,包括手写和印刷的中英文以及拼音文本。

   定位:PP-OCRv5 旨在提供精确的文本行边界框坐标,这对于结构化数据提取和内容分析是关键要求。

   多语言支持:该模型支持五种文字形式——简体中文、繁体中文、英文、日文和拼音,并能够识别超过40种语言。

   PP-OCRv5 由四个核心组件构成:

   图像预处理:处理图像的旋转和畸变,以标准化输入。

   文本检测:识别图像中文本行的精确位置。

   文本行方向:对检测到的文本方向进行分类,以确保其正确对齐,从而提高识别准确性。

   文本识别:将每行文本中的字符解码为文本字符串。

   IT 之家附 PP-OCRv5 下载地址如下:

   https://huggingface.co/collections/PaddlePaddle/pp-ocrv5-684a5356aef5b4b1d7b85e4b

相关阅读

月之暗面Kimi训练成本仅460万,性能逆袭超GPT模型
GPU告急!OpenAI紧急调整:Sora免费视频生成将大幅缩水
五部门力推具身机器人走进千家万户,2027年将现50个智慧数字城市
谷歌地球升级AI,Gemini赋能:聊天间洞悉风暴威胁

发表评论

请输入您的姓名
请输入有效的邮箱地址
请填写评论内容

AI栏目

智融视界AI栏目为您提供第一时间的新闻报道、深度分析和独家视角。

即时资讯

全天候更新热点事件,第一时间传递重要新闻

深度分析

专业团队解读事件背景与深层影响

24小时热文

AI管理顾问上线!端点科技AI原生ERP开启智能职场新纪元
2025-10-27 14:43

AI管理顾问上线,端点科技重塑职场智能化未来

NTT震撼发布日语AI新星tsuzumi2:30B参数,40GB显存单卡畅跑
2025-10-21 19:19

单卡40GB显存畅跑!NTT发布30B参数日语AI巨兽tsuzumi2,性能炸裂引爆行业

AI手机谁领风骚?荣耀Magic8引爆2025旗舰新风暴
2025-10-21 19:18

AI手机谁领风骚?荣耀Magic8引爆2025旗舰新风暴,智启未来!

全球首款无水液冷HGX B300服务器亮相,永擎4U16X-GNR2/ZC引领算力新革命
2025-10-15 13:35

全球首款无水液冷服务器问世,算力革命再掀浪潮

谷歌云CEO库里安重磅发声:AI不会取代人类,未来属于人机协作
2025-10-11 14:37

人机共舞时代开启:库里安预言AI革命中的共生未来

AI汽车驶入未来:云栖大会上演乐与路新篇章
2025-10-09 11:17

AI汽车驶入未来:云栖大会上演智能出行新纪元

蚂蚁集团推出万亿参数开源大模型 Ling-1T,性能登顶全球榜单
2025-10-09 10:42

蚂蚁集团发布超万亿参数大模型,性能全球领先

算力困局突显,OpenAI首秀AI硬件或将延期
2025-10-06 23:52

AI硬件首秀告急?OpenAI算力困局引爆行业震荡

OpenAI布局消费金融,收购Roi打造个性化AI投资新生态
2025-10-05 16:39

OpenAI布局消费金融,Roi助力打造智能财富新未来

任天堂强硬回应:AI监管不妥协,侵权行为必追责
2025-10-05 16:37

任天堂亮剑AI侵权:技术再强,也逃不过法律追责