💡 百度发布飞桨OCRv5:轻量高效,性能超越GPT-4o

百度在Hugging Face发布了新一代文字识别解决方案飞桨OCRv5。该模型参数量仅0.07B,具备轻量高效的特点,可在CPU及边缘设备上运行,其移动版在英特尔Xeon Gold 6271C CPU上每秒可处理超过370个字符。飞桨OCRv5采用模块化两阶段流程,在OCR特定基准测试中,其表现优于Gemini 2.5 Pro、Qwen2.5-VL和GPT-4o,支持简体中文、繁体中文、英文、日文、拼音等40余种语言,覆盖手写和印刷文本。

(科技圈)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]