工具名:gptpdf

功能:使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。

通过只有293行代码几乎可以完美地解析PDF排版、数学公式、表格、图片、图表等。每页平均价格约为0.013 美元

处理流程:
1. 使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记;
2. 使用视觉大模型(如 GPT-4o)进行解析,得到 markdown 文件。

GitHub地址

关注频道 @ZaiHuaPd
频道爆料 @ZaiHuabot

via 软件新闻频道📮投稿爆料 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]