首页   

转:PDF转Markdown 方案选型 by 九原客(x.com-20240727134526

宝玉xp  · AI  · 2 月前

2024-07-27 13:45

转:PDF转Markdown 方案选型 by 九原客(x.com/9hills)

1. document-convert(开源):[github.com/multimodal-art-projection/MAP-NEO/tree/main/Matrix/document-convert](网页链接)
2. Ragflow(开源):[github.com/infiniflow/ragflow](网页链接)
3. gptpdf(开源):[github.com/CosmosShadow/gptpdf](网页链接)
4. 百度云Textmind(闭源):[cloud.baidu.com/product/textmind.html](网页链接)
5. doc2x(闭源):[doc2x.noedgeai.com/](网页链接)
6. 腾讯云文档解析(闭源):[cloud.tencent.com/document/product/1759/107504](网页链接)
7. marker(开源):[github.com/VikParuchuri/marker](网页链接)
8. PDF-Extract-Kit(开源):[github.com/opendatalab/PDF-Extract-Kit](网页链接)
9. zerox(开源):[github.com/getomni-ai/zerox](网页链接)
10. OminiParse(开源):[github.com/adithya-s-k/omniparse](网页链接)
11. MinerU(开源):[github.com/opendatalab/MinerU](网页链接)

评估方法:

- 评估指标:人工评估
- 评估数据集:
* 数字PDF:论文、财报(含图片、表格和文字)
* 扫描PDF:书籍(含图片、表格和文字)、模拟试卷、水印文档、教辅习题、复杂合并单元格表格、财报图片格式(含复杂表格)、含图片的表格。

来源:网页链接
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com