SmolDocling-256M-preview SmolDocling-256M-preview SmolDocling-256M-preview 是一个多模态的图像-文本到文本的模型，专为高效文档转换而设计。它保留了 Docling 的主要功能，并完全兼容 Docling，通过无缝支持 DoclingDocuments 实现。主要特点包括： DocTags: 采用DocTags标签，这是一种高效且最小的文档表示方法，完全兼容 DoclingDocum

SmolDocling-256M-preview

SmolDocling-256M-preview 是一个多模态的图像-文本到文本的模型，专为高效文档转换而设计。它保留了 Docling 的主要功能，并完全兼容 Docling，通过无缝支持 DoclingDocuments 实现。主要特点包括：

该模型基于 Idefics3 微调，使用 DocTags 进行高效 Token 化，并将提供图表识别增强，多页推理支持，以及化学识别等功能。开发者还提供了使用 transformers 或 vllm 进行推理，并使用 Docling 将结果转换为多种输出格式的代码示例。

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621