vdr-2b-multi-v1 vdr-2b-multi-v1 vdr-2b-multi-v1是一种多语言嵌入模型，专为视觉文档检索而设计，支持多种语言和领域。该模型能够将文档页面截图编码为单一密集向量表示，从而可以在无需OCR或数据提取管道的情况下，搜索和查询丰富的多语言文档。vdr-2b-mult

vdr-2b-multi-v1

vdr-2b-multi-v1是一种多语言嵌入模型，专为视觉文档检索而设计，支持多种语言和领域。该模型能够将文档页面截图编码为单一密集向量表示，从而可以在无需OCR或数据提取管道的情况下，搜索和查询丰富的多语言文档。vdr-2b-multi-v1是基于MrLight/dse-qwen2-2b-mrl-v1训练的，使用了自制的多语言查询-图像对大数据集，包含50万个高质量样本，是目前最大的开源多语言合成数据集。

该模型支持意大利语、西班牙语、英语、法语和德语，具有更快的推断速度和更低的显存使用，并在跨语言检索上表现优异。通过Matryoshka表示学习（MRL），模型可以在不降低嵌入质量的情况下减少向量尺寸，从而加快检索速度并降低存储成本。

总体而言，vdr-2b-multi-v1在多语言和跨语言场景中显著提高了检索性能，并为语言不通的用户提供了便利，特别是在复杂的多语言环境如欧洲。未来的工作将集中在模型在特定领域的适应性上，为开拓新的应用场景提供可能。

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621

vdr-2b-multi-v1

介绍：

vdr-2b-multi-v1