AI新工具
banner

𝚃𝚎𝚡𝚃𝚎𝚕𝚕𝚎𝚛


介绍:

能够将图像中的数学公式识别并转换为LaTeX风格的公式









𝚃𝚎𝚡𝚃𝚎𝚕𝚕𝚎𝚛

TexTeller是一个基于ViT(Vision Transformer)的模型,专门设计用于端到端的公式识别。它能在自然图像中识别公式,并将它们转换成LaTeX风格的公式。这款工具在数据量更大的训练集(550K的数据集)上训练,展现出来的泛化能力和准确性优于LaTeX-OCR(使用了大约100K的数据)。其大数据集使TexTeller能更有效地覆盖大部分使用场景,而且还计划发布在5.5M数据集上训练的检查点。

在以下情况下会使用TexTeller:

  1. 学术研究与教学: 在学术研究,数学,物理,工程等领域教学中,需要将书籍、论文、手写笔记中的数学公式数字化时,TexTeller提供了一种快速转换图片中公式到LaTeX代码的方式。

  2. 开发项目需求: 对于开发者来说,当项目需要数学公式识别功能,尤其是在处理自然图像中的数学公式时,TexTeller提供了简单易用的API支持,便于集成到应用或服务中。

  3. 数学内容创作: 对于数学内容创作者,如教材编写者、在线教育平台等,在创建包含大量数学公式的内容时,使用TexTeller可以简化从草图或书籍中提取和转换数学公式的过程。

  4. 数学论坛和博客: 在数学、物理或工程学领域的论坛和博客上发布内容时,作者可以方便地将手绘或扫描的数学公式转换为清晰的LaTeX公式,提高内容的清晰度和可读性。

使用TexTeller的前提条件包括Python 3.10和PyTorch环境,推荐使用CUDA版本>=12.0以实现更高效的推理。使用TexTeller非常简单,只需克隆仓库,安装要求的包,然后就可以运行推理代码,将图像中的公式转化为LaTeX代码了。它还提供了Web演示和API,方便在自己的项目中使用。

此外,对于有特定需要的用户,TexTeller还提供了训练和微调模型的方法。用户可以使用自己的数据集重新训练模型,甚至可以重新训练分词器以适应特定的词汇量。

TexTeller提供了一个强大且易用的工具,使从自然图像中识别并转换数学公式变得快速且简便。无论是学术界、教育领域,还是需要数学公式识别功能的开发项目,TexTeller都能提供巨大帮助。

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621