AI新工具(20240619) 10 种语言文本准确渲染；Mac无需联网的本地聊天应用；多模态语言模型（MLM）基准测试的引擎；Yolo DotNet版本 ✨ 1: Glyph-ByT5 10 种语言文本准确渲染，将文本渲染的准确性从提高到近 90% ，同时还能实现段落渲染+自动布局 Glyph-ByT5是一种定制的文本编码器，旨在实现准确的文字视觉渲染。其核心思想是通过细致的字形-文本配对数据集的微调，提升字符感知和与字形的对齐能

AI新工具(20240619) 10 种语言文本准确渲染；Mac无需联网的本地聊天应用；多模态语言模型（MLM）基准测试的引擎；Yolo DotNet版本

By AiBard123
June 19, 2024 - 2 min read

✨ 1: Glyph-ByT5

10 种语言文本准确渲染，将文本渲染的准确性从提高到近 90% ，同时还能实现段落渲染+自动布局

Glyph-ByT5是一种定制的文本编码器，旨在实现准确的文字视觉渲染。其核心思想是通过细致的字形-文本配对数据集的微调，提升字符感知和与字形的对齐能力。Glyph-ByT5模型在与SDXL整合后，形成了Glyph-SDXL模型，用于设计图像生成，极大地提升了文本渲染的准确性。后续版本Glyph-ByT5-v2进一步提升了多语言文本渲染的美学效果，支持约10种不同语言的准确拼写。

模型地址：https://huggingface.co/spaces/GlyphByT5/Glyph-SDXL-v2

地址：https://github.com/AIGText/Glyph-ByT5

✨ 2: FreeChat

FreeChat 是一款无需联网的本地聊天应用，支持自定义角色和离线对话。

FreeChat 是一种无需安装任何其他软件即可在 Mac 上与大语言模型（LLM）进行聊天的应用程序。所有对话均保存在本地，且所有通信都离线进行。

地址：https://github.com/psugihara/FreeChat

✨ 3: OmniChain

OmniChain是一个自我更新的可视化工作流工具，适用于大型语言模型的自动化、机器人及集成应用。

OmniChain 是一种高效自更新的视觉工作流工具，专为大型语言模型设计，主要用于构建自动化流程、聊天机器人、智能代理，并能与现有框架集成。

地址：https://github.com/zenoverflow/omnichain

✨ 4: TaskMeAnything

TaskMeAnything是一个生成大规模多模态语言模型（MLM）基准测试的引擎。

TaskMeAnything 是一个基准生成引擎，它能够根据用户的需求为大型多模态语言模型 (MLM) 生成基准测试。该引擎维护着一个可扩展的视觉资产分类系统，并可以以编程方式生成大量的任务实例。此外，它还能在有限的计算预算内针对用户关于 MLM 性能的查询进行算法优化。当前版本可以生成超过 5 亿对用以评估 MLM 感知能力的图像/视频问答对。

地址：https://github.com/JieyuZ2/TaskMeAnything

✨ 5: YoloDotNet

YoloDotNet 是基于C#的实时目标检测库，支持分类、目标检测、OBB检测、分割和姿态估计。

YoloDotNet 是一个基于 .NET 8 的 C# 实现，用于实时检测图像和视频中的物体。它利用了 ML.NET 和 ONNX runtime，并支持通过 CUDA 进行 GPU 加速。

YoloDotNet 提供了强大的图像和视频分析功能，适用于各种计算机视觉应用。其可定制性和 GPU 加速支持使其成为处理大规模图像和视频数据的理想选择。

地址：https://github.com/NickSwardh/YoloDotNet

更多AI工具，参考国内AiBard123，Github-AiBard123 公众号：每日AI新工具

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621