AI新工具

blog-thum
open-pi-zero

open-pi-zero是基于Physical Intelligence的pi0模型,采用MoE架构和预训练的3B PaliGemma VLM实现。

read more
blog-thum
Open Canvas

Open Canvas是一个开源Web应用,旨在通过与智能体协作,提升文档写作效率,支持记忆和自定义操作。

read more
blog-thum
flexrag

FlexRAG是一个灵活高效的框架,专为多模态检索增强生成任务设计,支持简单配置与高性能应用。

read more
blog-thum
LatentSync

LatentSync是一种基于音频的潜在扩散模型的唇同步框架,能提升时间一致性与同步精度。

read more
blog-thum
gitpodcast

GitPodcast可以轻松将任何GitHub仓库转化为精彩播客,支持快速生成和自定义声音选择。

read more