AI新工具

blog-thum
MotionBooth

MotionBooth是一套能够自定义并控制对象和摄像机运动的文本生成视频框架。

read more
blog-thum
sed_vis

《sed_vis》是一款开源Python工具箱,用于可视化声音事件检测的注释和系统输出。

read more
blog-thum
SpeechLLM

SpeechLLM是一个多模态语言模型,可分析和预测会话中讲话者的元数据。

read more