AI新工具(20240702) 腾讯开源高质量人类运动视频的框架；通过音频指令修改图像；利用YOLO分析网球视频；Gemma-2中文微调模型 ✨ 1: MimicMotion MimicMotion 腾讯开源的通过姿态指导生成高质量任意长度人类运动视频的框架 MimicMotion 是一种可控视频生成框架，旨在生成高质量的任意长度人物动作视频，采用带有置信度的姿态引导，并通过区域损失放大来缓解图像失真。其主要特点包括丰富的细节、良好的时间连贯性和能够生

AI新工具(20240702) 腾讯开源高质量人类运动视频的框架；通过音频指令修改图像；利用YOLO分析网球视频；Gemma-2中文微调模型

By AiBard123
July 2, 2024 - 2 min read

✨ 1: MimicMotion

MimicMotion 腾讯开源的通过姿态指导生成高质量任意长度人类运动视频的框架

MimicMotion 是一种可控视频生成框架，旨在生成高质量的任意长度人物动作视频，采用带有置信度的姿态引导，并通过区域损失放大来缓解图像失真。其主要特点包括丰富的细节、良好的时间连贯性和能够生成长视频。

地址：https://github.com/Tencent/MimicMotion

✨ 2: Tennis Analysis

该项目利用YOLO和CNN分析网球视频中的选手和球速。

网球分析项目通过分析视频中的网球选手来测量他们的速度、球拍击球速度以及击球次数。该项目使用YOLO技术检测选手和网球，并利用卷积神经网络（CNN）提取球场关键点。这个实践项目非常适合提升你的机器学习和计算机视觉技能。

地址：https://github.com/abdullahtarek/tennis_analysis

✨ 3: Gemma 2 9B Chinese Chat

Gemma-2-9B-Chinese-Chat是首个为中英文用户设计的指令微调语言模型，具备角色扮演等多种能力。

Gemma-2-9B-Chinese-Chat 是一个基于 Google/gemma-2-9b-it 构建的指令微调语言模型，专门为中英双语用户设计，具备角色扮演和工具使用等多种能力。它由王慎执和郑耀威开发，并采用了ORPO算法在超过10万条偏好数据集上进行训练，以改善原始模型在回答中文问题时使用英文回答和中英混合回答的问题。

这个模型支持 BF16 和 GGUF 格式，并提供了不同版本以便根据用户需求进行选择和使用。BF16 版本需要在Python环境中进行部署，而GGUF版本可以在 LM Studio 中使用。

Gemma-2-9B-Chinese-Chat在多个领域表现出色，例如角色扮演、函数调用和数学问题解决，同时也具备安全过滤功能，确保不会提供危害性的指导或信息。该模型在 Hugging Face 平台上有详细的使用指南和丰富的示例，展示其在写作、编程等方面的应用效果。用户若对模型感兴趣，可以通过具体代码片段和示例来体验模型的功能，并通过引用来标注使用权。

如果你喜欢这个模型，请在 Hugging Face 的仓库上赞一下，并在使用过程中引用相关信息。

地址：https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-Chat