Real-time Live Streaming Digital Human Real-time Live Streaming Digital Human 实时直播数字人简介实时直播数字人（Real-time Live Streaming Digital Human）是一项基于少样本学习技术的项目，旨在提供流畅且互动性强的直播体验。该系统能够在NVIDIA 30和40系列显卡上高效运行，实现每秒25帧以上的实时性能。关键特性实

Real-time Live Streaming Digital Human

实时直播数字人（Real-time Live Streaming Digital Human） 是一项基于少样本学习技术的项目，旨在提供流畅且互动性强的直播体验。该系统能够在NVIDIA 30和40系列显卡上高效运行，实现每秒25帧以上的实时性能。

解压模型文件：

cd checkpoint
gzip -d -c render.pth.gz.001 > render.pth

准备视频：使用data_preparation脚本准备视频，将YOUR_VIDEO_PATH替换为你的视频路径：
```
python data_preparation YOUR_VIDEO_PATH
```
结果会保存在 ./video_data 目录中。
使用音频文件运行：需确保音频文件为.wav格式，采样率为16kHz，单声道。将 video_data/test 替换为你的视频信息文件路径，video_data/audio0.wav 替换为音频文件路径，1.mp4 替换为输出视频路径：
```
python demo.py video_data/test video_data/audio0.wav 1.mp4
```
使用麦克风进行实时运行：只需运行以下命令：
```
python demo_avatar.py
```

感谢 wavlip, dinet, livespeechportrait 仓库的贡献者们的公开研究和贡献。

该项目采用MIT许可证。

如果有任何问题或建议，请联系: [[email protected]]

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621