1. 学对标

2. 搞文案

3. 学说话

音频将在这里显示

4. 生视频

检查中
请选择形象

5. 剪视频

① 校准字幕
准备中...
② 字幕&标题&动画
③ 混剪合成
未选择素材
未设置
1 0.3
等待生成视频...

暂无预览视频

生成视频后将在此处显示

6. 发视频

请先取帧或上传图片
取帧 无视频
字号 位置
高亮字号
0/100

云端声音克隆

API Key 和语音模型请在 设置页 中配置。克隆方式也在设置页选择。

⚠️ 参考声音文件时长不能超过30秒,建议10-30秒清晰无噪音的音频

已克隆的声音

暂无克隆声音

CosyVoice 情感 & 语言

勾选后将在首页"克隆声音"处显示对应选项,生成语音时自动附加提示词。

情感风格

语言/方言

HeyGem 形象管理

检查中...

HeyGem 引擎直接使用参考视频进行推理,上传视频后即可在首页选择使用。

上传包含人脸的正面说话视频,HeyGem 将直接使用此视频作为参考

已保存的 HeyGem 角色

暂无保存的角色

ONNX 形象管理

检查中...

ONNX 引擎需要预处理视频(提取人脸特征),预处理后的模型可缓存复用,后续合成速度更快。

支持 MP4 格式,建议使用正面说话的视频
给模型起一个容易识别的名字,方便后续选择

准备中...

已缓存的 ONNX 模型

暂无缓存模型,请上传视频并预处理

画中画素材库

💡 使用说明: 每张素材图片需要设置一个「匹配关键词」。生成视频时,系统会自动扫描文案内容,当文案中出现该关键词时,对应的素材图片会以画中画形式插入到视频中。
例如:素材标签设为"代码",当文案出现"代码"一词时,该图片会自动叠加显示在视频画面上。
共 0 张素材

暂无素材,请扫描文件夹或添加单个图片

背景音乐库

加载中...

总任务
0
已完成
0
失败
0
# 任务标题 状态 当前步骤 创建时间 操作
暂无任务记录

加载中...

发布平台账号

抖音 未登录
视频号 未登录
小红书 未登录
快手 未登录
B站 未登录
百家号 未登录

AI 大模型配置

配置文案改写使用的大模型 API Key,千问和 DeepSeek 均通过阿里云百炼平台开通,至少配置一个即可。

去开通
去开通

SiliconFlow 语音配置

使用 SiliconFlow 云端 API,音色丰富、合成速度快,需自行注册获取 API Key。

去开通
加载中...

数字人模式

使用本机 GPU 进行数字人合成推理。

HeyGem 引擎 检查中...
TTONNX 引擎 检查中...
⚠️ 本地推理最低配置要求
HeyGem 引擎:NVIDIA RTX 3060 及以上(8GB+ 显存),16GB 内存
TTONNX 引擎:NVIDIA RTX 3060 及以上(6GB+ 显存),16GB 内存
如不满足要求,请选择「云端推理」模式。

AI 违禁词管理

配置需要在文案审核中排除的违禁词/敏感词,点击"AI 违禁审核"按钮时将自动检测并改写。

加载中...

AI 提示词管理

管理文案改写时使用的提示词模板。内置提示词可编辑但不可删除,自定义提示词可自由增删。

加载中...
加载中...

使用说明

鸣数IP 智能视频工作台是一站式视频制作解决方案。

工作流程

  1. 提取或编写文案
  2. AI改写优化文案
  3. 克隆声音生成音频
  4. 真人口播/带货视频合成
  5. 添加字幕、素材、背景音乐
  6. 预览和下载视频
  7. 设计封面并发布到多平台

快捷操作

左侧菜单可以单独管理声音、形象、素材等资源。

详细使用说明请参考 docs 目录下的文档。