鸣数IP 智能视频工作台

云端声音克隆

API Key 和语音模型请在设置页中配置。克隆方式也在设置页选择。

声音名称

参考文本 (云端克隆需要)

参考音频

⚠️ 参考声音文件时长不能超过30秒，建议10-30秒清晰无噪音的音频

已克隆的声音

暂无克隆声音

CosyVoice 情感 & 语言

勾选后将在首页"克隆声音"处显示对应选项，生成语音时自动附加提示词。

情感风格

语言/方言

HeyGem 形象管理

检查中...

HeyGem 引擎直接使用参考视频进行推理，上传视频后即可在首页选择使用。

角色名称

参考视频

上传包含人脸的正面说话视频，HeyGem 将直接使用此视频作为参考

已保存的 HeyGem 角色

暂无保存的角色

ONNX 形象管理

检查中...

ONNX 引擎需要预处理视频（提取人脸特征），预处理后的模型可缓存复用，后续合成速度更快。

上传新视频

支持 MP4 格式，建议使用正面说话的视频

模型名称给模型起一个容易识别的名字，方便后续选择

准备中...

已缓存的 ONNX 模型

暂无缓存模型，请上传视频并预处理

画中画素材库

💡 使用说明：每张素材图片需要设置一个「匹配关键词」。生成视频时，系统会自动扫描文案内容，当文案中出现该关键词时，对应的素材图片会以画中画形式插入到视频中。
例如：素材标签设为"代码"，当文案出现"代码"一词时，该图片会自动叠加显示在视频画面上。

共 0 张素材

暂无素材，请扫描文件夹或添加单个图片

背景音乐库

加载中...

总任务

0

已完成

0

失败

0

	#	任务标题	状态	当前步骤	创建时间	操作
暂无任务记录

加载中...

发布平台账号

抖音未登录

视频号未登录

小红书未登录

快手未登录

B站未登录

百家号未登录

AI 大模型配置

配置文案改写使用的大模型 API Key，千问和 DeepSeek 均通过阿里云百炼平台开通，至少配置一个即可。

默认模型

千问 (Qwen) API Key

去开通

DeepSeek API Key

去开通

SiliconFlow 语音配置

云端克隆本地克隆

SiliconFlow 付费

使用 SiliconFlow 云端 API，音色丰富、合成速度快，需自行注册获取 API Key。

SiliconFlow API Key

去开通

语音模型

管理语音模型列表

加载中...

数字人模式

本地推理云端推理

使用本机 GPU 进行数字人合成推理。

HeyGem 引擎检查中...

TTONNX 引擎检查中...

⚠️ 本地推理最低配置要求
HeyGem 引擎：NVIDIA RTX 3060 及以上（8GB+ 显存），16GB 内存
TTONNX 引擎：NVIDIA RTX 3060 及以上（6GB+ 显存），16GB 内存
如不满足要求，请选择「云端推理」模式。

AI 违禁词管理

配置需要在文案审核中排除的违禁词/敏感词，点击"AI 违禁审核"按钮时将自动检测并改写。

添加违禁词

当前违禁词列表

加载中...

AI 提示词管理

管理文案改写时使用的提示词模板。内置提示词可编辑但不可删除，自定义提示词可自由增删。

内置提示词

加载中...

自定义提示词

加载中...

添加自定义提示词

字幕纠错提示词

使用说明

鸣数IP 智能视频工作台是一站式视频制作解决方案。

工作流程

提取或编写文案
AI改写优化文案
克隆声音生成音频
真人口播/带货视频合成
添加字幕、素材、背景音乐
预览和下载视频
设计封面并发布到多平台

快捷操作

左侧菜单可以单独管理声音、形象、素材等资源。

详细使用说明请参考 docs 目录下的文档。

1. 学对标

2. 搞文案

3. 学说话

4. 生视频

5. 剪视频

6. 发视频

声音管理

云端声音克隆

已克隆的声音

CosyVoice 情感 & 语言

情感风格

语言/方言

形象管理

HeyGem 形象管理

已保存的 HeyGem 角色

ONNX 形象管理

已缓存的 ONNX 模型

素材管理

画中画素材库

背景音乐库

任务中心

账号管理

发布平台账号

设置

AI 大模型配置

SiliconFlow 语音配置

数字人模式

AI 违禁词管理

AI 提示词管理

帮助

使用说明

工作流程

快捷操作