常见问题 ❓
字数
1446 字
阅读
7 分钟
安装使用过程问题汇总
网络
请确保你的 网络 是正常的,VPN 需要打开
全局模式安装过程中环境依赖会全自动下载并完成配置,无需人工干预
模型文件采用按需下载机制:在实际使用时才会下载
目录
目录说明
输出 子目录、文件 解释
├extensions 扩展
├models 模型
├src 代码
├static 静态资源
├webapp 输出目录
│
├─cache 缓存
│ llm 大模型缓存数据
│
├─data 数据
│ db.db 程序数据文件
│ settings.json 用户偏好设置
│
├─extensions 扩展
│ ... 对应扩展所需的配置
│
├─logs 日志
│ creator_2025-01-01.log 运行日志
│
├─spk 说话人音色
│ MacArthur.wav 自定义声音片段
│
├─temp 零时
│ └─test 视频目录
│ │ test.jpg 源封面
│ │ test.mp4 源视频(此视频来源于 `upload` 不会影响源视频)
│ │ test.srt 源字幕
│ │ test.wav 源音频
│ │ test_en.json 最终数据,格式(文件名_标识.json)
│ │ test_en.mp4 最终视频,格式(文件名_标识.wav)
│ │ test_en.srt 最终字幕,格式(文件名_标识.srt)
│ │ test_en.wav 最终音频,格式(文件名_标识.wav)
│ │
│ ├─dubbing 配音文件夹
│ │ 0.wav 片段,格式(下标.wav)
│ │ .....
│ │ test.wav 音频
│ │
│ ├─json 数据文件夹
│ │ test_draft_content.json 剪映草稿输出
│ │ test_draft_input.json 草稿内容输入
│ │ test_asr.json 音频转录数据
│ │
│ ├─stems 音轨分离文件夹
│ │ vocals.wav 说话人声
│ │ test_instrumental.wav 背景伴奏
│ │
│ ├─tts 语言合成文件夹
│ │ 00_c94f3e.wav 片段,格式(下标:2d_MD5.wav)
│ │ .....
│ │ test.wav 音频
│ │
│ ├─voices 人声处理文件夹
│ │ 0.wav 音频,格式(下标.wav)
│
│
├─tts 试听
│ cosy_四妹_1.0_105_0.wav 试听的角色`四妹`音频
│ ...
│
├─upload 上传
│ test.mp4 上传的视频
│
├─download 下载
│ youtube-video.mp4 下载的视频
│ youtube-video.json 下载的视频数据模型目录
首次运行会检测下载模型,自动下载到
models目录下自定义下载位置,可以通过
CREATORBOX_MODEL环境变量指定,或者在/settings页指定,重启后生效
.models
├─creatorbox
│ ├─dh
│ └─uvr
│
├─huggingface
│ └─hub
│ ├─.locks
│ ├─models--SWivid--F5-TTS
│ ├─models--charactr--vocos-mel-24khz
│ ├─models--pyannote--segmentation-3.0
│ ├─models--pyannote--speaker-diarization-3.1
│ ├─models--pyannote--wespeaker-voxceleb-resnet34-LM
│ ├─models--Systran--faster-whisper-base
│ ├─models--Systran--faster-whisper-large-v2
│ └─models--Systran--faster-whisper-medium
│ .....
│
├─modelscope
│ └─iic
│ ├─CosyVoice3-0.5B
│ ├─emotion2vec
│ .....
│
├─torch
│ └─hub
│ ├─big-lama.pt
│ .....安装
显卡使用
解决方法
目前仅支持 N卡
参考配置
bash
nvidia-smi
logs
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jun__6_02:18:23_PDT_2024
Cuda compilation tools, release 12.5, V12.5.82
Build cuda_12.5.r12.5/compiler.34385749_0
Sat Jul 12 14:42:54 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 560.35.03 Driver Version: 560.35.03 CUDA Version: 12.6 |
|---------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=======================================+========================+======================|
| 0 Tesla T4 Off | 00000000:00:04.0 Off | 0 |
| N/A 39C P8 9W / 70W | 1MiB / 15360MiB | 0% Default |
| | | N/A |
+---------------------------------------+------------------------+----------------------+
| 1 Tesla T4 Off | 00000000:00:05.0 Off | 0 |
| N/A 41C P8 9W / 70W | 1MiB / 15360MiB | 0% Default |
| | | N/A |
+---------------------------------------+------------------------+----------------------+参考版本
2.6.0+cu124
bash
uv pip install torch==2.6.0+cu124 torchvision==0.21.0+cu124 torchaudio==2.6.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
uv pip install torch==2.6.0+cu124 torchvision==0.21.0+cu124 torchaudio==2.6.0+cu124 --extra-index-url https://mirrors.nju.edu.cn/pytorch/whl/cu1242.6.0+cu126
bash
uv pip install torch==2.6.0+cu126 torchvision==0.21.0+cu126 torchaudio==2.6.0+cu126 --extra-index-url https://download.pytorch.org/whl/cu126
uv pip install torch==2.6.0+cu126 torchvision==0.21.0+cu126 torchaudio==2.6.0+cu126 --extra-index-url https://mirrors.nju.edu.cn/pytorch/whl/cu126...
启动
启动报错
解决方法
- 启动报错
RuntimeError: this license key is expired,请尝试远程更新
bash
git pull- 启动报错
RuntimeError: [WinError 10060]...(1:11076),请尝试重新启动
bash
uv run --extra {gpu|cpu} cli.py startWindows直接双击start.bat或桌面快捷方式运行,请根据实际配置调整环境
bash
REM Execute script
set SCRIPT_CMD=uv run --extra gpu
set SCRIPT_PATH=cli.py
set SCRIPT_ARGS=start -h 0.0.0.0 -p 8000
if "%~1"=="--debug" (
set SCRIPT_ARGS=%SCRIPT_ARGS% --debug
)- 默认使用
cpu运行,使用gpu需添加--extra gpu参数
启动环境
解决方法
命令启动,需要提前 cmd 进行环境激活,以 D:\Program Files\CreatorBox 为例
- 默认环境
bash
D: & cd "D:\Program Files\CreatorBox\creatorbox" & "D:\Program Files\CreatorBox\creatorbox\.venv\Scripts\activate.bat"- 扩展环境
bash
# index_tts
D: & cd "D:\Program Files\CreatorBox\creatorbox\extensions\index_tts" & "D:\Program Files\CreatorBox\creatorbox\extensions\index_tts\.venv\Scripts\activate.bat"
# cosyvoice
D: & cd "D:\Program Files\CreatorBox\creatorbox\extensions\cosyvoice" & "D:\Program Files\CreatorBox\creatorbox\extensions\cosyvoice\.venv\Scripts\activate.bat"
# gpt_sovits
D: & cd "D:\Program Files\CreatorBox\creatorbox\extensions\gpt_sovits" & "D:\Program Files\CreatorBox\creatorbox\extensions\gpt_sovits\.venv\Scripts\activate.bat"
...正常结果返回
log
(creatorbox) D:\Program Files\CreatorBox\creatorbox>
(index_tts) D:\Program Files\CreatorBox\creatorbox\extensions\index_tts>
(cosyvoice) D:\Program Files\CreatorBox\creatorbox\extensions\cosyvoice>
(gpt_sovits) D:\Program Files\CreatorBox\creatorbox\extensions\gpt_sovits>
...然后在输入命令
使用
设备未就绪
解决方法
log
PermissionError: [WinError 21] 设备未就绪如果安装在系统盘,需要以管理员身份运行,不建议
配音语言配置
使用方式
默认内置 10 种语言,支持自定义添加节点
json
{
"locales": [
{
"name": "中国",
"locale": "zh-CN",
"country": "China",
"enable": true
}
]
// ...
}使用 VPN 异常
解决方法
log
Retrying 1 time(s), translation_json ->
Your location is not supported by google-generativeai at the moment.
Try to use ChatVertexAI LLM from langchain_google_vertexai., waiting 5.0 seconds before retrying.- 出现
Your location is not supported等类似描述,说明 IP 被封,尝试切换代理地区 - 推荐代理,见 《JustMySocks》 章节
使用 Ngrok 报错
解决方法
log
PyngrokNgrokError:
The ngrok process errored on start: authentication failed:
Your account is limited to 1 simultaneous ngrok agent sessions.
You can run multiple simultaneous tunnels from a single agent session by defining the tunnels in your agent configuration file and starting them with the command `ngrok start --all`.
Read more about the agent configuration file: https://ngrok.com/docs/secure-tunnels/ngrok-agent/reference/config
You can view your current agent sessions in the dashboard:
https://dashboard.ngrok.com/agents ERR_NGROK_108.启动出现上述错误,则需要 进入 Ngrok DashBoard https://dashboard.ngrok.com/agents ,关闭正在运行的代理,重新运行
模型
模型下载失败
解决方法
log
An error occured while synchronizing the model Systran/faster-whisper-large-v3 from the Hugging Face Hub:
An error happened while trying to locate the files on the Hub and we cannot find the appropriate snapshot folder for the
specified revision on the local disk. Please check your internet connection and try again.
Trying to load the model directly from the local cache, if it exists.说话人调用错误
解决方法
log
2025-04-18 07:29:31.094 | INFO whisper_.py:102 - Loading Speaker model on device cuda
2025-04-18 07:29:31.865 | ERROR whisper_.py:106 - Error: 401 Client Error: Unauthorized for url: https://hf-mirror.com/pyannote/speaker-diarization-3.1/resolve/main/config.yaml (Request ID: Root=1-6801ff5b-0270fbd846adbc761e229ace;fddee4c5-7f49-4739-bba3-42cbc47dca6e)- 前往并接受
pyannote/segmentation-3.0的用户协议 - 接受
pyannote/speaker-diarization-3.1的用户协议 - 前往并获取访问令牌:
huggingface.co/settings/tokens
