Skip to content
/CreatorBox/images/jms_logo.png

常见问题 ❓

字数
1446 字
阅读
7 分钟

安装使用过程问题汇总

网络

  • 请确保你的 网络 是正常的,VPN 需要打开全局模式

  • 安装过程中环境依赖会全自动下载并完成配置,无需人工干预

  • 模型文件采用按需下载机制:在实际使用时才会下载

目录

目录说明

输出 子目录文件 解释

├extensions 扩展
├models     模型
├src        代码
├static     静态资源
├webapp     输出目录

├─cache 缓存
│      llm                             大模型缓存数据

├─data 数据
│      db.db                           程序数据文件
│      settings.json                   用户偏好设置

├─extensions 扩展
│      ...                             对应扩展所需的配置

├─logs 日志
│      creator_2025-01-01.log          运行日志

├─spk 说话人音色
│      MacArthur.wav                   自定义声音片段

├─temp 零时
│  └─test 视频目录
│      │  test.jpg                     源封面
│      │  test.mp4                     源视频(此视频来源于 `upload` 不会影响源视频)
│      │  test.srt                     源字幕
│      │  test.wav                     源音频
│      │  test_en.json                 最终数据,格式(文件名_标识.json)
│      │  test_en.mp4                  最终视频,格式(文件名_标识.wav)
│      │  test_en.srt                  最终字幕,格式(文件名_标识.srt)
│      │  test_en.wav                  最终音频,格式(文件名_标识.wav)
│      │
│      ├─dubbing 配音文件夹
│      │      0.wav                    片段,格式(下标.wav)
│      │      .....
│      │      test.wav                 音频
│      │
│      ├─json 数据文件夹
│      │      test_draft_content.json  剪映草稿输出
│      │      test_draft_input.json    草稿内容输入
│      │      test_asr.json            音频转录数据
│      │
│      ├─stems 音轨分离文件夹
│      │      vocals.wav               说话人声
│      │      test_instrumental.wav    背景伴奏
│      │
│      ├─tts  语言合成文件夹
│      │      00_c94f3e.wav            片段,格式(下标:2d_MD5.wav)
│      │      .....
│      │      test.wav                 音频
│      │
│      ├─voices 人声处理文件夹
│      │        0.wav                  音频,格式(下标.wav)


├─tts 试听
│      cosy_四妹_1.0_105_0.wav         试听的角色`四妹`音频
│      ...

├─upload 上传
│      test.mp4                        上传的视频

├─download 下载
│      youtube-video.mp4               下载的视频
│      youtube-video.json              下载的视频数据

模型目录

  • 首次运行会检测下载模型,自动下载到 models 目录下

  • 自定义下载位置,可以通过 CREATORBOX_MODEL 环境变量指定,或者在 /settings 页指定,重启后生效

.models
├─creatorbox
│  ├─dh
│  └─uvr

├─huggingface
│  └─hub
│      ├─.locks
│      ├─models--SWivid--F5-TTS
│      ├─models--charactr--vocos-mel-24khz
│      ├─models--pyannote--segmentation-3.0
│      ├─models--pyannote--speaker-diarization-3.1
│      ├─models--pyannote--wespeaker-voxceleb-resnet34-LM
│      ├─models--Systran--faster-whisper-base
│      ├─models--Systran--faster-whisper-large-v2
│      └─models--Systran--faster-whisper-medium
│      .....

├─modelscope
│   └─iic
│       ├─CosyVoice3-0.5B
│       ├─emotion2vec
│       .....

├─torch
│  └─hub
│      ├─big-lama.pt
│      .....

安装

显卡使用

解决方法

目前仅支持 N卡

参考配置

bash
nvidia-smi
logs
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jun__6_02:18:23_PDT_2024
Cuda compilation tools, release 12.5, V12.5.82
Build cuda_12.5.r12.5/compiler.34385749_0
Sat Jul 12 14:42:54 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 560.35.03            Driver Version: 560.35.03      CUDA Version: 12.6     |
|---------------------------------------+------------------------+----------------------+
| GPU  Name               Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf        Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                       |                        |               MIG M. |
|=======================================+========================+======================|
|   0  Tesla T4                     Off |   00000000:00:04.0 Off |                    0 |
| N/A   39C    P8            9W /   70W |       1MiB /  15360MiB |      0%      Default |
|                                       |                        |                  N/A |
+---------------------------------------+------------------------+----------------------+
|   1  Tesla T4                     Off |   00000000:00:05.0 Off |                    0 |
| N/A   41C    P8            9W /   70W |       1MiB /  15360MiB |      0%      Default |
|                                       |                        |                  N/A |
+---------------------------------------+------------------------+----------------------+

参考版本

2.6.0+cu124

bash
uv pip install torch==2.6.0+cu124 torchvision==0.21.0+cu124 torchaudio==2.6.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
uv pip install torch==2.6.0+cu124 torchvision==0.21.0+cu124 torchaudio==2.6.0+cu124 --extra-index-url https://mirrors.nju.edu.cn/pytorch/whl/cu124

2.6.0+cu126

bash
uv pip install torch==2.6.0+cu126 torchvision==0.21.0+cu126 torchaudio==2.6.0+cu126 --extra-index-url https://download.pytorch.org/whl/cu126
uv pip install torch==2.6.0+cu126 torchvision==0.21.0+cu126 torchaudio==2.6.0+cu126 --extra-index-url https://mirrors.nju.edu.cn/pytorch/whl/cu126

...

更多

启动

启动报错

解决方法
  • 启动报错 RuntimeError: this license key is expired,请尝试远程更新
bash
git pull
  • 启动报错 RuntimeError: [WinError 10060]...(1:11076),请尝试重新启动
bash
uv run --extra {gpu|cpu} cli.py start
  • Windows 直接双击 start.bat桌面快捷方式 运行,请根据实际配置调整环境
creatorbox/start.bat
bash
REM Execute script
set SCRIPT_CMD=uv run --extra gpu
set SCRIPT_PATH=cli.py
set SCRIPT_ARGS=start -h 0.0.0.0 -p 8000
if "%~1"=="--debug" (
    set SCRIPT_ARGS=%SCRIPT_ARGS% --debug
)
  • 默认使用 cpu 运行,使用 gpu 需添加 --extra gpu 参数

启动环境

解决方法

命令启动,需要提前 cmd 进行环境激活,以 D:\Program Files\CreatorBox 为例

  • 默认环境
bash
D: & cd "D:\Program Files\CreatorBox\creatorbox" & "D:\Program Files\CreatorBox\creatorbox\.venv\Scripts\activate.bat"
  • 扩展环境
bash
# index_tts
D: & cd "D:\Program Files\CreatorBox\creatorbox\extensions\index_tts" & "D:\Program Files\CreatorBox\creatorbox\extensions\index_tts\.venv\Scripts\activate.bat"
# cosyvoice
D: & cd "D:\Program Files\CreatorBox\creatorbox\extensions\cosyvoice" & "D:\Program Files\CreatorBox\creatorbox\extensions\cosyvoice\.venv\Scripts\activate.bat"
# gpt_sovits
D: & cd "D:\Program Files\CreatorBox\creatorbox\extensions\gpt_sovits" & "D:\Program Files\CreatorBox\creatorbox\extensions\gpt_sovits\.venv\Scripts\activate.bat"
...

正常结果返回

log
(creatorbox) D:\Program Files\CreatorBox\creatorbox>
(index_tts) D:\Program Files\CreatorBox\creatorbox\extensions\index_tts>
(cosyvoice) D:\Program Files\CreatorBox\creatorbox\extensions\cosyvoice>
(gpt_sovits) D:\Program Files\CreatorBox\creatorbox\extensions\gpt_sovits>
...

然后在输入命令

使用

设备未就绪

解决方法
log
PermissionError: [WinError 21] 设备未就绪

如果安装在系统盘,需要以管理员身份运行,不建议

配音语言配置

使用方式

默认内置 10 种语言,支持自定义添加节点

webapp\data\settings.json
json
{
    "locales": [
        {
            "name": "中国",
            "locale": "zh-CN",
            "country": "China",
            "enable": true
        }
    ]
    // ...
}

使用 VPN 异常

解决方法
log
Retrying 1 time(s), translation_json ->
Your location is not supported by google-generativeai at the moment.
Try to use ChatVertexAI LLM from langchain_google_vertexai., waiting 5.0 seconds before retrying.
  • 出现 Your location is not supported 等类似描述,说明 IP 被封,尝试切换代理地区
  • 推荐代理,见 《JustMySocks》 章节

使用 Ngrok 报错

解决方法
log
PyngrokNgrokError:
The ngrok process errored on start: authentication failed:
Your account is limited to 1 simultaneous ngrok agent sessions.
You can run multiple simultaneous tunnels from a single agent session by defining the tunnels in your agent configuration file and starting them with the command `ngrok start --all`.
Read more about the agent configuration file: https://ngrok.com/docs/secure-tunnels/ngrok-agent/reference/config
You can view your current agent sessions in the dashboard:
https://dashboard.ngrok.com/agents ERR_NGROK_108.

启动出现上述错误,则需要 进入 Ngrok DashBoard https://dashboard.ngrok.com/agents ,关闭正在运行的代理,重新运行

模型

模型下载失败

解决方法
log
An error occured while synchronizing the model Systran/faster-whisper-large-v3 from the Hugging Face Hub:
An error happened while trying to locate the files on the Hub and we cannot find the appropriate snapshot folder for the
specified revision on the local disk. Please check your internet connection and try again.
Trying to load the model directly from the local cache, if it exists.

通过国内镜像下载模型

说话人调用错误

解决方法
log
2025-04-18 07:29:31.094 | INFO whisper_.py:102 - Loading Speaker model on device cuda
2025-04-18 07:29:31.865 | ERROR whisper_.py:106 - Error: 401 Client Error: Unauthorized for url: https://hf-mirror.com/pyannote/speaker-diarization-3.1/resolve/main/config.yaml (Request ID: Root=1-6801ff5b-0270fbd846adbc761e229ace;fddee4c5-7f49-4739-bba3-42cbc47dca6e)
  1. 前往并接受 pyannote/segmentation-3.0 的用户协议
  2. 接受 pyannote/speaker-diarization-3.1 的用户协议
  3. 前往并获取访问令牌:huggingface.co/settings/tokens