术语解释 🤖
CreatorBox 中相关术语
目录说明
CreatorBox
文件夹下 子目录
、文件
解释
├models 模型
├src 代码
├static 静态资源
├webapp 输出目录
├─cache 缓存
│ llm.db 大模型缓存数据
│
├─data 数据
│ mounts.json 应用挂载数据
│ speaker.json 用户音色数据
│
├─logs 日志
│ creator_2025-04-10.log 运行日志
│
├─spk 说话人音色
│ MacArthur.wav 自定义声音片段
│
├─temp 零时
│ └─test 视频目录
│ │ test.jpg 源封面
│ │ test.mp4 源视频(此视频来源于 `upload` 不会影响源视频)
│ │ test.srt 源字幕
│ │ test.wav 源音频
│ │ test_vsr.ass 提取字幕,格式ass
│ │ test_vsr.srt 提取字幕,格式srt
│ │ test_vsr.txt 提取字幕,格式txt
│ │ test_vmr.jpg 标记对比图
│ │ test_vmr.ma4 去除标记视频
│ │ test_001.json 最终数据,格式(文件名_标识.json)
│ │ test_001.mp4 最终视频,格式(文件名_标识.wav)
│ │ test_001.srt 最终字幕,格式(文件名_标识.srt)
│ │ test_001.wav 最终音频,格式(文件名_标识.wav)
│ │
│ ├─dubbing 配音文件夹
│ │ 0.wav 音频,格式(下标.wav)
│ │ .....
│ │ test.wav
│ │
│ ├─json 数据文件夹
│ │ test_draft_content.json 剪映草稿输出
│ │ test_draft_input.json 草稿内容输入
│ │ test_whisper.json 原始转录内容
│ │
│ ├─stems 音频分离文件夹
│ │ test_noise_x.wav 人声降噪
│ │ test_vocals.wav 说话人声
│ │ test_vocals_bg.wav 背景音乐
│ │
│ ├─tts 语言合成文件夹
│ │ 00_c94f3e.wav 音频,格式(下标:2d_MD5.wav)
│ │ .....
│ │ test.wav
│ │
│ ├─voices 人声处理文件夹
│ │ 0.wav 音频,格式(下标.wav)
│ │
│ ├─vsf 字幕识别文件夹
│
│
├─tts 试听
│ cosy_四妹_1.0_105_0.wav 试听的角色`四妹`音频
│ ...
│
├─upload 上传
│ test.mp4 上传的视频
│
├─download 下载
│ youtube-video.mp4 下载的视频
│ youtube-video.json 下载的视频数据
数据说明
以 test.mp4
标志 001
为例
json
[
{
"idx": 0, // 下标
"spk": 0, // 说话人
"lang":"zh", // 语言
"start": 2590, // 开始时间 (ms)
"end": 2979, // 结束时间 (ms)
"duration": 1.3, // 时长 (s)
"text": "臭猴子", // 原始内容
"text_trans": "Hey, monkey.", // 翻译
"voice": "四妹", // 语音
"speed": 1.0 // 语速
}
]
音色数据
用户 自定义
音色数据
json
[
{
"id": "405260", // 主键
"type": 3, // 类型(1:内置、2:视频、3:用户)
"speaker": "四妹", // 名称
"gender": "female", // 性别(male:男、female:女)
"path": "webapp/voices/四妹.wav", // 语音
"text": "这山岭外的世界究竟是什么样的?", // 文本
"duration": 8.382, // 时长
"locale": "zh-CN", // 语言
"status": 1 // 类型(0:禁用、1:启用)
}
]