场景模式 📤

字数

718 字

阅读

3 分钟

多种创作模式随时切换，支持视频配音、翻译、解说等多场景应用，满足不同用户需求

dubb_scene

配置选项

视频

本地路径：C:\Users\home\Desktop\test.mp4
视频平台：Youtube 、Tiktok

提示

首次运行会自动下载至 webapp\download 目录

语言

默认内置 10 种语言，支持自定义添加

locale.json

json

[
  { "Locale": "zh-CN", "Name": "中国", "Country": "China" },
  { "Locale": "en-US", "Name": "美国", "Country": "United States" },
  { "Locale": "en-GB", "Name": "英国", "Country": "United Kingdom" },
  { "Locale": "ja-JP", "Name": "日本", "Country": "Japan" },
  { "Locale": "ko-KR", "Name": "韩国", "Country": "South Korea" },
  { "Locale": "de-DE", "Name": "德国", "Country": "Germany" },
  { "Locale": "fr-FR", "Name": "法国", "Country": "France" },
  { "Locale": "pt-BR", "Name": "巴西", "Country": "Brazil" },
  { "Locale": "es-ES", "Name": "西班牙", "Country": "Spain" },
  { "Locale": "ru-RU", "Name": "俄罗斯", "Country": "Russia" }
]

提示

切换地区会触发翻译试听文本

模式

配音模式

按照指定对齐方式对视频进行配音，适配不同使用场景，以下是 3 种策略:

视频：按照视频的长度进行配音，对配音进行加速
视频时长往往有限，需要在短时间内传达关键信息，会根据视频时长对配音进行加速。例如：在有限时间内讲述完整的产品特点或品牌故事
音频：按照音频的长度进行配音，剩余长度将定格在最后一帧直到结束
视频长度不够，配音长度远远大于音频长度；该模式主要配合 Stable Diffusion 后期进行的图填充
自适应：按照一定阈值在合理的区间同时对视频、配音进行加降速
适合大部分场景

翻译模式

将视频语言翻译成另一种语言，并严格按照 声纹 <-> 字幕 对齐

使用限制，下述情形需要后期人工干预：

多说话人时，当出现说话重叠；
由于不同语言的语速差异，当出现较为明显的说话时快时慢；

重构

例：用户上传 test.mp4，

与 test.mp4 相关的产物全部删除，等同于重做，请 谨慎 选择，

目录文件

在执行过程中所有产生的文件会保存至 webapp\dubb\test 目录
术语解释，见《输出目录》章节

标识

例：用户上传 test.mp4，标识 001时

不会覆盖已生成视频、草稿

产物输出

草稿目录：{文件名}_{标识}
文件格式：{文件名}_{标识}.mp4

场景模式 📤 ​

配置选项 ​

视频 ​

语言 ​

模式 ​

配音模式 ​

翻译模式 ​

重构 ​

标识 ​

场景模式 📤

配置选项

视频

语言

模式

配音模式

翻译模式

重构

标识