场景模式 📤
字数
718 字
阅读
3 分钟
多种创作模式随时切换,支持视频配音、翻译、解说等多场景应用,满足不同用户需求

配置选项
视频
本地路径:
C:\Users\home\Desktop\test.mp4视频平台:
Youtube、Tiktok
提示
首次运行会自动下载至 webapp\download 目录
语言
默认内置 10 种语言,支持自定义添加
json
[
{ "Locale": "zh-CN", "Name": "中国", "Country": "China" },
{ "Locale": "en-US", "Name": "美国", "Country": "United States" },
{ "Locale": "en-GB", "Name": "英国", "Country": "United Kingdom" },
{ "Locale": "ja-JP", "Name": "日本", "Country": "Japan" },
{ "Locale": "ko-KR", "Name": "韩国", "Country": "South Korea" },
{ "Locale": "de-DE", "Name": "德国", "Country": "Germany" },
{ "Locale": "fr-FR", "Name": "法国", "Country": "France" },
{ "Locale": "pt-BR", "Name": "巴西", "Country": "Brazil" },
{ "Locale": "es-ES", "Name": "西班牙", "Country": "Spain" },
{ "Locale": "ru-RU", "Name": "俄罗斯", "Country": "Russia" }
]提示
切换地区会触发翻译试听文本
模式
配音模式
按照指定对齐方式对视频进行配音,适配不同使用场景,以下是 3 种策略:
视频:按照视频的长度进行配音,对配音进行加速
视频时长往往有限,需要在短时间内传达关键信息,会根据视频时长对配音进行加速。例如:在有限时间内讲述完整的产品特点或品牌故事
音频:按照音频的长度进行配音,剩余长度将定格在最后一帧直到结束
视频长度不够,配音长度远远大于音频长度;该模式主要配合
Stable Diffusion后期进行的图填充自适应:按照一定阈值在合理的区间同时对视频、配音进行加降速
适合大部分场景
翻译模式
将视频语言翻译成另一种语言,并严格按照 声纹 <-> 字幕 对齐
使用限制,下述情形需要后期人工干预:
多说话人时,当出现
说话重叠;由于不同语言的语速差异,当出现较为明显的
说话时快时慢;
重构
例:用户上传 test.mp4,
与 test.mp4 相关的产物全部删除,等同于重做,请 谨慎 选择,
目录文件
在执行过程中所有产生的文件会保存至
webapp\temp\test目录术语解释,见《输出目录》 章节
标识
例:用户上传 test.mp4,标识 001时
不会覆盖已生成视频、草稿
产物输出
草稿目录:
{文件名}_{标识}文件格式:
{文件名}_{标识}.mp4
