语音合成 🎧
丰富的语音库与定制选项,提供个性化配音体验,满足创作需求,实时试听确保创作精准
调试模式
上传视频后,点击 执行
开始,此时 调试模式
开启后会中断后续执行
log
2025-04-18 04:55:14.045 | INFO 12672 trans_.py:43 - language: zh-CN
2025-04-18 04:55:14.045 | WARNING 12672 trans_.py:50 - skipping translated
2025-04-18 04:55:14.046 | INFO 12672 tts_.py:423 - Loaded transcription data from: webapp/temp/test/test_001.json
2025-04-18 04:55:14.050 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/00_27c51c.wav
2025-04-18 04:55:14.050 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/00_8f7420.wav
2025-04-18 04:55:14.051 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/00_b4c2bf.wav
2025-04-18 04:55:14.052 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/01_0f240c.wav
2025-04-18 04:55:14.052 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/01_51bc48.wav
2025-04-18 04:55:14.052 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/01_664113.wav
2025-04-18 04:55:14.054 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/02_570a16.wav
2025-04-18 04:55:14.055 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/02_b87de7.wav
2025-04-18 04:55:14.055 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/02_dd0dc1.wav
2025-04-18 04:55:14.056 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/03_0c9338.wav
2025-04-18 04:55:14.057 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/03_4909a9.wav
2025-04-18 04:55:14.058 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/03_b7b324.wav
2025-04-18 04:55:14.059 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/04_1443a4.wav
2025-04-18 04:55:14.059 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/04_4bb5a0.wav
2025-04-18 04:55:14.060 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/04_d002db.wav
2025-04-18 04:55:14.065 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/07_1a75ab.wav
2025-04-18 04:55:14.065 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/07_3bfe0e.wav
2025-04-18 04:55:14.065 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/08_014cd6.wav
2025-04-18 04:55:14.066 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/08_3be9b1.wav
2025-04-18 04:55:14.067 | WARNING 12672 tts_.py:452 - delete tts file : webapp/temp/test/tts/08_9ebe29.wav
2025-04-18 04:55:14.067 | INFO 12672 tts_.py:465 - Number of concurrent tasks: 9
100%|█████████████████████████████████████████████████████████████████████| 9/9 [00:02<00:00, 3.65it/s]
2025-04-18 04:55:16.536 | INFO 12672 tts_.py:475 - Updated transcription data saved to: webapp/temp/test/test_001.json
2025-04-18 04:55:17.559 | INFO 12672 cbaudio.py:331 - Generated trans audio file: webapp/temp/test/test_001.wav 30.571
查看内容
通过点击右下角图标 可以查看到当前识别的内容
手动修改
通过修改不同 属性
的文本值,点击右上角图标 保存修改内容
模型选择
模型 | 特性 | 场景 | 推荐指数 |
---|---|---|---|
ETTS | 默认,速度快 | 适合低性能设备,合成速度飞快 | 🔥🔥🔥🔥🔥 |
CTTS | 推荐,质量高 | 适合高性能设备,支持音色克隆 | 🔥🔥🔥🔥🔥 |
如何选择❓
CTTS
对设备要求较高,低性能设备合成效率较低;建议普通用户使用 ETTS
,其合成速度较快,可以先通过它完成其他模块的参数调整,再使用 CTTS
替换配音。对于设备性能较强的用户,或者希望优化配音质量的用户,建议选择 CTTS
。另外,你也可以通过 Google Colab
远程部署来提高处理速度;
配置选项
指示
用户可以自定义指示,使合成语音更加个性化,更多示例,当前支持以下3种类型:
用四川说这句话
用四川话说
四川话
性別
切换性别会改变音色,帮助用户快速找到理想的语音
语音
根据不同模型和视频,提供的配音选择会有所不同。配音分为3种类型:内置
、视频
、用户
,其中用户可自定义音色或录制自己的声音
提示
用户自定义 《音色数据》 章节
语速
语速是合成语音的重要参数。不同语言、不同场景下,语速的选择对效果有较大影响
log
2025-04-18 07:08:59.473 | WARNING 11760 cbaudio.py:284 - idx_03.wav 06000-07757, 1.757s, speed up 1.220.
2025-04-18 07:09:00.092 | WARNING 11760 cbaudio.py:284 - idx_08.wav 16199-19406, 3.207s, speed up 1.454.
2025-04-18 07:09:00.441 | WARNING 11760 cbaudio.py:284 - idx_12.wav 24561-26832, 2.271s, speed up 1.235.
2025-04-18 07:09:00.926 | WARNING 11760 cbaudio.py:284 - idx_16.wav 33059-35588, 2.529s, speed up 1.277.
注意
在语音合成过程中将打印出语速值。该值应当接近 1
,并尽量不要超过 1.2
否则可能引起声调失真;如果无法避免可以手动调整
试听
用户可输入自定义文本,进行语音合成试听,帮助确认配音效果,切换 基础
-> 语言
,可以切换试听文本语言
配音列表
展示当前可用的配音音色信息,支持试听、删除、上下移动等操作。
操作说明
- 点击
试听
可立即播放该语音片段 - 点击
删除
将移除该语音 - 使用
上移
/下移
控制语音顺序
注意
例:用户上传 test.mp4
,标志 001
时
1.单人配音
说话人
默认使用0
2.多人配音
说话人
与test_001.json
数据中的spk
保持一致