Skip to content

语言翻译 🌐

精准识别视频说话者的人声,灵活调整配置适应不同设备和场景,确保高质量文本生成

调试模式

字幕 识别完成后,点继续击 执行 开始,此时 调试模式 开启后会中断后续执行

log
2025-04-11 01:12:30.420 | INFO 12868 response.py:28 - {"task_id":"806c875f7d89405c91318515fafffa3ee"}
2025-04-11 01:12:30.422 | INFO 12868 cbutils.py:310 - File already exists. webapp/temp/test/test.mp4
2025-04-11 01:12:30.426 | INFO 12868 cbaudio.py:59 - Audio extracted and saved to: webapp/temp/test/test.wav duration 30.570666666666668s
2025-04-11 01:12:30.426 | INFO 12868 spleeter_.py:73 - Audio separate file already exists. (webapp/temp/test/stems/test_vocals.wav , webapp/temp/test/stems/test_vocals_bg.wav)
2025-04-11 01:12:34.485 | INFO 12868 trans_.py:39 - {'provider': 'Gemini', 'model': 'gemini-2.0-flash', 'json_path': 'webapp/temp/test/test_001.json', 'language': 'zh-CN', 'kwargs': {'temperature': 0.1, 'top_p': 0.1, 'cache': True, 'debug': True}}
2025-04-11 01:12:34.486 | INFO 12868 trans_.py:41 - language: zh-CN
2025-04-11 01:12:34.487 | INFO 12868 llm.py:43 - {'provider': 'Gemini', 'model': 'gemini-2.0-flash', 'kwargs': {'temperature': 0.1, 'top_p': 0.1, 'cache': True}}
2025-04-11 01:12:35.519 | INFO 12868 llm.py:81 - LLM provider Gemini model gemini-2.0-flash
2025-04-11 01:12:35.527 | INFO 12868 llm.py:115 - cache miss prompt md5(c71541dbcc2e1911bfe99377113cbb3a)...
2025-04-11 01:12:36.129 | INFO 10992 task.py:34 - current time: 2025-04-11 01:12:36.129094
2025-04-11 01:12:38.237 | INFO 12868 llm.py:119 - cache update for prompt md5(c71541dbcc2e1911bfe99377113cbb3a) ...
2025-04-11 01:12:38.252 | INFO 12868 llm.py:92 - Gemini token usage: input tokens: 475, output tokens: 370, total tokens: 845
2025-04-11 01:12:38.587 | INFO 12868 trans_.py:71 - Translated transcription: 
 大家好。你可能没见过这些神奇玩意儿。很多人甚至不知道它们的存在。今天,我来给你们看看六个超棒的鸡 蛋料理神器。这个滚动鸡蛋收纳盒,特别适合整理鸡蛋。窄窄的,不占冰箱空间。能放15个鸡蛋。这架子的质量和做工都很好,放冰箱侧面正好。每次拿上面的,下面的鸡蛋就会自动滚下来,特别方便。这个...
2025-04-11 01:12:38.588 | INFO 12868 trans_.py:79 - Translated data complete and saved to: webapp/temp/test/test_001.json

查看内容

通过点击右下角图标 可以查看到当前识别的内容

手动修改

你可以通过修改 text_trans 的文本值,点击右上角图标 可以保存修改内容

提供商选择

说明

json
[
  "DeepLx ",      // 免费高质量多语言机器翻译(基于DeepL)
  "Gemini",       // 谷歌通用大语言模型
  "DashScope",    // 阿里中小型英文模型
]
提供商环境变量科学上网推荐指数
DeepLx-🔥🔥🔥
GeminiGOOGLE_API_KEY🔥🔥🔥🔥🔥
DashScopeDASHSCOPE_API_KEY🔥🔥🔥🔥

配置

DeepLx

DeepLX 是一种非官方的 DeepL API 接口实现,用于进行机器翻译。它本质上是对 DeepL 网页翻译服务的封装,模拟请求以实现 高质量多语言机器翻译,通常用于绕过官方 API 的付费限制

安裝使用

下载链接 https://github.com/OwO-Network/DeepLX/releases

Windows 为例,下载 deeplx_windows_amd64.exe, 双击运行,执行如下请求

bash
curl --request POST \
  --url http://127.0.0.1:1188/translate \
  --header 'content-type: application/ld+json' \
  --data '{
    "text": "hello,world",
    "source_lang": "en",
    "target_lang": "zh"
}'

验证是否生效,正常返回

response.json
json
{
  "alternatives": [
    "哈罗,世界",
    "哈喽,世界",
    "大家好"
  ],
  "code": 200,
  "data": "你好,世界",
  "id": 8358410000,
  "method": "Free",
  "source_lang": "en",
  "target_lang": "zh"
}

Gemini

DashScope

TIP

  • 环境变量配置见 《准备工作》 章节

  • 此时刷新网页

  • 建议根据实际需求选择对应的 提供商模型

配置选项

模型

每个提供商都有对应的模型默认值,用户也可以自定义

提供商默认值可选项
忽略--
DeepLxhttp://172.18.0.1:1188/translatehttp://<ip>:<port>/translate
Geminigemini-2.0-flashgemini-2.5-pro-preview-03-25gemini-1.5-progemini-1.5-flashmore
DashScopeqwen-turboqwen-maxqwq-plusmore

忽略 选项有什么用?

  • 通过 调试 我们知道了返回的翻译结果,但总有个别翻译需要手动调整,此时我们可以单独修改 text_trans值并保存

  • 在后续执行中,想要使用我们手动调整的翻译,此时可选择 忽略选项

随机性

控制文本生成的随机性,低温度更准确,高温度更具创意

多样性

控制生成时探索的深度,较大值通常生成更准确的文本

缓存

开启后可节约 token 使用,优先读取缓存

这里相同 xxx_001.json 下所有 text 值作为一个批次请求

js
2025-04-11 03:19:26.825 | INFO 5636 llm.py:81 - LLM provider Gemini model gemini-2.0-flash
2025-04-11 03:18:40.892 | INFO 5636 llm.py:115 - cache miss prompt md5(c71541dbcc2e1911bfe99377113cbb3a)...
2025-04-11 03:19:26.829 | INFO 5636 llm.py:113 - cache hit prompt md5(c71541dbcc2e1911bfe99377113cbb3a)...
2025-04-11 03:19:26.831 | INFO 5636 llm.py:92 - Gemini token usage: input tokens: 475, output tokens: 370, total tokens: 845

地区

Locale.json
json
[
  {"Locale": "zh-CN", "Name": "中国", "Country": "China"},
  {"Locale": "en-US", "Name": "美国", "Country": "United States"},
  {"Locale": "en-GB", "Name": "英国", "Country": "United Kingdom"},
  {"Locale": "ja-JP", "Name": "日本", "Country": "Japan"},
  {"Locale": "ko-KR", "Name": "韩国", "Country": "South Korea"},
  {"Locale": "de-DE", "Name": "德国", "Country": "Germany"},
  {"Locale": "fr-FR", "Name": "法国", "Country": "France"},
  {"Locale": "pt-BR", "Name": "巴西", "Country": "Brazil"},
  {"Locale": "es-ES", "Name": "西班牙", "Country": "Spain"},
  {"Locale": "ru-RU", "Name": "俄罗斯", "Country": "Russia"},
]

TIP

不同地区切换会触发翻译试听文本