mzzsfy/tts

By mzzsfy

Updated 2 days ago

文本转语音 兼容openai 基于微软 流式 高速 并发 无字数上限

Image
API Management
Web Servers
Developer Tools
17

3.4K

文本转语音工具,基于微软api封装,如果有 功能建议或者bug反馈,请到 https://github.com/mzzsfy/Dockerfile

优势:

  • 理论无字数限制,尝试一次性转换10w+字,生成文件3小时+,耗时约1分30秒
  • 流式下载,请求1秒就有响应,已经可以播放
  • 多线程,多个分片可以在服务器端同时下载
  • 兼容openai 的 /v1/audio/speech 接口格式,自定义音色使用微软名称

性能

使用默认参数,1k~5k字耗时约5~10秒

自定义分片大小和线程数可以继续提高响应时间,例如: /api/tts?thread=10&shardLength=400&text=<3000字文本> ,代表<3000字文本>被拆分为400字一个分片,10线程,耗时约4秒

ps: 不同模型耗时差距很大

运行

docker run -itd -p 8080:8080 mzzsfy/tts

访问8080端口可以看到用法

体验

体验服务器,性能比较一般 https://tts.mzzsfy.eu.org ,禁止长期或大量使用,点击右上角可以看到更多信息

国内搭建

当国内无法访问时请酌情添加下方环境变量
严格模式,国内ip必须添加,国外服务器请勿添加 TTS_STRICT_MODE=true
禁用dns解析,直接访问内置ip TTS_BING_NO_DNS=true
自定义微软服务器 ip列表 TTS_BING_IP_LIST=ip1,ip2,ip3

tts默认参数

环境变量设置
默认音色名称 DEFAULT_VOICE_NAME
默认格式 DEFAULT_AUDIO_FORMAT
默认风格 DEFAULT_AUDIO_STYLE

白名单

环境变量添加
WEB_KEYWORD_WHITELIST=关键词1,关键词2

防盗链

环境变量设置
根据 http请求头中 referer 参数白名单 WEB_REFERER_WHITELIST
根据 http请求头中 origin 参数白名单 WEB_ORIGIN_WHITELIST

自动代理池

多模式,高性能,api代理转透明代理,爬虫无需手动管理ip,且更省ip
https://hub.docker.com/r/mzzsfy/auto-proxy-pool

Docker Pull Command

docker pull mzzsfy/tts