MeloTTS:由MyShell AI开发的一个高质量的多语言文本到语音(TTS)库。
支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
速度非常快,支持中英混合的发音,能生成清晰、自然的语音输出。
即使在普通的在CPU上也能实现实时语音合成。
测试了下质量很不错。👍
主要特点
1、多语言支持:MeloTTS支持多种语言的文本到语音转换,包括英语(有美国、英国、印度、澳大利亚等多种口音)、西班牙语、法语、中文、日语和韩语。这使得它适用于全球多种语言环境的应用场景。
2、中英混合发音:特别对于中文,MeloTTS支持中英混合的发音,这是在多语言交流中非常实用的功能,能够处理包含英文单词的中文文本。
3、实时CPU推理:MeloTTS设计优化以确保即使在没有GPU加速的情况下,也能在CPU上实现实时语音合成,这提高了其在不同硬件环境下的可用性。
4、高质量语音输出:MeloTTS旨在生成清晰、自然的语音输出,力求在各种支持的语言中保持语音的自然度和清晰度。
5、易于安装和使用:提供了简单的安装指南和Python API,使得用户可以轻松地在Linux环境中安装MeloTTS,并通过几行代码实现文本到语音的转换。
MeloTTS利用了多个优秀的开源项目,如TTS、VITS、VITS2和Bert-VITS2,以实现其高质量的文本到语音转换功能。它遵循MIT许可证,适用于商业和非商业用途。
支持的语言列表
- 英语(美式)
- 英语(英国)
- 英语(澳大利亚)
- 英语(默认)
- 西班牙语
- 法语
- 中文(混合英语)
- 日语
离线懒人包
为了让用户更便捷地使用这一工具,幕后将MeloTTS封装成了一键启动包,用户无需配置繁琐的Python环境,只需点击下载即可使用。下载地址如下:
下载和使用指南
- 解压后运行oneclick-run.bat,然后打开浏览器访问http://127.0.0.1:7860
- 点击生成:点击“提交”按钮,等待即可。
项目运行一段时间后,会得到该项目给出的回答。BRIA-RMBG将自动为图片去除背景,效果超赞,且速度很快,感兴趣的朋友,快去试试吧~
注意事项:
①该项目建议使用英伟达显卡运行
②请确保安装路径不包含中文,不然可能会引起奇怪的适配问题