ClearerVoice-Studio 是一款开源 AI 语音处理工具包,专为研究人员、开发人员和最终用户设计,提供语音增强、语音分离、目标说话人提取等多项功能。其特点包括尖端的预训练模型、易用的接口、全面的语音处理算法,以及社区驱动的协作环境。ClearerVoice-Studio 是一个功能全面且灵活的平台,适合提升语音质量的应用场景,同时欢迎社区贡献新模型和任务。
主要功能
语音处理:支持语音去噪、分离、目标说话人提取(包括音频、视频和脑电图条件)。
模型训练:提供语音增强和分离的微调脚本,支持多种任务扩展。
语音评分:内置 SpeechScore 工具包,支持多项语音质量评估指标(如 SNR、PESQ、DNSMOS 等)。
相关导航

Parler TTS-开源高质量文本转语音 (TTS) 模型
Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据Dan Lyth和Simon King在Stability AI和Edinburgh University发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作进行的复现,与其他TTS模型不同,Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的同学可以在线体验。
暂无评论...