人声分离 是一项重要的音频处理技术,它可以将混合音频中的 人声和背景音乐 分离出来,为音频处理和后期制作提供了便利。
随着人声分离技术的发展,越来越多的开源工具被开发出来,为音频处理领域带来了新的发展机遇。小编之前也体验过不少人声分离
开源项目工具。分离效果有好的,有差的,参差不齐。
今天又逛到一块刚刚开源的人声分离工具 vocal-separate
,看小样示例还不错,而且部署也比其他GPT产品简单些,还有编译好的Windows版工具可直接使用。
支持格式:
视频:mp4/mov/mkv/avi/mpeg
音频:mp3/wav
双击 start.exe ,等待自动打开浏览器窗口即可;
点击页面中的上传区域,在弹窗中找到想分离的音视频文件,或直接拖拽音频文件到上传区域,然后点击“立即分离”,
稍等片刻,底部会显示每个分离文件以及播放控件,点击播放。
2. 如果您的电脑没有NVIDIA显卡或者没有配置CUDA环境,请不要选择4stems和5stems模型,尤其是在处理较长时长的音频时。否则,可能会导致内存耗尽,影响使用效果。
3. 对于中文音乐或中式乐器,我们建议您选择2stems模型。其他模型可以单独分离“钢琴、贝斯、鼓”等音轨。