人声分离 是一项重要的音频处理技术,它可以将混合音频中的 人声和背景音乐 分离出来,为音频处理和后期制作提供了便利。
随着人声分离技术的发展,越来越多的开源工具被开发出来,为音频处理领域带来了新的发展机遇。小编之前也体验过不少人声分离
开源项目工具。分离效果有好的,有差的,参差不齐。
今天又逛到一块刚刚开源的人声分离工具 vocal-separate
,看小样示例还不错,而且部署也比其他GPT产品简单些,还有编译好的Windows版工具可直接使用。
此外,你还可以选择分离“钢琴声”、“贝斯声”、“鼓声”等单独音轨。操作简单,只需两步:选择音视频文件,点击启动处理,即可完成。而且,工具已内置模型,无需连接互联网下载,直接在本地浏览器中自动运行。
支持格式:
视频:mp4/mov/mkv/avi/mpeg
音频:mp3/wav
使用教程
下载后解压到某处,比如 E:/vocal-separate;
双击 start.exe ,等待自动打开浏览器窗口即可;
点击页面中的上传区域,在弹窗中找到想分离的音视频文件,或直接拖拽音频文件到上传区域,然后点击“立即分离”,
稍等片刻,底部会显示每个分离文件以及播放控件,点击播放。
注意事项
1.如果您的电脑配备了英伟达GPU,并且已经正确配置了CUDA环境,系统会自动启用CUDA加速,提高处理速度。
2. 如果您的电脑没有NVIDIA显卡或者没有配置CUDA环境,请不要选择4stems和5stems模型,尤其是在处理较长时长的音频时。否则,可能会导致内存耗尽,影响使用效果。
3. 对于中文音乐或中式乐器,我们建议您选择2stems模型。其他模型可以单独分离“钢琴、贝斯、鼓”等音轨。