视频字幕提取软件,AI模型提取视频字幕 stt v0.94 整合包 附全部模型

一. 字幕对于不同语言的电影来说都是非常重要的。

对于观看非母语电影的人群,字幕能够帮助观众更好地理解对话和情节发展。

二. 电影字幕的生成

电影字幕的生成,依赖语音转文本(Speech-to-Text,STT)的技术。

随着语音技术和机器学习的发展,语音转文本技术也取得了长足的进步。

而OpenAI的Whisper是目前识别率较高的模型。下面讲展示如何调用基于 fast-whipser 开源模型得到电影的字幕.

制作视频字幕的利器 stt v0.94 整合包 附全部模型

制作视频字幕的利器 stt v0.94 整合包 附全部模型

stt是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。

预编译Win版使用方法/Linux和Mac源码部署

1.下载整合包文件

2.下载后解压到某处,比如 E:/stt (路径不要有中文)

3.双击 start.exe ,等待自动打开浏览器窗口即可

4.点击页面中的上传区域,在弹窗中找到想识别的音频或视频文件,或直接拖拽音频视频文件到上传区域,然后选择发生语言、文本输出格式、所用模型,5.点击“立即开始识别”,稍等片刻,底部文本框中会以所选格式显示识别结果

如果机器拥有英伟达GPU,并正确配置了CUDA环境,将自动使用CUDA加速

制作视频字幕的利器 stt v0.94 整合包 附全部模型

全过程无需联网,完全本地运行,可部署于内网

制作视频字幕的利器 stt v0.94 整合包 附全部模型

所有操作都是在本地进行,不用担心泄露什么。先把视频文件或者语音文件拖进来。然后选好语音,选好模型。点立即识别等待几十秒后就可以在下面的框框里看到识别后的文字。字幕是带有时间戳的,把txt文件的后缀改成.srt,直接拖到视频剪辑软件里面就可以了。

为了方便小伙伴们的使用,我已经把所有的模型都放在压缩包里了,省得你们再去找模型了。

制作视频字幕的利器 stt v0.94 整合包 附全部模型

下面说下这些模型我的使用心得。

base 处理速度最快,但是效果也是最差

small 和base差不多

我觉想准确率高点的话 至少要用medium。但是用medium有个bug,就是生成文字里面有繁体中文。解决也很简单用繁体转简体工具转换一下就好了

large-v2和v3 这2个模型效果是最好的,但是处理时间也是最长的。

所以小伙伴可以根据自己的需求来试试各个模型。

    下载权限
    查看
    • 免费下载
      评论并刷新后下载
      登录后下载
    • {{attr.name}}:
    您当前的等级为
    登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
    您已获得下载权限 您可以每天下载资源次,今日剩余
    AIGC资源

    AI绘画ComfyUI整合包!(疯狂AI一键安装)附:1000张工作流+1.5TB模型插件

    2024-8-26 15:49:18

    AIGC资源

    解锁新世界——Diffusers Image Outpaint超强AI扩图工具一键整合包

    2024-10-8 12:01:14

    0 条回复 A文章作者 M管理员
      暂无讨论,说说你的看法吧
    个人中心
    购物车
    优惠劵
    今日签到
    有新私信 私信列表
    搜索