FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。
FunClip特色
- FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w+次,并且能够一体化的准确预测时间戳。
- FunClip集成了SeACo-Paraformer的热词定制化功能,在ASR过程中可以指定一些实体词、人名等作为热词,提升识别效果。
- FunClip集成了CAM++说话人识别模型,用户可以将自动识别出的说话人ID作为裁剪目标,将某一说话人的段落裁剪出来。
- 通过Gradio交互实现上述功能,安装简单使用方便,并且可以在服务端搭建服务通过浏览器使用。
- FunClip支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕,使用简单方便。
相关导航

Screenshot to Code:将任何屏幕截图或设计转换为干净的代码
Screenshot to Code 是一款使用 AI 将屏幕截图、模型和 Figma 设计转换为干净、实用的代码的简单工具,将任何屏幕截图或设计转换为干净的代码,现在支持 Claude Sonnet 3.5 和 GPT-4O!支持 HTML + Tailwind、HTML + CSS、React + Tailwind、Vue + Tailwind、Bootstrap、Ionic + Tailwind 和 SVG 等多种前端堆栈。其支持的 AI 模型包括 Claude Sonnet 3.5 和 GPT-4O,同时可使用 DALL-E 3 或 Flux Schnell 进行图像生成,能够以 10 倍速度构建用户界面。作为一款完全开源工具,它在 GitHub 上已获得超过 53,000 颗星,深受领先公司的开发人员和设计师欢迎。
暂无评论...