🎬 FFmpeg 8 发布:集成 Whisper 模型实现视频实时字幕生成

开源编解码器 FFmpeg 8(代号 Huffman)已正式发布,其核心新功能是集成了 OpenAI 于 2022 年 9 月发布的语音识别和转录机器学习模型 Whisper。这意味着 FFmpeg 8 现在能够支持实时为视频生成字幕。该版本代号“Huffman”旨在纪念 1952 年发明的同名无损压缩算法。文章还提及了 Georgi Gerganov 基于 Whisper 开发的本地和离线运行版本 whisper.cpp。

(科技情报)

via 茶馆 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]