🎬 FFmpeg 8 发布:集成 Whisper 模型实现视频实时字幕生成
开源编解码器 FFmpeg 8(代号 Huffman)已正式发布,其核心新功能是集成了 OpenAI 于 2022 年 9 月发布的语音识别和转录机器学习模型 Whisper。这意味着 FFmpeg 8 现在能够支持实时为视频生成字幕。该版本代号“Huffman”旨在纪念 1952 年发明的同名无损压缩算法。文章还提及了 Georgi Gerganov 基于 Whisper 开发的本地和离线运行版本 whisper.cpp。
(科技情报)
via 茶馆 - Telegram Channel
开源编解码器 FFmpeg 8(代号 Huffman)已正式发布,其核心新功能是集成了 OpenAI 于 2022 年 9 月发布的语音识别和转录机器学习模型 Whisper。这意味着 FFmpeg 8 现在能够支持实时为视频生成字幕。该版本代号“Huffman”旨在纪念 1952 年发明的同名无损压缩算法。文章还提及了 Georgi Gerganov 基于 Whisper 开发的本地和离线运行版本 whisper.cpp。
(科技情报)
via 茶馆 - Telegram Channel