阿里通义实验室发布语音识别大模型Fun-ASR1.5 30 种语言、方言古诗都能秒转!
在人工智能语音领域,通用性与精准度的平衡一直是行业攻克的难点。 4 月 20 日,阿里通义实验室宣布正式推出语音识别大模型Fun-ASR1.5。这款模型凭借统一的大模型架构,实现了在多语言、多方言以及复杂语境下的跨越式突破。
据了解,Fun-ASR1. 5 的“听力”表现堪称全能。它不仅能够覆盖全球 30 种主流语言,还深度适配了汉语的七大方言体系及 20 多种地方口音。更令行业关注的是,该模型在传统文化领域的表现同样亮眼,即便面对语调跌宕、断句独特的古诗词吟诵,也能实现极高精度的实时转写。
目前,Fun-ASR1. 5 已正式上架阿里云百炼平台。阿里通义实验室表示,该模型将通过API服务的方式,为教育、传媒、金融、科技及文化等多个行业客户提供高效的语音技术支撑,助力各产业实现智能化办公与内容生产的升级。
via AI新闻资讯 (author: AI Base)
在人工智能语音领域,通用性与精准度的平衡一直是行业攻克的难点。 4 月 20 日,阿里通义实验室宣布正式推出语音识别大模型Fun-ASR1.5。这款模型凭借统一的大模型架构,实现了在多语言、多方言以及复杂语境下的跨越式突破。
据了解,Fun-ASR1. 5 的“听力”表现堪称全能。它不仅能够覆盖全球 30 种主流语言,还深度适配了汉语的七大方言体系及 20 多种地方口音。更令行业关注的是,该模型在传统文化领域的表现同样亮眼,即便面对语调跌宕、断句独特的古诗词吟诵,也能实现极高精度的实时转写。
目前,Fun-ASR1. 5 已正式上架阿里云百炼平台。阿里通义实验室表示,该模型将通过API服务的方式,为教育、传媒、金融、科技及文化等多个行业客户提供高效的语音技术支撑,助力各产业实现智能化办公与内容生产的升级。
via AI新闻资讯 (author: AI Base)