钉钉联手通义实验室发布Fun-ASR语音识别大模型,支持企业专属模型定制训练

  新浪科技讯 8月22日下午消息,钉钉、通义实验室语音团队宣布,联手推出新一代语音识别大模型Fun-ASR,能听懂家装、畜牧等十大行业黑话,并支持企业专属模型定制训练。目前,Fun-ASR已被集成进钉钉的多个功能模块,包括会议字幕与同传、智能纪要、语音助手等。

  技术层面看,Fun-ASR语音识别大模型的核心亮点在于三方面:其一,全面增强了对行业专有词汇的识别能力。该模型经过上亿小时音频数据的训练,结合钉钉多行业客户的真实场景共创,能够准确理解互联网、科技、家装、畜牧、汽车等十多个领域的专业术语。

  其二,结合钉钉带来了更强的上下文感知和理解能力。Fun-ASR可结合企业在钉钉内的已有信息如通讯录、日程、知识库等,进行推理优化,有效缓解大模型造成的幻觉,提供更可靠的转写结果。该能力需经企业授权后方可生效。

  其三,针对有高阶需求的企业,支持定制化语音识别模型训练。基于高效的端到端训练架构,该模型可利用企业提供的真实场景语音数据进一步做算法优化,以提升如品牌名、项目代号、产品名、人名等专属词汇的识别准确率。

  对于此次合作,通义实验室语音团队负责人李先刚表示:“我们很高兴能够与钉钉携手,共同推动语音识别技术在企业场景中的创新和应用。未来,我们将持续扩大Fun-ASR的数据和模型规模,不断提升大模型语音智能解决方案的可复制能力,为企业客户带来更高效、智能的产品体验。”

  钉钉CTO朱鸿也表示,“钉钉和通义团队仅用三个月的紧密协作,就实现了Fun-ASR模型的成功落地,并赢得了头部客户的高度认可。这是我们迈向行业领先的一次关键突破,也将为更多钉钉客户打造专业定制大模型提供可参考的范例。”

阅读全文

本文转载自互联网,如有侵权,联系删除