字节发布了一款端到端同声传译模型:Seed LiveInterpret 2.0,中英双向端到端同传,延迟为2-3秒 从演示效果看,准确性、复杂场景的处理、声音情绪的表达、语音克隆音色转换的效果相对都还可以 性能上,语音到语音翻译,中英互译平均翻译质量到了66.3分,接近专业真人同传水平 延迟上,语音到文本输出首字平均延迟2.21秒,语音到语音输出延时2.53 秒 功能上支持实时声音复刻,复刻不同说话人的音色 擅长多人对话、非流利语音以及长音频场景 对绕口令、诗词、美食文化等可相对自然互译 #AI同传 #SeedLiveInterpret #字节同传
体验地址:https://t.co/6eohMQxOVb 技术报告:https://t.co/D7M1cVBfKj https://t.co/OdHfHIYVMV