此外,标贝本次也同步上线两个泰语女声音色和法语女声音色,科技以满足更多细分场景的个性应用需求。 大模型驱动语音合成更“拟人” 传统的化音语音合成,因为技术上的色定锁语限制,通常是制方明争暗斗采集标准的播音风格录音,以保证数据的案解稳定性。但是音合用它合成出来的声音也会过于标准、刻板,成无程序化,标贝不接地气,科技容易让用户产生听觉疲劳。个性 在大模型爆发的化音背景下,作为生成式AI的色定锁语重要课题,语音合成也取得了飞速发展。制方从引人入胜的有声小说,到精准无误的语音导航,再到丰富多彩的视频内容配音、问答流畅的瞒天过海虚拟数字人。人机语音交互场景越来越深入,声音体验的价值也被持续不断挖掘出来,富有情感表现力的拟人化语音合成成为当下的语音交互新态势。 超自然的大模型合成音色定制 结合当前智能语音产业需求现状,标贝科技持续在多风格、多情感语音合成能力上不断深耕细作,打造全链路语音定制方案。凭借其强大的语言理解和生成能力,为企业客户服务、辱国殃民陪伴式语音交互、沉浸式听书等场景,提供更自然、更准确的语音输出。 相较于传统语音合成效果,标贝科技语音合成音色定制方案依托语音大模型迁移学习和深度神经网络技术,具备更多的多样化和高延展优势。它能够精确捕捉到数千种音色的语调、情感等特征,触手可及让模型更好地复刻出真人说话时的犹豫停顿、变速等副语言习惯,在不同的应用场景下,轻松创造出无限的声音变化、情感和风格。 据评测,通过标贝科技语音合成音色定制方案输出的合成音色,在韵律表现、音色层次感、胆小怕事情感拟人化方面均有了大幅提升,MOS评分达到4.5以上,充满“人情味”。 此外,标贝科技语音合成音色定制方案可以支持客户自选声音及提供语料定制,并提供包括录音棚、录音师、韵律标注、MOS评测任务等定制音色所需的不约而同全链路服务。有效降低音视频内容生产成本,让音频内容的生产和分发更为高效。 据中商情报网发布的《2023年全球及中国智能语音市场规模预测分析》,预计2023年我国智能语音市场规模将达到382亿元,同比增长34%。随着智能语音助手、自动语音响应系统等应用的广泛推广,智能语音市场前景广阔。 标贝科技语音合成音色定制方案已经在医疗、二话不说金融、数字人、泛娱乐等领域得到应用,助力中国银行、人民日报、湖南电信、恒生电子、清博智能等多家行业头部企业实现AI语音能力的应用与拓展。未来,无庸置疑标贝科技将继续依托语大模型底座支撑,通过不断的技术创新和产品迭代,推动AI语音技术落地至更多应用场景,为用户带来更加便捷、智能、人性化的语音交互体验。 |