随着人工智能产业的日渐成熟,智能语音已然进入了“落地期”。语音唤醒、语音播报、智能语音助手……如今,越来越多的人开始习惯AI语音带来的陪伴与帮助。
那么,在智能语音“飞入寻常百姓家”的当下,AI语音的下一个应用场景会是什么?
近日,在人工智能语音领域深耕多年的云知声上线“声音克隆”服务,赋能APP和智能硬件打造“用户录音并生成播报音色”的功能,让语音助手的声音形象更立体、更亲切、更饱满,让用户在使用智能语音服务时享有更高的可玩性。
“声”入人心,打造个性化语音功能
“声音克隆”,是云知声基于语音合成技术打造的个性化应用,主要适用于产品面向C端客户的企业厂商,以个性化语音助其开拓产品新模式、新空间。
通过“声音克隆”,用户能够以少量的录音进行模型训练,得到与本人非常相似的声音模型,以此为基础,可将任意文本转换为本人的声音,实现个性化语音。
在产品日益同质化的当下,“声音克隆”功能的植入不仅是锦上添花,更将成为提升用户产品体验、培养用户忠诚度的重要一步——
在“声音克隆”的加持下,智能音箱不再是冰冷的AI,而将以儿女的声音提醒父母注意天气变化,叮嘱他们添衣御寒;
车载导航可以不必是千篇一律的“志玲”或“腾哥”, 妻子、孩子的声音将成为指引用户回家的最佳方向标;
儿童点读机里生硬的机械音也将被妈妈轻柔的呢喃所取代,陪伴宝宝安稳入眠……
声音克隆:始于科技,融于日常
作为以智能语音起家的人工智能企业,云知声语音合成技术在音色还原度、发音准确率、音质清晰度等方面具有明显的行业优势,具备大规模商业化的应用能力。目前已在智能营销、智能家居、智能车载等场景实现落地应用。
基于最新语音合成深度学习技术,云知声“声音克隆”可全面学习用户音色、风格,仅需用户的20句原始录音,即可合成贴近真人的数字声音,且做到音色高保真还原,朗读的语气、语调、情感也堪比真人。
展开全文
同时,为了使合成发音更具专属发音人特点,“声音克隆”通过端到端声学模型,将输入的文本转换成声学参数,然后通过神经网络声码器将声学参数转换成语音,合成效果具有更高的自然度、辨识度,实现真实还原个人音色,实现有温度、有感情、零距离感的真实分享。
只需四步,克隆你的专属声音
作为一款聚焦C端用户个性化需求的B端产品,“声音克隆”充分考虑C端用户行为偏好,在功能设置更简洁、更便捷、更快速。厂商只需将其集成在APP、智能硬件等智能产品上,用户四步即可复刻出自己的声音。
目前,云知声已上线“声音克隆”小程序——云知声智能语音体验馆,只需四步,即可克隆你的专属声音。(注:每个账号仅有1次克隆次数)
第一步 · 环境检测
同意授权使用麦克风后,确保环境安静,无嘈杂干扰。
第二步 · 录制20句文本
保持与手机耳机麦克风保持1-2个拳头距离以内,用声音平稳、吐字清晰、语速适中的普通话读出屏幕上的文本。
第三步 · 等待声音训练完成
最快20分钟,即可克隆好你的声音。
第四步 · 查看和试听
可在“个人中心-我的声音”中输入文本或选择随机文本,即可播放并分享相应的音频。
我们希冀,通过“声音克隆”,赋予更多APP和智能硬件更具可玩性的智能语音服务,打造产品差异化,提升产品丰富度与用户参与感,塑造全新用户体验。
特别声明
本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。