如今,AI数字人已从概念走向实际应用,覆盖大厅导办、直播带货、智能客服、数字员工等多个场景,提供了更具亲切感、人性化温度的AI互动服务。但数字人制作面临技术门槛较高、无法多终端灵活部署等问题。目前市场缺少一个操作简便、支持个性化定制的数字人平台。
为解决上述痛点,浪潮软件灵犀有言团队自研推出灵犀有言数字人平台,基于先进开源大模型和灵犀有言AI基础平台,构建五大核心技术能力,实现零代码、低算力条件下快速开发音画逼真、互动流畅、问答精准的数字人,并支持全终端适配。能够为政府、教育、企业等行业用户在智能客服、数字员工、直播互动、大厅导办、内部通知等多种场景,打造有温度的AI互动体验和服务,让数字人真正摆脱设备和算力的束缚,加速“全民数字人”时代的到来。
人像动态增强算法:让静态人像“活”起来
静态人像如何拥有自然动作?团队通过人像动态增强算法智能识别数字人面部位置、眼部轮廓和嘴角弧度等关键特征点,并动态为数字人添加符合真实生理习惯的点头、眨眼、微笑等微表情和动作。增加数字人亲和力,摆脱僵硬感。不管是用于虚拟互动场景,还是日常人像展示,都能带来更贴近真实的视觉体验。
音色克隆技术:让数字人“说”出你的声音
想让数字人拥有独特辨识度?平台支持上传人声素材(3-10秒即可),制作用户的专属音色。通过音色克隆技术智能提取声音中的核心声学特征,比如声线的独特频率、说话时的气息节奏,并精准复刻声音的音调、语气甚至细微的情感特质。无论任何音色数字人都能完美还原,避免千篇一律的机械音,让交互更有温度。
音唇协同渲染引擎:精准匹配嘴型,让表达更自然
音画不同步是数字人常见的“劝退点”,团队通过音唇协同渲染引擎实时渲染与音频匹配的动态嘴型,并将深度解析后的音频特征与嘴型序列进行帧级对齐,实现嘴型与声音的毫秒级同步。每一个音节、语气停顿都能对应到嘴型变化,包括语气词的细微口型都能精准还原。可满足智能客服、数字员工、直播带货、大厅导办、内部通知等场景需求。
一键智能体融合:让数字人“能听会答”,无需复杂开发
平台内置灵犀有言智能体接口,专为普通用户打造“零技术门槛”的优化体验。无需掌握代码开发、模型调试等专业技能,也无需对接复杂第三方系统,一键即可完成数字人与对话模型的快速绑定。普通用户也能让数字人具备“智能交互”能力。
全终端 + 低算力适配:数字人随时随地都能用
适配终端全覆盖:无论是电脑、手机、平板,还是智慧大屏等终端都能完美适配,数字人画质、动作、声唇同步效果均能稳定输出,不会因终端屏幕尺寸差异出现画面变形等问题。
低算力(CPU)运行:无需依赖高配置GPU,普通办公电脑、手机的CPU就能流畅运行低算力版本数字人,避免因设备性能不足导致的卡顿、延迟等问题。
除了为政府、教育、企业等行业用户提供服务外,浪潮软件灵犀有言团队还致力于打破技术鸿沟、实现智能普惠,通过低成本高效解决方案,为广大个人用户和中小微企业打造专属“数字分身”和“虚拟助手”,助力工作、学习和生活提质增效。