Card image

华为云AI数字人

发布时间 : 2024-08-18

点击量 : 34

华为云AI数字人官网,基于文本或语音驱动数字人,行业播报、电商直播等场景

简介

华为云Al数字人,基于华为自研的数字人大脑,通过分钟级训练,可实现数字人应用小时级上线。支持基于文本或语音驱动数字人,应用于行业播报、电商直播等场景,也可基于数字人大脑构建知识系统,实现数字人的实时交互。

华为云AI数字人官网:

产品功能
基于华为云数字人大脑,赋予数字人“慧感知、擅表达、知识广、能进化”的能力,广泛应用于金融、政务、文旅等行业。通过AI能力驱动数字人,实现数字人的真正价值。

数字人接入

支持用户自定义数字人形象,也可挑选使用华为自定义的数字人形象。该功能目前为邀测状态,欢迎咨询!

2D数字人接入
可通过采集人物视频,即可在线生成逼真的2D数字人。

3D数字人接入
基于固定的骨骼绑定标准,用户可将满足条件的3D模型上传,即可通过驱动技术赋予该数字人形象表情和动作。

多模态播报机器人

基于华为云内置的数字人形象和客户自有的数字人形象,通过多模态播报机器人服务,实现数字人视频创作。输入文本或语音,即可驱动数字人生成所需视频。

  • 在线创作
  • 用户可通过界面配置,选择数字人形象并调整数字人的背景、logo等布局,挑选音色,在线合成播报视频。
  • API调用
  • 用户可通过直接调用API,批量调用播报视频生成功能,灵活嵌入各类业务系统。
  • 每位新用户可申请免费试用!

多模态交互机器人

默认数字人形象和数字人接入模块所接入的数字人形象,可通过多模态交互机器人,实现数字人实时交互。通过数字人交互配置、知识配置及交互形式选择模块,驱动数字人进行拟人对话。

产品优势
好看的皮囊千篇一律,有趣的灵魂亿里挑一。数字人大脑赋予AI数字人更拟人的表现力与更专业的知识水平。

慧感知
语音、肢体、情绪全识别,准确率超90%

擅表达
实时语义驱动交互,拟人化口语表达

知识广
海量行业知识,小时级定制行业知识

能进化
知识闭环,实现数字人知识主动获取和更新

应用场景

播报数字人

场景特点

虚拟形象
5分钟人物视频素材,12小时生成2D真人数字人

声音定制

场景特点

虚拟形象
支持2D真人形象驱动、支持3D卡通/超写实形象
建模速度快
建模速度快,样本短,最快支持天级上线
知识库快速搭建
支持知识包一键导入,数字人学习自主化
意图识别精准
无需标注数据,基于知识库自动生成标注数据进行训练
7*24工作成本低
构建完成后,可代替真人不间断地连续提供服务
使用场景

展厅迎宾员 | 展厅讲解员

方案优势

无需人工干预,依靠AI技术实现数字人交互,更高效地展现展厅内容

 

克隆真人定制音色,还原真人发音,多模结合,形象更逼真
多语言播报
支持多语种播报能力,匹配客户目标区域,全球服务覆盖
自动化生成
全流程自动化生成视频效果,提供下载地址,实现快速分发
高清视频格式
提供4K级高清晰视频效果,支持多种视频格式输出
使用场景

业务介绍 | 新闻播报 | 教育培训

方案优势

使用AI数字人能力代替真人进行播报,可针对不同业务场景打造不同风格的数字播报员工

展厅讲解员

场景特点

虚拟形象
支持2D真人形象驱动、支持3D卡通/超写实形象
建模速度快
建模速度快,样本短,最快支持天级上线
知识库快速搭建
支持知识包一键导入,数字人学习自主化
意图识别精准
无需标注数据,基于知识库自动生成标注数据进行训练
7*24工作成本低
构建完成后,可代替真人不间断地连续提供服务
使用场景

展厅迎宾员 | 展厅讲解员

方案优势

无需人工干预,依靠AI技术实现数字人交互,更高效地展现展厅内容

城市IP

场景特点

图形引擎
AI建模和捏脸,打造数字人高质量基模
渲染加速
AI渲染神经网络,输出高分辨率高质量效果
3D标准接入
基于骨骼绑定标准,无需定义动作,即可支持3D形象导入
语义驱动动作
支持语义驱动唇形及动作
超写实形象
城市数字代言人,实现超类人—城市形象
使用场景

城市代言人 | 文旅宣传大使

方案优势

打造城市数字代言人,表达城市理念,在公共场所城市数字代言人提供人性化咨询导览等服务,提升城市影响力和科技感

虚拟客服

场景特点

  • 语义匹配

    意图理解,识别客户问题的核心意图

  • 阅读理解

    文档问答,在文档中自动匹配答案

  • NL2SQL

    表格问答,对表格内的数据进行问答

  • 多轮智能

    多轮对话,精准识别用户意图,理解用户潜在语义

使用场景

AI电商客服 | AI虚拟主播 | AI虚拟助手

方案优势

帮助企业快速构建,发布和管理智能问答机器人系统,可应用于售前咨询,坐席助手,售后问答等场景,提供问答,统计,知识库管理等接口,可快速集成于各业务系统、聊天工具。

5G通话数字人

场景特点

算法领先
领先的自然语言算法,精准理解用户意图,让对话更智能
集成验证
搭配语音识别(ASR)、语音合成(TTS)和互动式语音流程(IVR)等智能语音交互技术
可定制的服务
可根据业务定制,专家辅助配置知识库、意图、多轮技能等
全面的对话引擎
支持单轮,多轮,复杂上下文等对话能力
使用场景

语音助手 | 对话助手 | 智能外呼

方案优势

5G通话数字人可帮助企业完成批量外呼任务,完成回访、通知、促销提醒等任务,支持自定义机器人的音色、语速,可视化的对话流程配置,赋能不同行业客户! 

广告开始