近日,在华为开发者大会期间,华为云举办了《音视频AI多模态融合,媒体重塑行业数字化新价值》高峰论坛。本次论坛围绕音视频AI多模态融合,分享媒体技术如何应用到千行万业,与行业客户伙伴共同把握AI普惠催生的百亿市场机遇。华为云、引望、人形机器人(上海)有限公司、微赞直播及安朴酒店等企业代表齐聚,共同探讨AI多模态技术如何驱动媒体、智能驾驶、具身智能、直播、酒店等行业的创新升级。
“AI for Media, Media for AI”双轮驱动,重构媒体生产力
华为云媒体服务产品部总裁吕阳明在开场演讲中指出,人工智能走向多模态融合,从感知理解迈向深度思考与生成创造,推动音视频产业进入“智能化、个性化、互动化”的新阶段。华为云围绕媒体核心能力,构建了音视频、传输、建模、推理、渲染五大能力引擎,同时将AI与媒体能力深度融合,通过“AI for Media”、“Media for AI”互赋能,重新定义AI时代的媒体生产力。
• AI for Media: 编解码+AI(AI MPC)显著提升画质,加速超高清普及;渲染+AI实现“In-Scene”个性化广告;3DGS+AI高效重建毫米级精度的3D数字空间;CG+AI(AIG-3D)突破数据泛化瓶颈,赋能具身智能训练效率飞跃。
• Media for AI: AI+RTC(SparkRTC)升级实时互动体验;AI+数字人+云会议推动交互从功能迈向情感共生。
端边云协同,破解智能驾驶实时交互难题
引望ADS云项目经理林凌分享了华为乾崑智驾与华为云音视频技术的协同创新。面对车载场景复杂网络环境、数据安全监管高要求情况下保障智驾体验的挑战,通过调度、网络和算法三项技术攻坚实现突破:
• 网络架构优化:车载物联卡就近接入公网,RTC专线一跳入云,流量直达华为云骨干网,解决时延问题;
• 弱网抗丢包算法:JSCC算法联合信道编码,帧粒度Pacer提升传输管道缓存利用率,50%丢包网络下可以正常控车和查看车辆监控,保障画面流畅;
• 业务分级传输:优先保障智驾指令流,传输加密、内容加密,双重保证数据安全。
“用户一键召唤车辆时,手机可实时查看车载摄像头画面,这重新定义了人车关系。”林凌强调,“智能驾驶的发展趋势正从单车智能向多元协同转变。华为通过手机、车和云的协同,构建了强大的生态系统”。
训练场革命:具身智能开发新范式
上海交通大学博士,人形机器人(上海)有限公司具身算法与运控框架负责人尹云鹏在分享中提出“模型训推+操作系统+具身应用”的具身智能新开发范式。
国家地方共建人形机器人创新中心(国地中心)打造了全国首个虚实融合异构人形机器人训练场,并构建虚拟仿真采集场、实现训练数据增广和仿真数据高效生成,完成智能开发效率的突破。“传统机械臂训练需1周的数据采集,现在1天即可完成。这是具身智能落地的关键一跃。”尹云鹏表示。
国地中心发布了全球首个百万量级、真实场景、异构机器人平台的高质量具身数据集“白虎数据集”,构建“训练场-异构数据-具身智能开发平台-模型”的全链路平台,希望以国地中心具身智能开发的共性技术赋能人形机器人产业,联合行业所有生产伙伴推进具身智能开发的新升级。
直播新体验:AI媒体处理+低时延网络双轮驱动
微赞直播副总裁何祖恒分享了技术赋能直播营销的实践,深度解读了微赞依托华为云技术底座打造的一站式私域直播解决方案,为企业数字化转型提供创新路径与工具。
微赞直播聚焦企业私域场景,依托华为云领先的音视频基础技术方案,创新性地以“低延时网络+AI媒体处理”双向驱动,打造高并发、超低延迟、高清流畅且安全可靠的直播服务体系。
微赞直播方案深度整合华为云音视频技术,通过实现超低延时播放与AI智能画质增强,双效保障观众端的优质体验。一方面,方案显著降低播放延迟,确保流畅实时互动;另一方面,AI媒体转码结合音视频大模型,可自动优化画质,提升清晰度、丰富细节与色彩表现,有效控制码率,进一步提升了直播的效率和呈现效果。
酒店宾客数字化体验升级:AI数字人点亮旅居新故事
安朴酒店管理有限公司IT总监孙海龙分享了酒店行业数字化的新趋势和自身的实践经验,他提到,宾客数字化体验跃居酒店行业数字化目标首位,这反映出行业从“流量争夺”向“体验深耕”逐步转变。安朴酒店的智能交互数字人管家,打造酒店行业的AI创新,从传统的人机对话、或宾客通过给前台打电话的沟通方式,变成人和“人”的面对面交流,让宾客有了不一样的入住体验。
在酒店大堂,安朴打造数字人礼宾服务,提升酒店的服务效率;在客房场景,安朴对客房电视进行升级,基于盘古大模型的智能交互数字人的植入,让原本功能单一的电视机摇身一变成为智慧中枢。数字人的多重角色,帮助酒店重塑数字化体验。
“数字人不仅是工具,更是酒店的情感连接器。”孙海龙总结道。AI 数字人带来的不仅是服务模式的创新,更是提升竞争力、实现营收增长的新引擎。安朴酒店的数字人管家应用,为酒店行业的数字化升级提供了可借鉴的范本。
AI与音视频的融合已抵达产业爆发的临界点,当技术创新与行业痛点深度咬合,数字化价值释放才真正开始。华为云将持续开放五大引擎能力,与开发者、伙伴共同定义智能交互新范式,迈向更加“智能化、个性化、互动化”的媒体时代。