元宇宙 碳中和 区块链 快讯 正文
热门: 以太坊消耗量(EOS、比特币及以太坊的能耗对比) 比特币五年走势图(价格暴动下的比特币10年,一条牵动投资者命运的曲线) 元宇宙科幻(受到各方青睐,最近大火的元宇宙到底是什么?) 以太坊的特点(以太坊狂想者的究极力作:欧洲以太坊Aeternity) 中国的比特币矿场都关闭(比特币挖矿形成垄断格局,中国四家巨头公司接管整个行业) 以太坊开会(枪支、财富和上帝:加密信徒们在迈阿密的四天狂欢)

元宇宙视频(「视频」元宇宙的关键技术,且看华为云怎么做)

文/羊城晚报全媒体记者 程行欢 黄婷 孙绮曼

实习生 叶倩琳

视频/羊城晚报全媒体记者 程行欢 薛仁政

元宇宙概念大火,网络媒体的发展也绕不开这一话题。在11月24日上午的2021中国网络媒体论坛技术论坛上,华为云首席战略官黄璟对一些关键技术进行了阐释,并介绍了华为在虚拟数字世界基础设施方面的技术探索。

在赋能业界产生更好的媒体内上,黄璟表示,首先是要在全球构建一张低时延、体验好的媒体网络来作为基础,并在非常多的技术、非常多的能力赋能媒体创作过程;最终在媒体高效生产之后,将媒体的体验逐渐落到各个场景里。

据了解,2020年全球网络的流量里面73%以上是视频,而华为通过在云上的Spark-RTC的音视频实时服务,已经可以做到全球覆盖同时实现时延在200毫秒以内。在现场,他展示了华为在不久前做的一个全球云上合奏,请世界各地的音乐家在不同地方进行云上表演,时延几乎很难在现场进行分辨。

在目前火爆的元宇宙概念中,黄璟也提到了其中的多项关键技术,可以贯穿到媒体引擎的每个环节,包括:图形处理、音频处理、媒体渲染、媒体转码、协议传输、媒体AI等。比如:AI在图形处理中,可以实现智能识别目标,实现全程实时遮挡;AI音频处理中,可以实现智能音效,支持多音色AI配音能力,将文字合成为可与人声自然表达媲美的朗读语音。

媒体AI中的数字人则可以实现更多的能力,基于预训练语言大模型、机器翻译算法、多模态数字人动作生成算法,同时融合手语语言学专家知识,可以把语音和文字,实时转换成为连贯自然的手语身体姿态、手势动作和表情。例如,全球有4.66亿人患有听力障碍,云上实时自动翻译成手语视频的能力,可以让听障人士共享智能世界的美好。(更多新闻资讯,请关注羊城派 pai.ycwb.com)

来源 | 羊城晚报·羊城派

责编 | 陈婉允

推荐文章