用户名:

密码:

验证码:

当前位置:主页 > 新闻资讯 > 国内新闻 >

比肩zoom,打造中国视频会议的领头羊---“Tencent VooV Meeting”

2022-08-01 14:45 中国新闻资讯 点击次数 :

记者:西朗

2020年,“Tencent VooV Meeting”上线 245天,用户数突破 1亿,成为中国最多人使用的专业视频会议产品,除服务国内用户外,其国际版也已经在超过100个国家和地区上线。并成为第75界联合国会议指定的视频会议服务提供商,会后联合国副秘书长法布里齐奥·霍克希尔德表示:感谢Tencent对联合国成立75周年的慷慨支持。作为全球最大的科技公司之一,Tencent对联合国75周年活动的支持树立了一个重要的榜样。以上这些亮眼的战绩,足以让“Tencent VooV Meeting”载入中国互联网产品的史册。“Tencent VooV Meeting”可以一上线,就凭借健全的功能,简易的操作,开放性强,稳定性高等特性,迅速火遍中国乃至世界,背后强大的技术支持来自于Tencent公司一个创新性部门“Tencent media lab”。

作为多媒体实验室视频编解码引擎的核心贡献者焦华龙,对“Tencent VooV Meeting”的诞生起到了关键性作用,他硕士毕业于浙江大学数学系,之后的近20年,长期专注于视频领域的技术研究,累计取得20多项发明专利。2019年加入Tencent media lab,担任资深研究员,自研视频引擎,在实时通信视频编解码、网络自适应和跨平台兼容性等方面,达到国际顶尖水平。焦华龙和他的团队聚焦视频编码,在视频会议的关键技术中取得了重大突破——(1)创新性地采用了H.264时域伸缩性编码技术SVC(Scalable Video Coding),和灵活的“帧”结构,解决了视频技术的流畅性这一历史性难题,提升实时通讯网络条件较差的环境下,以及人员设备差异较大情况下的用户总体视频流畅性。焦华龙个人还因此取得“伸缩性视频编码方法”发明专利。(2)创新人脸检测算法,引入ROI(Region of Interest)编码技术,实现对感兴趣区域的实时编码,提升视频会议的品质。3)开创推出了屏幕内容编码器TSE (Tencent Screen Encoder),构筑屏幕内容编码技术,实现会议实时屏幕共享,该项技术获得2021年数博会黑科技大奖。这些技术成为“Tencent VooV Meeting”快速爆发不可或缺的核心竞争力。

创新采用SVC灵活分层编码技术创新“帧”结构,解决视频卡顿、卡死历史难题。

在视频编码里有三种帧类型,I帧、P帧、B帧。在实时通讯场景下,一般是IPPP的编码结构,逐帧参考,也就是参考前一帧,一般不会使用B帧。对于视频会议场景,多人会议中各个用户的网络情况可能各不相同,有的人网络比较好,有的人网络条件差一些。如何适配不同用户的网络状况,在各种网络状态下都能获得一个比较好的视频体验成为“Tencent VooV Meeting”核心要解决的问题。

传统的IPPP编码结构严重影响了视频会议的画质,焦华龙为了解决这一根本难题,创新性地采用了SVC灵活分层编码技术。以上边右图为例,把所有的帧分成三层,第0层只能参考第0层的帧,第1层可以参考第0层或者第1层的帧,第2层可以参考所有层的帧。这样做的好处是,如果用户网络比较差的话,只需要发第0层的帧过去,这样即使只收到0、4、8号帧,也可以正常的解码。同时对于那些网络比较好的用户,可以把所有的帧都发过去。

技术上新之比较,上边左图,是传统的IPPP参考模式,它基本上是卡死的,用户体验非常差。上边右图是采用SVC编码,可以看到虽然相对全帧率,它的帧率有些损失,但是能够保证基本的视频通讯体验。焦华龙的SVC灵活分层编码技术既保证了网络好的用户的视频高清流畅体验,又能保证网络带宽比较差的用户的基本的视频体验,而有效的解决了多终端网络适配的问题。为视频会议的推出奠定坚实的技术基础。

创新人脸检测算法引入ROI(Region of Interest)编码技术,实现对感兴趣区域的实时编码。

在摄像头场景下,我们主要关注的一般还是在人脸区域,对背景区域的关注低。焦华龙所在团队创新加入人脸检测算法和基于ROI的编码算法,能够实时快速检测出人脸区域,然后将它传入编码器,编码器进行帧内的码率重分配,对人脸区域增加码率,提升编码效果,对非ROI区域降低码率,保证总的码率不超出。在保证视频会议流畅度的前提下,提高人脸识别的清晰度。

视频会议对实时性能要求很高,因此对算法的复杂度也极其敏感,焦华龙所在团队通过几十年扎实的专业功底,研发了一套高效的检测算法,可以把一帧1080P的图像检测耗时控制在0.5毫秒以内。基于ROI区域优化码率控制算法,可以在低带宽下提升主观质量,在高带宽下可以保证主观质量基本不变的情况下,降低20%到30%左右的码率。提升实时视频会议的品质。

 

3、开创推出屏幕内容编码器TSE (Tencent Screen Encoder),构筑屏幕内容编码技术,实现会议实时屏幕共享。

 

传统的视频编码采用的是预测加变换的混合编码结构,这种方式适合摄像头采集的视频。但是对于屏幕内容,它的编码效率不太好。为了提升压缩效率, HEVC (High Efficiency Video Coding)针对屏幕内容专门推出了HEVC-SCC编码标准,可以大大提升屏幕内容的编码效率。但HEVC所负载的帧内块拷贝(IBC)和调色板模式(Palette Mode)功能虽然可以将压缩效率提升50%,但同时也带来编码复杂度的急剧增加,基于此焦华龙所在的媒体引擎团队推出了屏幕内容编码器TSE (Tencent Screen Encoder)。并在算法实现、模式选择、汇编优化等方面对TSE编码器做了全方位优化。

 

对于IBC编码模式,焦华龙所在团队采用了基于hash表搜索的运动估计代替传统的基于块匹配的运动估计。对于8x8块,将其分成4个4x4个小块,计算它的hash值,然后将这个块的坐标存入该hash值对应的链表。另外,对于hash查找的顺序也做了优化,位置较近的点先计算,大大提升hash搜索速度。

 

对于Palette编码,最复杂的模块就是颜色表的生成和查找颜色表,焦华龙所在的媒体引擎团队在YUV数据生成颜色表数据以及根据YUV数据快速查找到颜色表中最匹配的颜色数据方面做了大量优化,极大提升调色板编码速度。

 

除了IBC和Palette本身的算法优化,焦华龙团队在模式选择、快速算法方面也做了很多优化,比如通过帧内帧间预测结果提前退出Palette模式判决等。此外也加入了SIMD优化,进一步提升速度。

 

焦华龙所在团队在屏幕编码技术上屡屡刷新编码技术的天花板,并于2021年,获得中国国际大数据产业博览会颁发的2021年领先科技成果奖---黑科技大奖。

 

2020年随着海外云会议公司Zoom大火,国内也群雄并起,“多媒体实验室”在短短3年内,凭借领先的核心技术,完美的性能,将技术的每个细节做到了极致,给客户带来完美体验。截至2021年底,“Tencent VooV Meeting”用户参会次数超过40亿次,覆盖国家和地区超过220个,位居云会议行业第一。如今站在实时音视频领域的风口,我们感谢焦华龙和他所在的团队带给我们生活的福祉,同时也期待焦华龙和他所在的团队在音视频领域能飞的更高、更远。

(责任编辑:小员)
文章人气:
(请您在发表言论时自觉遵守互联网相关政策法律法规,文明上网,健康言论。)
用户名:
验证码:
首页 | 新闻 | 财经 | 军事 | 百科 | 科技 | 数码 | 汽车 | 游戏 | 娱乐 | 体育 | 文化 | 教育 | 房产 | 旅游 | 健康 | 女性 | 明星 | 美女