视见睿来专注于计算机视觉、图形学与人工智能领域的关键技术创新与应用落地;针对视频时代的各种新型应用场景,我们结合人工智能、计算成像、音视频技术、流媒体技术、混合现实等前沿科技进行核心应用技术能力突破,并在此技术上与市场需求结合开发出切实可行的产品,用科技赋能多种应用场景,为用户带来创新的视觉体验,并实现降本增效。
计算成像
计算成像可理解为借助计算机对图像进行处理,技术涉及照明方面的成像、光学方面的成像、信号处理方面的成像、探测器上的计算等方面,该技术可以突破传统成像的限制,让成像效果优于肉眼所见。
团队自研技术不仅可以对重要参数如清晰度、亮度、色彩等进行实时智能调整,还能依据指令实时地展示同一画面的不同视角。以下面展示Vistring团队自主研发的「实时子弹时间」为例 —— 如直播带货时,观众可以在手机上自由选择视角,通过拖拽选择自己感兴趣的观看角度。
「实时子弹时间」演示
音视频技术
音视频技术包括采集、处理、编码和封装、推拉流、解码播放等环节。目前处于风口的短视频、直播都涉及到了大量的音视频技术。随着5G时代的到来,市场对高清、低延时视频的需求会被进一步释放,但目前大部分设备如手机、平板、电视却都不足以支持8K⁺ 视频的解码能力。
为了满足市场对8K⁺ 高清视频的观看需求,Vistring团队自研了8K⁺ 注视点编码与播放技术:系统可根据用户的动作指令(如放大、缩小等)自动且实时地优化视频流,从而最高效地利用分辨率与带宽,使用户即便在普通设备上观看8K⁺ 视频也能收获震撼的感官体验。
8K视频在平板上的观看效果演示(8K+ 注视点编码与播放技术)
8K视频在平板上的观看效果演示(普通音视频技术)
流媒体技术
流媒体技术指将一连串的媒体数据(如声音流、视频流、文本流、图像流、动画流等)压缩后,以流的方式在网络中分段传送,实现在网络上实时传输影音以供观赏的一种技术。如果不使用此技术,就必须在使用前下载整个媒体文件。
Vistring团队自研的4K 360视频H5播放技术不仅可适配主流浏览器播放视频,还支持APP与微信内嵌,实现跨手机、平板、电脑等设备播放,最大范围地覆盖用户群。不仅如此,该技术还解决了4K 360视频播放时因网络不稳定而造成的播放卡顿、清晰度差的问题: 可以精准地预测并选择最适合该用户的清晰度, 在保证流畅的同时达到条件允许的最高清晰度,让用户享受低延时、平滑、流畅的流媒体播放体验。
在手机上播放4K 360视频的效果演示(视频来源:《“筑”福》CCTV CNTV 版权所有)
混合现实
在5G时代,人们更加向往摆脱物理的束缚,实现“穿越”的梦想。在诸多类似的科技中,混合现实(MR)打破了现实和虚拟的壁垒,让两者共存并相互作用,创造了新的环境和可视化三维世界。我们也将这样的前沿技术融入产品,有效提升用户对复杂事物的感知能力的同时提升了观看趣味。
直播中的虚拟背景切换演示
人工智能
对场景的智能理解
计算机视觉是人工智能关键领域之一, 是一门研究如何使机器“看”的科学,比如用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。
我们研发的一系列产品均有融合视觉领域相关的人工智能技术,使相关产品具备实时、全面、精确理解场景中的关键视觉要素并进行处理的能力。具体的核心技术包括:
- 快速检测并识别人体与物体的轮廓
- 精准判断、定义被检测对象的属性
- 理解对象之间的关系,准确区分场景中主体与前后景
对场景的智能理解