网络用图,出处不明近日,小编了解到一家专攻视频通信的企业免费开放其研发的视频通信技术,目前已经将下载地址放入码云,并着手安排工程师帮助用户接入该项技术。开放技术,有意思!先来了解下这家企业!据小编了解,这家企业名为图鸭科技,由前掌赢科技首席科学家武俊敏于2016年8月创立。团队成员主要来自上海交大和南京大学,拥有专利80余项,目前在上海和南京还配备两个研发中心。除了做视频通信之外,还涉及到视频压缩和分析的相关技术研发,妥妥的一枚创业型技术公司!初次见到图鸭科技CEO武俊敏,感觉和初创企业的特质很相似,年纪轻轻(妥妥的90后)且态度认真,最重要的是还有一股对技术、对行业的“霸气”。说到技术上的霸气外漏,现于上海交大攻读博士学位的武俊敏,曾经作为前掌赢首席科学家,在即时通讯美颜算法的的研发过程中帮助掌赢融资1亿人民币。在可圈可点的职业生涯中,作为simpleeye lab负责人,他又带领团队开发出三套算法。值得提及的是,他研究的表情迁移比iPhone X 早三年;即时通讯美颜算法比美图早一年;图片压缩技术比Webp提升50%。小编不觉感叹,90后CEO,四个字:技术有为!聊天中,说到投身创业大军的初衷,武俊敏腼腆地笑了:“就在2016年7月,我去了美国,当时参加了CVPR 会议,我看到很多人,因为一个技术、一些基本的技术就融到了很多资金,我就联想到我自己,可以在技术上做到比他们更好,那为什么不去创业呢?”抱着这个想法,回国后,武俊敏踏上了创业征程。
谈到将音视频技术研发作为创业项目的想法,武俊敏表示,自己在上一家公司主要参与的技术项目就是有关于音视频方面的(当时视频分析做的多一些),可以说在这个领域有一定的技术积累,所以创业也就顺理成章地选择了该领域中比较难的视频压缩。“刚开始的时候我想做的是VR方面的通信,后来逐步想把VR通信转变为一个普通通信,现在来看在通信领域我们已经解决了两个问题,一个是压缩问题,另一个是传输问题。”武俊敏补充道。作为国内第一家将视频和通信“并举”的公司,在言谈中小编除了感受到武俊敏对音视频技术的满满自信之外,还有对行业认知的“轻车熟路”。如今的视频行业究竟如何?武俊敏也有自己的看法,或许对渴望投身于此的小伙伴们有些经验之谈的帮助。他认为如今的视频分析行业其实可以分为两个部分,一个是纯的视频分析方面,另一个是与传统行业相结合的问题。说到纯的视频分析,目前的市场风口主要集中在三个领域,分别是人脸识别、自动驾驶和相机。自动驾驶,无论从入市的企业量级以及目前的融资水平来看,有望成为万亿级的市场,这一点武俊敏表示毋庸多言,但他对相机应用的前景判断还是挺出人意料的。他表示,这几年相机应用层出不穷。从美图秀秀到足迹,再到FaceU, 现在来看或许会有一些新的东西加入,例如3D交互,这个领域会迎来新高峰。此外,因为视频分析没有办法成为一个独立行业,所以需要与传统行业做一些结合。这方面,武俊敏提到了近几年发展势头正盛的新零售。“新零售、无人零售,也是视频分析大举进攻的一个行业。具体来说,视频分析技术会把店面中顾客浏览的轨迹以及停留的时间进行实时传输,做一个分析优化,进而判断不同的需求……这是视频分析给零售行业带来的一个新变化。”他补充道。关于视频创业的问题,不少小伙伴或许很关心,对此武俊敏提到了三个关键词,分别是压缩、传输和分析。具体来说压缩,就是让视频变的更小一点;传输,就是让一个视频如何更加流畅;分析的意思是让视频更加智能,做好这三方面才能更好的把握视频创业的成功,其中涉及到的技术创新,对创业者来说都是很艰苦的。据图鸭科技内部介绍,早在去年8月份,视频类应用不断增多扩展,带来高带宽、高流量高并发的现象后,武俊敏就瞄准了这个市场。“这是一个充满暴利的市场,粗算下来可能会达到十倍的利润。我们要做的就是打破这个局面,帮助相关领域的企业打通通道、节省成本。”他说。关于视频通信,我们需要了解什么? 目前,图鸭科技的视频通信VoIP技术,端对端延时已经可以控制在50~100ms,P2P穿透率达到70%,可以帮助企业极大的降低带宽成本,并能根据机型自动匹配X264与X265,进一步降低20%流量,实现无缝切换。延时、穿透率、X264与X265?说了这么多,视频通信系统的基础架构到底由哪些部分组成?一个视频通信的基础架构可能涉及到采集(音视频采集)、前处理(例如噪声处理、人脸识别等)、音视频编解码、流媒体协议、系统架构(如数据库、文件系统)、CDN、播放控制(如音视频同步)和交互技术等。具体的传输过程一般涉及到三个步骤,分别是:数据发送方采集数据,其中包括音频、视频以及文本等;通过网络将压缩的数据传送到接收方;数据接收方接收到数据后,解码得到多媒体数据进行显示和播放。文字描述相对简单,但实质上这是一个非常复杂的过程。网络波动、视频丢包等问题的出现需要被及时处理,同时不同硬件的适配需要在也很短的时间内得到响应。此外,在日常应用中,不同的业务对视频通信系统的技术要求也存在差异性。例如视频会议中,需要双方或多方的视频通信过程实时进行,延时尽可能低,同时要保持通信过程流畅;视频监控系统则要求清晰度较高,有效保留画面中的重要细节。这样看来构建高效稳定的视频通信系统,除了具备有效实时的原始数据之外,最重要的就是压缩与传输。通常来说,在低延时业务中,对压缩速度的要求非常高。例如如果需要达到每秒20帧的帧率,就要求压缩每一帧的时间低于50毫秒,同时还要兼顾压缩性能。据了解,目前主流的视频编码标准为H.264/AVC,目测可以获得不错的压缩性能和传输速度。下一代的视频编码标准是H.265/HEVC,虽然其码率相比H.264在同等编码质量的情况下可以节省高达50%,但由于专利问题和巨大的计算量,还没有得到广泛应用。对此,武俊敏表示,关于视频压缩效率的优化,目前来看压缩算法并没有完全被使用,只用了20%-60%,最主要的原因在于我们的计算性能还是不够领先,但算法还有进一步优化的空间。压缩是难点,传输更不容易!传输方面,目前最常用的两种传输协议是传输控制协议TCP和用户数据包协议UDP。其中TCP是面向连接的可靠传输协议,但延时相对较大;UDP是无连接、不可靠的传输协议,延时相对较小。“大家都知道,通信行业主要就是流畅和网络之间的矛盾。因为网络随时变动,不是丢包,就是包特别多的时候传不过来……要解决流量适应网络的问题,还要同时保证流量传送的信息要尽可能完整,是特别困难的。”武俊敏说。在图鸭科技这次开源的视频通信技术中采用了UDP协议,减少了端对端延迟,并实时对传输数据进行网络丢包、网络速度和网络抖动的统计,再返给编码器,以此确保视频传输的稳定性。此外,还采用长期参考帧的模式,在网络丢包30%的情况下仍可保证视频流畅。未来要实现流畅高质量的视频通信,武俊敏认为编码端还是需要根据实时的网络状态进行压缩率的调整,可以通过改变量化参数、改变分辨率或改变帧率等方法实现。对网络状态的实时感知,还需要网络传输模块进行统计监测并实时提供信息。 投身开源,图鸭科技背后的想法是什么? 据悉,图鸭科技在此次的开源中主要开放了服务器的源代码和客户端的网络模块代码,不开源的部分也将免费提供给用户使用。面对开源,武俊敏坦率告诉小编,其实技术并没有没有国界,每个人都会很容易接触到。如果想通过提升技术壁垒来创造商业壁垒,这是一个短暂有效还比较困难的事儿。从商业角度来看,开源是一种趋势;从公益角度出发,更是值得提倡的。“未来,我们会逐步升级整个系统,把项目做得越来越好,现在只是开源的第一步,如果后面做得特别好,我们会把其他部分开源出来,例如视频分析的技术开源。我们都认为,开源会让技术向前跨进一步,对后期分析或者其他业务有促进作用。视频覆盖程度越广,视频的智能化程度就会带来更多机会。我们就是要先把这个门槛儿较高的市场激活,开源带领我们先进门,后面才能搅活市场。”武俊敏说。 关于图鸭科技 早前,小编了解到其实图鸭科技已经完成天使轮千万级融资,由中兴合创领投,华院数据和拉尔夫创投跟投。谈到融资,武俊敏很低调,坦然表示这么大笔钱肯定要拿来在技术上做大量的优化与改进。“一方面我们的压缩技术比别人更好,另一方面来我们通信技术也做起来了,这样制造了两个技术点的融合,全球就我们一家公司把通信和压缩放在一起,这点我特别兴奋也很自豪,要一直努力做下去。”现在图鸭科技的客户群主要包括教育、视频通信芯片,还有一些机器人行业以及视频会议,未来例如视频游戏、在线教育、视频客服等也会广泛采用音视频分析技术。谈到音视频分析技术的适配性和有效性,武俊敏为小编举了例子说明。目前合作的一家在芯片领域的厂商,要把视频很流畅的传输到云端,之前用的RTSP,RTMP延时比较高,而图鸭科技的技术延时降低到100毫秒,并且比较流畅;另外在直播领域,之前用的是云通信,一个月的耗费是5万块钱人民币,现在采用压缩技术后,一个月变成5000块钱人民币,流畅性的利用率却是原来的10倍。“对于未来,我们会做AR和VR;对于人才,我们会补充一些运营人才,高端人才还会是主流,因为招人的要求很高,所以宁可招的少一点,也要精英人才、复合型人才。”武俊敏强调。武俊敏表示:未来会一直致力于研究视频压缩和分析方向的研究,Make video smaller and smarter,这就是我们的目标。