


出品|虎嗅科技组
作家|陈伊凡、李一飞
裁剪|苗正卿
头图|由寻影提供
" AI 原生 100 "是虎嗅科技组推出针对 AI 原生革命栏目,这是本系列的第「49」篇著述。
2019 年 1 月,拉斯维加斯。
CES 展馆里,一台叫寻影 Tail 的相机静静放在展台上。它莫得快门键,莫得变焦拨杆,莫得任何需要东谈主操控的部件,它我方在转,我方在构图,我方识别东谈主脸、判断景深,然后随着东谈主走。
这款家具被大批媒体评为那届 CES 上的最好内容创作器具。
天下上有两种需求,一种是众人还是有的需求,一种是胜利创造了一种众人不知谈我方需要的需求。
OBSBOT 寻影属于第二种。
寻影创举东谈主兼 CEO 刘博说,那一刻,众人被冲昏了头脑,以为这款家具,一定会大卖。
然后发售,国内辩驳区的狂风暴雨"砸"了过来。
" 5000 块的不有名品牌?凭什么?"
"小米录像头 200 块,你们卖五千?"
"骗子。"
……
发任何一条内容,下面十条辩驳里九条在骂。刚经历了 CES 高光时刻的团队,一时被打到地上。
其后中好意思贸易摩擦,把他们依赖的独一芯片胜利打没了。寻影 Tail,这款刘博和团队花了三年时期作念出的第一款家具,从发售到停产,只活了半年多。
这是寻影的第四年。
当年两年,发生的三件事:CES 的高光时刻、国内发售的跌落谷底、芯片段供——简直在合并时期段发生,相互之间莫得任何因果,却忽闪地比肩着。
对于寻影这家公司的成长,与许多硅谷到手学案例人大不同,甚而更多的是学生创业的孤勇和粗鄙踩坑。
硬件创业,常常精采先了解市集,再界说家具。但寻影的成长,却是反过来,因为他们的首款家具,连市集都不知谈在哪。
两个多小时的交流,咱们尝试贯通和收复,这样一家除了"影像自动化"的畴昔是笃定的,其他的家具、供应链、市集和东谈主群都不细目的团队,是如何生生创造了一个需求,并作念到了行业率先。

寻影的创举团队,左二为刘博 图片由寻影提供
"一辆只给乘客而不是给司机的汽车,从一启动就没商量方针盘。"刘博这样比方,在寻影 Tail 之前他们设计过专科拍摄减负、体育、文艺等多个场景,但莫得一个场景能在那时被提前考据;若是要靠几千台样机大限度试错,对一家初创公司而言既没成本也没时期。
"一辆莫得方针盘的汽车",这很像是当下基于 AI 智能体需求倒推硬件形态的念念路,但刘博他们早了 10 年。
时期往前拉到 2016 年。刘博跟几个同学一皆,决定要作念"难到一般东谈主不敢碰"的事。他们选的方针叫影像自动化,让相机自主拍摄。他笃定,视频会成为东谈主类相通里信息密度最高、甚而最垂死的载体;若是视频麇集还要靠东谈主端着开采拍,供给会永久受限,这个理念,是刘博他们作念影像自动化的初心。
合并年,CV 领域正在经历另一条叙事。商汤、旷视、依图、云从,其后被称为" CV 四小龙"的公司,在那一波深度学习波澜里全部遴荐了安防作为主战场。东谈主脸识别、额外活动检测、城市录像头收罗,是阿谁时间最显眼的 AI 落地旅途。
但刘博说,安防是他们一定不会碰的领域。逻辑很直白:安防要的不是影像自己,而是影像背后的信息。而寻影想作念的,是让影像作为信息载体自己变得豪阔好、麇集豪阔简略,这是两件压根不同的事。
莫得任何参照,甚而供应链都莫得准备好,连可以用的芯片都莫得,深度学习刚刚走向营业化,旯旮侧的 NPU(虎嗅注:NPU 是一种挑升用于处理机器学习算法的处理器,比 CPU 和 GPU 更快地履行复杂的数学运算,主要用于处理波及大批小限度并行诡计的 AI 任务,如图片、视频等多媒体数据和神经收罗数据。)还不存在,能跑视觉算法的只须英伟达 GPU,这玩意儿功耗太大,压根塞不进消费级的小开采里。
但刘博赌, NPU 一定会出现。把柄是他们找了那时在作念神经收罗芯片的东谈主聊,见到了苗头。2018 年第一批可商用的 ASIC 芯片才出来,2019 年寻影 Tail 作念了出来。中间三年,莫得任何家具,靠着来自松山湖 XbotPark 的钱,撑持过来。
公司委果稳住,是在 2021 年。
Tail "死"之后,刘博在里面立项作念了寻影 Tiny ——一款全球最小的追踪拍摄 AI 录像头。
Tiny 比 Tail 拘谨好多。Tiny 的场景是理会的:开会、打电话、授课、直播,东谈主群是明确的器具型用户。
2020 年底发布,公司从那时候才算委果稳住。
稳住之后,涌进来二三十家追随者,但作念着作念着,大部分都停了。因为追随者们发现,要作念出访佛恶果的算法,只须在 GPU 办事器上能力跑,塞不进一个小开采;就算拼凑作念出来,成本上和寻影也莫得竞争力。
2022 年下半年,另一家影像公司才慢半拍地发布了跟进家具。他们前后研发周期破钞了两年多,这一步迈出来,比 Tiny 足足晚了两年多。据刘博说,行业里一直到 2024 年还有伙伴在用寻影的第一代 Tail 作念调试参照。
也曾踩过的坑,如今回头一看,都成了壁垒。
刘博笑着说,他们"作念了好多行业孝顺",好多行业范例——手势选东谈主动作范式、手势变焦动作范式、AI 自动构图、开采掰下来自动就寝,是寻影第一个作念,其后变成了行业公式。
今天的寻影有梗概 500 名职工,中枢技能蕴蓄分三块:影像、感知、畅通铁心。家具线从 Tiny 系列延迟,朝上走到 350 好意思元,在全球 Webcam 市集订价最高的一档,向下有 Meet 系列和减配线攻主流市集。2021 年到当今,邻接五年结束高速增长。
2023 年,公司第一次谨慎作念国内市集,这一次寻影切入的不是通用市集,而是直播场景。半年内,他们把"直播专用录像头"这个原来不存在的品类作念出来了。
本年是寻影的第十年,巧合是 AI 硬件从观点到践诺的十年。
2015 年前后是"智能硬件"时间,各式接上网、能联动的开采被冠上"智能"二字涌进市集,大多数悄无声气地灭亡了,然后是 CV 赋能安防的时间。然后是大模子来了," AI native 硬件"成了新的热词:Ring、Plaud、Rabbit R1、AI 眼镜……一轮轮新物种被界说出来。
刘博对这些波澜的格调很缓慢,甚而有些不以为然。
"面包即是面包,你加了糖亦然面包,烤了亦然面包"。刘博说,随着技能演进,你可以用新技能让它更逾越,但它如故阿谁东西。相机即是相机,寻影在作念让它自动化这件事——这个需求从东谈主类存在就存在,不是因为有了大模子才有的。
大言语模子还没集成进寻影正在卖的家具里,但刘博他们正在准备, "渐渐会有新形态家具面世"。
从 2016 年到当今,刘博说他们要作念的事从没变过,莫得顿悟时刻,莫得某次模子的骄矜让他们眨眼间更正方针,有的仅仅一个条目接一个条目地变纯属,一个台阶接一个台阶地走到可以拜托的位置。
影像自动化这件事,寻影走了十年,刘博以为,当今距离他要的筹算,"作念了无意百分之十。"他说。
现时,寻影约 85% 的营收来自外洋,并已插足沃尔玛、亚马逊、乐天等主流渠谈,开云体育官方网站寻影 Tail 2 在 PTZ CAMERA 领域销量第一。寻影在全球高端 webcam 市占率杰出 50%,市占率第一。全球年活跃用户提高 209%,全球用户年增长率 200% 以上。
"咱们作念的事莫得参考,有参考我就无谓作念了"
虎嗅:当初为什么选这个方针,影像自动化这事儿到底是什么?
刘博:咱们偏学生创业,莫得资源。这种情景下,逻辑很简略:技能上相配简略、但资源消耗大的事,咱们作念不了;反过来,难到一般东谈主不敢碰,或者一般东谈主不敢想的,才是咱们能作念的。若是不作念一个罕见大的事,那咱们去上班多好。亦然念念考了很永劫期,才阐明要作念这件事。
影像自动化即是这样的方针。视频是东谈主类通讯里信息密度最高的载体——四维,一定会杰出笔墨。视频麇集这件事,在脑波爆炸之前,一定是东谈主类通讯里最垂死的步伐。而 2016 年,深度学习刚追想,时期点是对的。
咱们最底层的逻辑即是,视频坚信是东谈主类相通中相配垂死,甚而是最垂死的一种格式。若是咱们的视频麇集如故靠东谈主端着录像机拍摄,这个数目瓶颈相配赫然。奈何能力让视频麇集达到咱们设计的最终情景?即是影像必须自动化,相机必须能自主拍摄,让拍摄变得和呼吸一样简略,是以这里面就波及到大批的责任要作念。
虎嗅:你们的第一款家具——寻影 Tail,这个家具形态哪怕是今天来看也很有数,那时有莫得参考?为啥一定要当"第一个吃螃蟹的东谈主"?
刘博:莫得参考,若是有参考我就无谓作念了。Tail 这个形态是咱们发明的,当今咱们也不知谈最终什么形态、或者哪几种组合是强大东谈主委果会用的,这一直在探索。咱们是在作念一辆"莫得方针盘的汽车"。
虎嗅:奈何贯通"莫得方针盘的汽车"?
刘博:咱们作念的不是给司机开的汽车,作念的是办事乘客的东西,从一启动就没商量方针盘。一般东谈主贯通相机,即是拿着、瞄准、拍。这实质上如故"手动驾驶"。但咱们从第一天就在作念影像界的"无东谈主驾驶"——用户不需要去操控,开采我方知谈拍什么,我方构图,我方作念拍摄决策。这是两种压根不同的家具逻辑。
虎嗅:作念这样的家具,你不怕手机功能迭代后,被手机吃掉吗?
刘博:不存在和手机的竞争。手机是个东谈主 ID 开采,揣兜里,屏幕交互,中枢是"在你身上"。自动拍摄开采恰恰相背,被拍摄者没法在我方身上装一个拍我方的开采,光学上就不诞生,它只可在远端。这是物理规模,不是遴荐。卡片机、DV 被手机打没,是因为使用场景完全重迭,都是端在手里,都是主动拍。咱们作念的不是这件事,手机取代不了咱们。
虎嗅:但那时候连 NPU 都莫得,供应链压根没准备好,为什么你们就这样笃定这条路?
刘博: NPU 一定会出现 ,,这是咱们 2016 年作念的最枢纽的一个判断。
那时候咱们和行业的东谈主聊,看到了信号。那时候天然用的是英伟达 GPU 的决议,但咱们知谈要等的东西在那边。
委果可商用的 NPU 是 2018 年才有 , 咱们 2016 年启动作念,2019 年发第一款家具,中间三年莫得家具。
虎嗅:那时候 CV(视觉识别)很火,那时的 AI 四小龙全选了安防,你们作念影像,有莫得想过往阿谁方针走?
刘博: 安防要的是影像背后的信息,比如有莫得东谈主侵入,有莫得额外活动——它不要影像自己。那影像的质地、声气、拍摄的好意思感,在安防里是零需求。咱们作念的是让影像自己变得豪阔好、麇集豪阔简略。这是两件完全不同的事。
虎嗅:CES 上获取了最好家具,你还难忘那时团队的情景吗?众人有莫得很隆盛、很慷慨?
刘博:众人都很嗨,脑子有点乱。因为那时得到了这样的高度评价,就以为家具一发布坚信会大卖。那时众人都以为咱们在作念一件罕见伟大的事。可家具发布后,销量并莫得罕见好,正规投注平台咱们才渐渐意志到,尤其是一个新品类,再加上新品牌,而况还不是实足众人化的家具,市集讲授是需要时期的。它甚而都不成叫极客家具。我举个不适合的例子,咱们当今用微单、手机拍照这样熟练,是经过了几十年的市集讲授。从菲林时间启动,一直讲授到当今,才造成这样的普及度。咱们当今要作念的,是一种全新的市集讲授:你的影像麇集可以自若双手了。这格外于透澈颠覆东谈主类对影像麇集的融会,简直不可能一旦一夕就让东谈主们民风。
虎嗅:然而从 CES 上的最好家具,到国内发售后被"骂惨",阿谁时候是不是最繁忙的阶段?
刘博:咱们那款家具其实有好多迤逦:滥觞,刚才也提到,发布时咱们没法界定理会它的使用场景,好多东谈主以为观点很犀利,但真让他们用,又以为不知谈奈何用,有一些这样的小问题。不外到 2020 年,这些问题渐渐就解决了,众人也渐渐找到用这个家具缓慢责任量的款式。但更大的空泛是咱们 2019 年六月份发布家具,2020 岁首就没法坐褥了,是以这款家具的存活时期只须半年多。芯片供应出了问题,那时确切很惨。但好的小数是,这款家具发布时,因为观点新颖,在圈内和行业内的评价相配高。因为 Tail,咱们成绩了一批中枢用户——当今有些共事,即是因为阿谁家具才加入的,三年建起来的技能基础底细,其后一直都在用。

团队像片,由寻影提供
虎嗅:融资奈何解决的?
刘博:相配难。主流成本是互联网逻辑,不会投这种永久、坚苦的东西。那时被问烂了,比如视频滋扰诡秘,应该作念笔墨;这件事可能得等五十年,凭什么投先烈;你们几个破学生,凭什么行?负隅挣扎的时候,在上海火车站给松山湖的 XbotPark 打了电话,若是莫得高西宾(高秉强)、李西宾(李泽湘)和甘西宾(甘洁),阿谁阶段压根过不去。
虎嗅:什么时候你以为无谓再为公司的现款流、融资的事情发愁了?
刘博:我心态相对沉稳下来,是在 2021 年。那一年看到公司的功绩报表,心态就莫得那么焦虑了。
虎嗅:那时作念了什么事情?
刘博:2019 年咱们发布的第一款家具是 Tail,即是刚才提到的那款;2020 年底,咱们发布了第二款家具 Tiny。
虎嗅:寻影 Tiny 发布之后家具销售情况可以?
刘博:对,那时家具销量可以,举座发展也合适咱们的预期。Tiny 比 Tail 拘谨好多。Tail 是想作念给所有这个词东谈主用的,用户讲授成本极高——新品类加新品牌加不够众人化,三件事叠在一皆,很难起来。Tiny 的场景理会:开会、打电话、授课、直播,用户是明确的器具型东谈主群。Tiny 发布之后,公司才算委果厚实下来。但从那之后,每一步发展基本都和预期差未几。
更垂死的是咱们之前说的所有这个词话,都用事实评释是对的。是以就再也莫得质疑了,甚而有好多东谈主主动来问,要不要一皆配合。
"踩过的坑,一直都是壁垒"
虎嗅:厚实之后,追随者就来了,阿谁时候 Webcam 也涌入了不少公司,你奈何看来自四面八方的竞争?
刘博:大批玩家涌入——他们一部分想效法咱们,一部分我方作念基础款,两年后扎堆除掉。
虎嗅:为什么都退出了?
刘博:三层叠在一皆。
第一,算法自己扼制易;第二,算法要部署到旯旮侧、跑在 NPU 而不是 GPU 办事器上,再扼制易一些;第三,不仅仅算法,要把畅通算法、图像恶果、声气恶果,全部集成进这样小的体积,还要作念得小巧、成本可控。
看起来好像这东西挺好作念,嗅觉搞搞算法有契机,收尾一作念,发当今 GPU 上能力跑出来——那就作念不成这个家具形态。就看成念出来,成本莫得竞争力。这些叠加在一皆,就导致这件事不好弄。
咱们从 2017、2018 年就在作念旯旮侧算法压缩,到当今莫得停过。这个领域咱们应该是全天下遥遥率先。刚上的 Tiny 3 即是最好的评释。它比上一代 Tiny 2 体积减少 48%,分量减少 34%。要在更小的体积里塞进 AI 智能 2.0,还要升级画质和声气。
虎嗅:"踩过的坑成了壁垒"这个意旨真谛吗 ?
刘博:即是一直都是壁垒。其后者要从新踩同样的坑,要花同样的时期。
虎嗅:家具这十年,好像一直在作念一些减法以靠拢市集的需求?
刘博:两根线。
一根是干线,奈何一步步推动影像自动化。咱们的每一代家具,实质上都是性能的加法:系统越来越趋于完善,算法更强,部署更轻,消费者的体验更好。
另一根是市集线,根据用户响应和场景需求部署家具矩阵。Webcam 市集主流东谈主群不在天花板上,于是作念了 Meet 系列:形态更接近传统 Webcam,价钱更接近主流,但里面如故有算法作念自动构图和追踪。再向下,24 年 25 年启动作念 100-200 好意思元、50-100 好意思元的减配线,把市集份额拿得更全。
虎嗅:Meet 系列那时是基于什么样的技能判断推出的?那款家具好像加了一些新功能。
刘博: Meet 系列最中枢的逻辑是,咱们作念录像头家具,一直走的是高端道路。当咱们还是占据了一些用户心智,尤其是高端用户心智之后,但愿能尽量多霸占这个市集。咱们最终有一个筹算,即是冲突传统的市集款式,是以不成只作念高端,也要遮蔽众人市集,这是第一个逻辑。
第二个逻辑是,天然咱们的高端家具很好、很有特色,但如故有好多老庶民摄取不了,以为功能太复杂、不会用,会问"能不成给我一个强大小数的家具"。是以咱们就安妥拘谨,推出了 Meet 系列,它依然有很强的家具特色,但形态上更靠拢传统的录像头,同期用算法结束自动构图等自动化功能,价钱上也更靠拢众人用户,不再是高端定位,让更多东谈主能摄取、能使用。即是通过家具矩阵,更好地霸占市集。
虎嗅:竞争款式上,你奈何分离不同的敌手?你以为寻影畴昔的竞争敌手可能是哪类公司?
刘博:现阶段 Logitech 是咱们视线里最需要温雅的。而在专科影像领域,接下来几年,咱们不可幸免地会与松下、索尼、佳能这些百年巨头在合并个棋盘上再见。他们卖的是当年一百年千里淀下来的精密光学硬件,而咱们卖的是 AI 算法跑出来的自动化体验。当今众人胃口变了,渐渐民风了这种更高效的拍摄款式,这让咱们在面对这些百年巨头时,心里是有底气的。
虎嗅:创业好多时候都是反学问的,你以为这个进程中最反学问的事情是什么?
刘博:若是从强大东谈主的学问来看,咱们好多决策都是反学问的,无意百分之七八十的决策,和大多数东谈主的遴荐都不一样。但若是往底层、往实质去看,咱们作念的事情其实莫得什么反学问的。
虎嗅:你认为寻影是一个什么样的公司?硬件公司?如故 AI 公司?
刘博:是一家系统公司。其实咱们一直在从各个角度作念这件事,它不是单一步伐的问题。滥觞,影像拍摄和声气录制有实质区别,灌音机纪录声气相对简略,只须纪录下来再转译就可以。但影像是很复杂的,不同的拍摄角度、多东谈主拍摄、场景切换,呈现的恶果完全不同,想要呈现好的恶果,需要大批的责任,不是一个单点技能、一个开采就能解决的,这是一个系统工程。是以咱们定位我方是一家系统公司。
距离非常,还有 90% 的路要走
虎嗅:2023 年启动谨慎作念国内,为什么是这个时期点?
刘博:两件事同期诞生。
第一,环境变了。2019 年那时候,国内更信大品牌,新品类很难被摄取。到 2023 年,大疆和华为这几年更正了国内消费者对原土革命家具的摄取度。2019 年咱们那种被骂烂的情况,当今应该不会发生了。
第二,外洋基本盘稳了。这几年咱们跑得挺快,每年起码 50% 的增长,快的时候增速胜利破了 100%。有这个基础底细,才有经历谨慎作念国内。
但咱们莫得胜利冲通用市集,而是先切了直播这个垂直场景。半年内就把直播专用录像头这个新品类作念出来了——国内之前莫得这个东西。
虎嗅:你以为公司当今算到手了吗?
刘博:到手很难界说。咱们当今作念的事情,和咱们最终但愿达到的筹算比拟,完成度还相配低。但也很难说会失败,因为失败也莫得明确的界定范例。应该说,咱们最终但愿把这件事推动到 100%。
虎嗅:你以为当今距离到非常的路程走了些许了?
刘博:10%。剩下的路奈何走,变数还好多。可能走到一半,会有更多同业进来跟咱们一皆垦荒,或者通过行业配合来加快程度。还有一种可能是,咱们作念得很繁忙,终末把公司作念得相配大,可能达到几万东谈主限度,能力把这件事从 40% 推动到 80%。
这一切都界定不理会。但我以为,咱们当今作念的这件事,非论需要十年如故二十年,最终能推动到 100% 是势必的,是东谈主类社会发展的势必趋势。
虎嗅:你说当今只作念到了 10%,奈何这样慢?
刘博:鸡生蛋蛋生鸡。启动的时候又莫得鸡又莫得蛋——东谈主类的使用民风是蛋,有莫得可用的家具是鸡。都从零启动,慢是势必的。
当今直播、Vlog 这些场景起来了,部分东谈主启动用不一样的款式纪录我方的生存。这是鸡和蛋启动相互推动。但离 " 视频麇集像喝水一样天然 " ——吃饭都复杂,像喝水一样简略——离阿谁情景还很远。
咱们我方作念的那些,离咱们认为应该作念到的也就 10%。技能储备、家具迭代、市集讲授,都还有很长的路。
虎嗅:当年十年里,有莫得让你终末悔的决策,以为那时不应该那么作念?
刘博:其实咱们公司到今天,所有这个词的决策都不是我一个东谈主头脑发烧拍板的。每一个决策,都是咱们在那时掌持的信息范围内,作念出的相对最优遴荐。咱们公司的特色即是稳健,作念的事情基本都是可控的,碰到可能导致紧要风险的事情,大部分都实时止损了。
虎嗅:比如有哪些濒临紧要风险的时刻,你们终末实时收手了?
刘博:比如咱们中间有一款家具,那时想作念第二代,前后调研、折腾了无意一年半,终末我决定透澈搁置。若是那时持续作念下去,那款家具的形态可能会让咱们堕入和其他品牌的同质化竞争,这对咱们来说会很空泛,可能会让用户产生不好的梦想。对于咱们这个限度的公司来说,这种同质化竞争不是功德,是以就实时停住了。
虎嗅:是以你以为,当今还没到和巨头硬刚的时候?
刘博:以咱们当今的限度,一定要尽量幸免犯一些不该犯的营业诞妄。咱们之是以没犯过这类诞妄,并不是因为短促。比如在咱们我方的中枢领域,若是有别东谈主来竞争,咱们是不怕的,但没必要主动去和巨头硬刚,幸免不必要的风险。
虎嗅:畴昔随着影像自动化越来越普及,录像头这种家具形态可能会被其他形态替代?咱们会作念这方面的准备吗?
刘博:咱们的家具平台一直在演进,不是等别东谈主来挑战咱们才去准备。后头咱们会有一些不同形态的家具,渐渐在不同领域推行和诈欺。具体的形态我不方便例如。
虎嗅:畅想一下,当影像自动化达到您所说的 100% 期许情景时,会是如何的场景?
刘博:视频信息的传播会变得像喝水一样简略。所有这个词这个词视频信息在东谈主类生存中的流转,会像河水一样天然、简略,比吃饭都要毛糙。东谈主类的相通格式可能都会发生实质变化,当今咱们还需要看演义、看笔墨来获取信息,畴昔这种款式可能会被更浅近的视频格式替代。
米兰体育官方网站 - MILAN投注pp
2026年,线崇高量越来越贵,获客资本居高不下,越来越多品牌开动把眼神再行投向“...
在2026年2月8日,华中师范大学国家文化产业研究中心原副主任、教授、博士生导师...
春节周边,互联网巨头在AI战场再次兵戎再会。 腾讯元宝秘书2月1日上线春节步履,...
IT之家 3 月 10 日音信,vivo 家具司理韩伯啸当天公布了两款手机增距镜...