亚搏体育app

亚搏体育APP

亚搏体育 AI眼镜的风, 终究是吹到了科大讯飞

发布日期:2026-05-30 18:28 来源:未知 作者:admin 浏览次数:

亚搏体育 AI眼镜的风, 终究是吹到了科大讯飞

作家|周雅

“咱们到底需要什么样的智能眼镜?”

这是昨天在澳门BEYOND Expo 2026的第一天,科大讯飞在其中作念了一场发布,负责带来了它的AI眼镜。在讲居品之前,科大讯飞一稔配置业务部总司理林会杰,所抛出的问题。

这个问题其实仍是存在了14年。从2012年智能眼镜的“始祖”Google Glass,一直到今天智能眼镜百“镜”皆放,无数玩家试过各式门道,于今都绕不开团结个坎——眼镜到底是个主机,如故个配件?

是作念一台戴在头上的手机,把手机功能全平移过来?如故只干几件特定的事,像耳机那样听听歌、接接电话?但话说回归,手机仍是够强了,淌若眼镜仅仅个更小的手机,突然者凭什么为它掏钱?

现实情况是,AI眼镜的局面正处于“冰与火之歌”。一边是没头没脑新品发布,但吵杂之余,另一边真实的数据却额外现实。据公开数据自大,电商平台上AI眼镜的平均退货率高达30%,在直播带货为主的某些渠说念,退货率以致贴近40%-50%。一边是没头没脑的新品发布,另一边是用户买回家就退。

归根结底,这是AI眼镜现在发展受限的事,我把这件事归为一个词——「在场」。

14年来,智能眼镜一直没能施展一件事,它是否能让用户一直让它在脸上戴着。它要么太重,戴不住,东说念主没法让它一直「在场」;要么砍得太残,没用处,东说念主没情理让它一直「在场」。它关于用户的价值,一直是悬空的。

而讯飞AI眼镜,正在试图回报这个问题。

01/ AI眼镜不该是更小的手机

这一轮AI眼镜的爆发,是因为AI进化所带来的。

它懂语言,懂图像,懂多模态,能推理,能决策,能把一整套前因后果的任务跑完。

在林会杰看来,AI和眼镜恰巧互补。

眼镜是东说念主类身上的自然进口。每天能戴十几个小时,长在目下,第一东说念主称视角,自带自大、录像头、语音一整套传感器。它有肉体,没脑子。

AI正相背。它有脑子,没肉体。

一个缺肉体,一个缺脑子。把它们拼起来,眼镜第一次有了不师法手机的情理。

是以讯飞给的定位很明确:AI眼镜不是配件,是主机;但它也不应该是更小的手机,它应该是用户的“第二大脑”。林会杰的原话是:“讯飞 AI 眼镜,是戴在目下的超等 AI 助理。”

海德格尔有个著名的说法:用具用得最顺遂的时分,恰正是你剖释不到它存在的时分。你抡锤子钉钉子,脑子里思的是钉子,不是锤子。只好锤子坏了,你才会倏得看见那把锤子。

一个用具能弗成普及,时时不看它能作念些许事,而看它能弗成「灭绝」在使用里。

要作念到这件事,林会杰说有三说念坎。

第一说念是「佩带」,得「轻」到险些无感,还弗成为了轻,而捐躯性能和续航;第二说念是「听清」,像是展会、高铁、机场这种敞开声场里,东说念主声、音乐、噪声混成一团,AI得先听得清,才谈得上听得懂;第三说念是「作念事」,让AI的确进到责任场景里,把交流和服务的链路买通。

这三说念坎,对应的正是「在场」的三层——肉体能弗成在场,感知能弗成在场,行径能弗成在场。

02/第一层在场:迥殊40克的门槛

第一说念坎是分量,它决定的是最基础的那种在场,即物理上的在场。一副戴不住的眼镜,再灵敏亦然零。

讯飞AI眼镜的分量是40克。林会杰在台上专诚较了个真,现场摆了台电子秤,上头放着讯飞AI眼镜,镜头特写打上去,读数 40.7 克。他说那0.7克是裂缝,“咱们不讲约40克,因为讯飞AI眼镜的分量即是40克。”

然后,足下还有台天秤,讯飞AI眼镜的另一端放了颗高尔夫球,死心眼镜比高尔夫球还轻。

那么这40克是如何作念出来的?讯飞败露了三层要道工艺:

第一层:全贴合树脂波导自大芯片。这是讯飞林会杰明确说起的「全球始创」工艺。波导是AR/AI眼镜自大模组的中枢,传统玻璃基波导固然光学性能好,但重、脆、贵。树脂波导则在保留自大才调的前提下大幅减重。「全贴合」意味着各层光学结构考究聚会,不留赋闲,同期减重和提高光学一致性。

第二层:航空级镁铝合金镜架。镁铝合金的密度只好钢的一半傍边,强度却鼓胀支捏结构需求,是高端札记本电脑、相机机身常用的材料。

第三层:定制化袖珍光机模组。光机是自大系统的中枢引擎,体积越小,眼镜可瞎想空间越大。

三层访佛之后,讯飞AI眼镜整机分量比同类居品轻了20%以上。

更遑急的是,这个数字背后还作念了三件事:

一是1.7米跌落测试不离散。智能眼镜的脆弱性是庸俗用户最大的神色拆开之一,四五千元的配置,掉一次就报废,谁也不敢天天戴外出。

二是针对亚洲东说念主脸作念了上千次模拟仿真测试。这是一个常被忽略的维度。绝大多量智能硬件的东说念主体工学是基于西洋东说念主脸数据建模的,鼻梁高度、太阳穴宽度、耳后弧度都不雷同。讯飞把这件事单独拎出来,针对的是中国及东亚市集的真实佩带体验。

三是莫得为减重捐躯功能。整机内集成了录像头、自大模组、5+1麦克风阵列、扬声器等数十个传感器,还要保留续航。这是讯飞在演讲中反复强调的,“不是通过砍功能把眼镜作念轻了”。

在居品发布之前,讯飞邀请了一些时尚用户作念居品前测,其中一家汽车媒体上台共享时说,女生其实很珍爱饰品的颜值和分量,她有许多素颜镜、AR 眼镜、AI 眼镜,但使用率都不高,要么太重,要么不好意思瞻念。讯飞的这副,她测下来,“跟我好几个品牌的口红是雷同重的”。

03/第二层在场:听得清看得清

戴得住,仅仅运行。

第二说念坎更硬,在真实天下的噪声里,AI如何知说念你思听谁话语,这是感知层面的在场。

林会杰倒也实诚,他在台上径直挑明说,“行业里都说 95%、98%,听起来谁都差未几”,是以他今天不贪图陈设数据,要用现场试验演示话语。

第一个演示是跨语言电话同传。

林会杰一句“小飞小飞,打电话给我的共事Andy,看一看展会现场在作念什么”,全程没动手。眼镜调起手机通信录,拨号接通,并自动启动通话翻译。而Andy在电话另一端用西班牙语先容展会现场,林会杰目下的镜片上及时泄漏中笔墨幕,同期还有语音播报。通话终了,手机上留住了全程记载,AI作念了份双语总结,亚搏(中国)一站式服务官方网站把要道信息、达成的共鸣、待服务项,都列了出来。

这个演示的要点,不在于翻译本人,在于它让AI主动休养。AI迥殊了眼镜与手机两个终局,自动完成了通信录检索、拨号、翻译启动、字幕投射、记载存档、摘抄生成等一整条链路。

但这项功能其实还不足以组成各别化,的确的实力侦查,在第二个演示边幅,也即是:80分贝复杂声场下的精确识音。林会杰把5位共事请上台,模拟真实展会环境,多东说念主交叉对话、嘈杂配景音、多语言搀杂,并在足下架了一台分贝仪作念及时杂音水平自大。当杂音冲到80分贝以上,林会杰对着Andy进行交流,目下的镜片仍然能精确呈现Andy话语的英文转写与华文翻译。

80分贝是什么主意?把柄WHO的环境杂音参考,70分贝以上经久线路会影响东说念主耳健康,80分贝额外于嘈杂的餐厅或大型展会现场。绝大多量现存AI翻译眼镜在这个分贝水平下,险些无法踏实责任。

这背后,是基于一套多模态AI降噪系统,这亦然讯飞AI眼镜分辨于市面其他居品的技能各别点。

林会杰在台上提倡了一个看似简约、却经久莫得被处治的问题:“在多东说念主同期话语的场景下,AI到底应该听谁的?”

传统决策有两类,麦克风阵列所在波束(基于声源所在推测),以及AI算法降噪(基于语音特征过滤)。但骨子上它们都是在推测哪个声息是琢磨,AI并不知说念用户的确思听谁。

讯飞的解法是,让眼镜不单「听」你话语,还要「看」你话语。

这里用上了一个「全球始创的唇动识别技能」,配合「5+1麦克风阵列」和「眼镜内置的录像头」,组成的这套多模态AI降噪系统。麦克风作念声源定位,录像头跟踪用户的视野所在,同期作念唇动识别,三者会通,系统就能锁定「你正看着的阿谁东说念主」,增强他的声息,把别的弱化掉。林会杰把它详细成九个字:“看谁听谁,看谁翻译谁。”

这套机制,其实是在用工程技能复刻东说念主脑的一个本能。

神色学里有个「鸡尾酒会效应」。几十东说念主同期话语的派对上,你依然能在嘈杂中锁定跟你聊天阿谁东说念主的声息,自动过滤掉其余的。东说念主类作念这件事,靠的是双耳定位,加上对话语东说念主嘴型、色调的视觉接济。

讯飞的多模态降噪,骨子上即是给眼镜装了一套「鸡尾酒会大脑」。用麦克风阵列作念「双耳」,用录像头读唇形作念「眼睛」,让AI能像东说念主雷同,在嘈杂的现场判断出此刻我该听谁。

这亦然讯飞反复强调的,它和别的眼镜最骨子的分辨:这台录像头不是用来拍照的,它是你的第一东说念主称视角,你看到的即是它看到的,你思听的即是它帮你听到的。

另一位前测用户,亦然一位AI眼镜测评博主上台时,讲了讲这件事。他测过市面上主流的翻译眼镜,论断是,大家在适意室内都能打到80分,可一到展会、餐厅、商超这种室外嘈杂环境,恶果径直不足格,险些不可用。对方说十句,眼镜只听进七八句,说一句只听到半句。听都听不全,翻译自然不准。他对讯飞这副的评价是,它中枢就干了一件事:让眼镜听明晰。

听清了,听懂了,才谈得上翻得对。

至于翻译本人,背后是讯飞多年的累积,汇成了讯飞自研的「端到端同声传译大模子」。

林会杰在台上解释了它与传统翻译引擎的分辨。传统决策是一个串行链路:语音 → 语音识别 → 文本 → 文本翻译 → 翻译后文本 → 语音合成 → 输出语音。每一说念工序都在累积延迟,每一说念工序都会亏损信息。

而端到端同传大模子,径直买通了这一条链路:语音输入 → 模子 → 语音输出。这就对噪声、口音的鲁棒性更高。

讯飞败露的数据是,现在支捏122种语言和口音、遮掩200多个国度和地区、内置17个行业的专科翻译模子,相当适配医疗、法律、金融、汽车、动力、外贸、媒体采访等专科商务阵势。

04/第三层在场:还得办得成

前两说念坎,让AI眼镜得以在现场「看」和「听」。第三说念坎,是让在场的AI动起来,替用户服务。

于是讯飞负责发布它的AI助理,叫作念GlassClaw。

林会杰专诚把它和庸俗话音助手划清范畴:它是多模态的,能看懂你看到的画面,能听懂你听到的声息,能领略高低文,还能主动帮你经营下一步。

开云kaiyun(中国)体育官网

现场连演了几个动作。

先是海报识别。林会杰看入辖下手里一张行径彩页问“我目下的海报是什么”,眼镜读懂了内容,翻译过来,还告诉他海报里提到的两场采访都取消了。

紧接着,林会杰下了一条额外长的提示:“查一下BEYOND垄断方和讯飞之前的互助,望望有莫得深刻互助的契机?写一份互助提案,发邮件给垄断方,抄送共事。”

这一连串动作,跨了检索、调常识库、写文档、找联系东说念主、发邮件好几个边幅。而GlassClaw接下任务,生成了提案,找到了共事的邮箱,把邮件发了出去。现场,让共事和垄断方迅速证据,邮件如实收到了。践诺经过几分钟。

从产业语境看,这正是当下Agentic AI居品形态化的一个要道节点,让AI走出“问答-用具调用”层面,形成一个替用户完成任务的行径者。讯飞把这件事,径直作念在了眼镜上,让眼镜成为Agentic AI的载体,一个用户抬眼就能调用、无须掏手机的进口。

林会杰涌现了一个细节:“我我方亦然GlassClaw的诚恳用户,每周的责任周报都是由它来完成的。”这个表述,示意了讯飞里面仍是把这个居品算作平常坐蓐力用具使用。

团结套逻辑,还蔓延到了「智能提词器」。对高频要开会、发言、演讲、采访的商务和媒体东说念主群,提词内容能及时映在目下,随着语速自动转移。配套的充电胶囊还能当实体遥控,按键切换暂停、翻页,把控发言节律。

一个够轻、会看、会听、会作念事,还一直待在你目下的AI眼镜,即是讯飞AI眼镜思要呈现的形状。

订价方面,尺度款售价4299元,续航款售价4699元,沿途发布的还有它的配件(见下图)。

05/在场式智能:当用具的确消隐于无形

整场听下来,讯飞反复回到团结个画面。

发布会上看到一张外文PPT,你抬手机思拍,还没拍下来就翻页了。国际客户回电,你平直足无措再找一台配置。国企开会,你不粗浅掏动手机。

这些场景的共同点,是需要「双手」。

手机时期,通盘的智能都藏在一块需要你掏出来、点亮、解锁、掀开运用的玻璃里。

讯飞AI眼镜思要进化的,是「自若双手」。它把智能从口袋里那块需要被叫醒的玻璃,挪到了你恒久睁着的那双眼睛前边。手机的智能是「召唤式的」,你得主动去找它。眼镜的智能是「在场式的」,它一直就在那处。

发布会尾声,林会杰在台上说,“异日的天下,每一个信息、每一段对话、每一个场景,都应该在你的目下自然流动,迥殊语言时空的范畴,买通物理天下与数字天下的桥梁。眼镜将成为一语气东说念主与天下、东说念主与常识、东说念主与东说念主之间交流的新一代的交互进口。讯飞AI眼镜要让每个东说念主都领有「第二双眼睛」和「第二个大脑」。”

这话说得很大亚搏体育,可落到那片小小的镜片上,它又变得很具体。