万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口-欧洲杯体育也有来自通义千问的 Qwen 系列-万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口

欧洲杯体育也有来自通义千问的 Qwen 系列-万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口

发布日期:2025-09-17 12:30  点击次数:72

欧洲杯体育也有来自通义千问的 Qwen 系列-万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口

有一说一,最近国内的 AI 大模子圈,属实有点闲暇了。

先不谈大伙万众瞩盘算推算 DeepSeek-R2 了,这玩意除了若即若离的爆料之外,莫得少许动静,有种哪怕再过半年技巧,也不一定能够落地的嗅觉。

客岁打得你来我往的 AI 四小龙,本年好像也和小猫相同蔫了,说是各人齐在闷声饱读捣着我方的东西,但愣是什么齐莫得端出来,有种凿壁偷光的好意思。

至于大厂这边,迭代速率也齐慢了下来,把更多的元气心灵放到了应用上。豆包固然端出了 1.6 大模子,但是宣传要点更多是 TRAE 和扣子空间;讯飞在发力 AI 老师和办公 Agents,百度则在鼓励全历程 AI 修图和钞票贬责,各有各的念念路。

总的来说,这些应用倒是蛮实用的,等于如实没什么特别让东说念主惊艳的产物。

这在线大模子没啥新进展,腹地大模子就更是在兢兢业业了,此前一直在更新的 Mistral AI 一经有小半年没啥声息了,迁徙端的端侧大模子更是杳无音问,宣传了整整两三年的 AI 手机,绝顶 90% 的功能照旧靠云霄终了的。

(图源:谷歌)

谷歌寻念念:这不能啊,那我的 Pixel 系列该如何办?

上周,谷歌 DeepMind 在推特上厚爱文书,发布并开源了全新的端侧多模态大模子 Gemma 3n。

谷歌示意,Gemma 3n 的发布代表了迁徙配置端 AI 的首要朝上,它为手机、平板、条记本电脑等端侧配置带来了弘远的多模态功能,不错让用户体验到畴昔独一云霄先进模子上身手体验的高效处感性能。

又来个以小搏大吗?有点酷爱。

为了望望这玩意的确实成色,小雷也去下载了谷歌发布的最新模子进行测试,接下来就给各人说说内部的亮点吧。

来源,咱们来解答两个问题:

来源,什么是 Gemma 3n?

Gemma 3n 是谷歌行使MatFormer架构打造的轻量化端侧大模子,借由嵌套式结构终明晰低内存谗谄瞎想,当前官方一共推出了 5B(E2B)和 8B(E4B)两种型号,但通过架构改进,其 VRAM 占用与 2B 和 4B 绝顶,最低只消 2GB。

(图源:Google)

其次,Gemma 3n 能作念什么?

不同于成例的文本剪裁模子,Gemma 3n 原生援助图像、音视频等多种输入模态,不仅不错终了自动语音识别(ASR)和自动语音翻译(AST),以致不错完成各式图像和视频理罢免务。

原生的多模态、多谈话瞎想,如实相配稳妥迁徙端侧配置。

终末,我要若何作念,身手用上 Gemma 3n 呢?

放在六个月前,想在手机上部署端侧大模子其实是一件荒谬复杂的事情,往来往要借助 Linux 假造机的匡助身手终了,雷科技也曾还为此推出过一篇教程,因此各人会有这样的疑问亦然很合理的。

但是当今,就莫得这个必要了。

Google 在上个月低调上线了一款新应用,名为Google AI Edge Gallery,援助用户在手机上平直运转来自 Hugging Face 平台的开源 AI 模子,这是 Google 初度尝试将轻量 AI 推理带入腹地配置。

当前该应用已在 Android 平台洞开下载,感兴味的读者不错平直前去 Github 进行体验。在完成大模子加载后,用户就不错行使这款应用终了对话式 AI、图像相识以及领导词施行室功能,以致不错导入自界说 LiteRT 形式模子。

无需联网,平直调用手机腹地算力完成任务,等于这样简单。

接下来,就轮到万众期待的测试方法了。

如图所示,谷歌为这款应用默许准备了四款模子,其中有自家的 Gemma 系列,也有来自通义千问的 Qwen 系列,咱们选用了当前最强的 Gemma 3n-4B 和通义千问的 Qwen2.5-1.5B 以及额外部署的 Qwen3-4B GGUF 进行测试。

来源是经典的草莓问题:

Q:Strawberry 一词中有几许个字母" r "?

这一题看起来简单,却实简直在难倒过诸多 AI 大模子。

实测下来,莫得深度念念考智商的 Gemma 3n-4B 和 Qwen2.5-1.5B 依然会回答" 2 个",有深度念念考智商的 Qwen3-4B GGUF 则能够给出正确谜底" 3 个",仅仅无语其妙的反复念念考让它整整生成了两分半钟,还挺阔绰技巧的。

(图源:雷科技,从左到右:Qwen2.5、Gemma 3n、Qwen3)

从成果来看,小参数如实会显贵裁汰模子的逻辑念念考智商,深度念念考功能不错在一定进程上裁汰 AI 幻觉产生的可能性,但也因此会增多生成所需的技巧。

然后是一齐相比简单的误导问题:

Q:"种豆南山下"的前一句是什么?

事实上,这是出自陶渊明《归园田居 · 其三》的首句诗,并莫得前一句,无意能望望这几款小参数模子是否存在为了回答问题编造数据的风景。

真义的是,此次独一 Qwen2.5-1.5B 给出了原诗句,但是莫得给出辩白的谜底;而 Qwen3-4B GGUF 根蒂等于风马牛不相干,Gemma 3n-4B 则编出了根蒂不存在的诗句,以致不合适古诗词韵律。

(图源:雷科技)

然后是一齐地舆知识问题:

Q:有一位学者在田园搭帐篷,转眼碰到了一只熊,这时候他就相配焦躁地逃逸,先是向南跑了 10 公里,又向东跑了 10 公里,终末还向北跑了 10 公里,这时候他惊羡地发现我方回到了原先搭帐篷的位置。讨教:这位学者碰到的那头熊是什么面孔?

这个问题主要测试模子对特殊地舆位置温文象的相识,讲理学者通达轨迹的方位只然而北极,因此这头熊当然是白色的北极熊。

成果呢,Qwen2.5-1.5B 在进行了一段毫无逻辑的分析后,给出了子虚的谜底;Gemma 3n-4B 和 Qwen3-4B GGUF 则能够得手给出正确的谜底,需要谛视 Qwen3-4B GGUF 因为念念考谗谄 token 太多导致谜底莫得澈底生成的风景,这在整段测试中齐很常见。

然后是一个简单的文本处理任务。

具体来说,我这边提供了 600 字傍边的著述小序,但愿他们能够给出对应的著述回来。

其中,Gemma 3n-4B 和 Qwen3-4B GGUF 齐算是能完成任务的,不外因为 Gemma 3n-4B 原始谈话是英文,因此给出的回来亦然英文的,而 Qwen3-4B GGUF 则能够提供华文的著述回来。

至于参数最小的 Qwen2.5-1.5B,根蒂就给不出恢复。

从以上四轮测试来看,在文本处理、逻辑推明智商上,Gemma 3n-4B 和 Qwen3-4B GGUF 其实出入无几,但是在生成速率、回复得手率上其实是来源不少的,深度念念考露出是不稳妥腹地模子的。

不外 Gemma 3n 并不是单纯的文本大模子,东说念主家然而罕有的小参数多模态大模子。

固然语音识别当前 Google AI Edge Gallery 调用不了,但是图像识别东说念主家照旧有准备的,点击" Ask Image "选项,就不错通过顺手拍摄或者上传相片的方式,向 Gemma 3n 发问。

实测下来,当前的 Gemma 3n 关于动漫扮装可谓一窍欠亨,诸如花草识别这类应用也不精确,独一相比常见的食品、硬件这类不错识别出来,何况对图片里的元素识别其实并不算精确。

但最起码,Gemma 3n 如实终明晰迁徙端侧的多模态瞎想。

好了,经过我这几天的按序折腾,是时候给谷歌这个 Gemma 3n 下个论断了。

总的来说,这玩意儿给我的嗅觉是"偏科较着,但改日可期"。

在最基础的文本问答和逻辑智商上,它的推崇只可算中规中矩,部分逻辑测试中的推崇露出不如援助深度念念考的 Qwen 3-4B,但是比起当前手机上常见的 Qwen2.5-1.5B 照旧有较着晋升的。

但它的优点也很隆起,那等于快,Gemma 3n-4B 的反馈速率较着要比 Qwen 3-4B 快许多,莫得深度念念考就意味着它没那么吃性能,跑起来露出更富厚,基本能够作念到 100% 的生成反馈率。

(图源:Google)

至于成果对分别 ... 那是模子智商的问题。

至于它的中枢卖点——离线图像识别,智商如实有,但也就停留在"基础"层面,识别个物体、索要个翰墨还行,想让它相识复杂场景就有点难为它了。何况,原生英文的基础底细让它处理复杂华文时偶尔会冒出点 bug,这点得谛视。

总的来说,Gemma 3n 并莫得带来那种颠覆级的体验,更像是在性能和多功能之间作念出的一个严慎调和。

这梗概等于端侧小模子现阶段绝顶的弊病吧:什么齐会少许欧洲杯体育,但离确实的"万能"还有一段路要走。



相关资讯
热点资讯
  • 友情链接:

Powered by 万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口 @2013-2022 RSS地图 HTML地图