AI爆点转移至多模态,体现了什么行业趋势?

2025年的AI爆点正在发生转移。

自DeepSeek R1上半年引爆行业情绪之后,“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年,话题重心明显滑向多模态领域。

Sora 2被封装成可交付应用、谷歌推出图像编辑能力更强悍的Nano Banana;AI Agent这端同样如此,在Manus这样文本属性更突出的通用型产品之后,达到相近级别热度的是主攻视觉创作场景的LoveArt。

在这背后,文本模型的迭代进入一种基线较高、小步抬升的阶段,而多模态理解与生成能力在可用性上,向“破圈”层级又近了一步。

一名从事模型训练的研究人员对界面新闻记者指出,要理解这个现象,首先要认识到文本与多模态两个方向的研究是并行而非串行。

经过GPT-3、GPT-4、OpenAI o1等重大节点之后,大模型的语言理解能力足以交付C端(用户)应用,后续优化集中在稳态工程,例如对齐、降本、延迟优化、鲁棒性等等,这些能够进一步优化C端应用体验和B端(企业)商用价值,但用户感知不再像GPT-4来临时那样有强烈冲击。

一个典型的例子是DeepSeek-OCR。这是一个在话题性上不足以震撼人心的demo,但有其长期影响力。

DeepSeek-OCR在10月20日推出,定位于探索文本的视觉压缩能力(光学上下文压缩,Contexts Optical Compression)。简单而言,随着上下文输入增多,模型计算量以平方级陡增,但通过将长文本转化为图像识别,可以大幅压缩token计算数量。这一思路得到验证的成果是,它一旦落地到应用端,也是一个前景颇为确切的降本增效方式。

多模态这一侧完全不同,其能力曲线仍在还可以被更多人感知的区域内。不过,前述受访者指出,从并行的思路来看,多模态模型这端还未实现架构层级的突破,更多是足够的数据累积和训练技巧提升。

图源:界面新闻

正如他对Sora 2和Nano Banana的判断,除去OpenAI对多模态生成类产品的初步构想成型,以及谷歌对图像编辑器现阶段用户需求的把握(例如锚定一个点进行针对性修改),两款产品在生成质量上并未实现飞跃。

并且,在很大程度上,以“文生图、文生视频”为代表的多模态生成领域,其表现优化是以文本模型性能提升为前提。阶跃星辰创始人兼CEO姜大昕此前在接受界面新闻记者采访时指出,理解与生成之间的关系是,理解控制生成、而生成监督理解。

一级市场也在见证这种关注点切换。一名AI投资人对界面新闻记者表示,他的体感是今年行业整体投资事件增多,但投资规模在降低,这是投资重点由模型层向应用层过渡后,后者的市场规模及估值所决定的。

在这之中,今年最显眼的一笔来自应用层视觉创作领域的LiblibAI。10月23日,LiblibAI宣布完成1.3亿美元B轮融资,红杉中国、CMC资本等参与其中,促成今年国内资本市场AI应用赛道最大的一笔融资。这意味着相较其他赛道,团队的PMF(product-market-fit)更大程度受到资本认可。

在往后很长一段时间,业界能够期待的“爆点”或许都将更多来自于多模态领域。

姜大昕一直强调的观点是,光有语言的智能不够,多模态是大模型的必经之路。而在这片领域,理解与生成的统一仍是现阶段的突破点。

多名受访者曾对界面新闻记者表示,站在模型训练角度,视觉模态比文本模态面临的挑战更大。单从数据上来看,文本的表征可以在语义上自闭环,但视觉信息的表征需要先与文本对齐,不存在天然自闭环的数据,“可能需要几次像ChatGPT、强化学习范式这样的大技术变迁才能解决。”一名受访者说。

而一派观点认为,基于更好的多模态模型,世界模型、具身智能、空间智能等才能得到长足发展,行业才能进一步靠近AGI(通用人工智能)。

更现实的考量是,模型决定应用能力上限,在文本模型集中火力降本增效和缓慢提升性能的同时,多模态模型的突破有望给市场带来更多PMF机会,这将是创业者和投资人眼中更具实际价值的关键变化。

  • 随机文章
  • 热门文章
  • 热评文章

相关阅读

  • 立起新时代“党代表”的好样子

    立起新时代“党代表”的好样子

    立起新时代“党代表”的好样子 ■孙 翼 姚熠彬 中央军委印发《关于大力弘扬优良传统、全面肃清流毒影响 重塑政治干部形象威信的若干规定》,要求政治干部牢记“党代表”身份,自觉践行我军政治工作优良传统,以身作则、率...

    2025.11.14 07:53:21作者:陈译辉微博
  • 志愿军第130团团长东传钧的大水洞战斗日记

    志愿军第130团团长东传钧的大水洞战斗日记

    巧妙穿插勇歼敌 ——志愿军第130团团长东传钧的大水洞战斗日记 ■黄蒙蒙 李 郑 东传钧手绘的战斗日记(大水洞穿插战斗经过要图)。空降兵军史馆供图 在空降兵军史馆的展柜内,陈列着一本泛黄的日记。它...

    2025.11.13 12:46:54作者:陈译辉微博
  • AI爆点转移至多模态,体现了什么行业趋势?

    AI爆点转移至多模态,体现了什么行业趋势?

    2025年的AI爆点正在发生转移。 自DeepSeek R1上半年引爆行业情绪之后,“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年,话题重心明显滑向多模态领域。 Sora 2被封装成可交付应用、谷歌推出图像编辑能力更强悍的N...

    2025.11.11 11:33:22作者:陈译辉微博
  • OpenAI完成重组,巩固微软主要股东地位

    OpenAI完成重组,巩固微软主要股东地位

    OpenAI 于周二宣布已完成资本重组,正式确立 “非营利组织控股营利性业务” 的架构。 这家人工智能初创公司表示,其非营利实体现已更名为 “OpenAI 基金会”(OpenAI Foundation),在营利性子公司中持有的股权价值...

    2025.11.11 10:20:01作者:陈译辉微博
  • OpenAI CEO筹备非侵入式脑机接口公司Merge Labs:利用声波读取大脑

    OpenAI CEO筹备非侵入式脑机接口公司Merge Labs:利用声波读取大脑

    10月28日消息,据the verge援引Sources报道称,OpenAI CEO 萨姆・奥尔特曼(Sam Altman)的脑机接口初创公司 Merge Labs 正在筹备中,并已邀请到加州理工学院的生物分子工程师米哈伊尔・夏皮罗(Mik...

    2025.11.11 06:40:01作者:陈译辉微博
  • 山东发布全国首个省级低空信息基础设施专项规划,2027 年实现济南青岛全域覆盖

    山东发布全国首个省级低空信息基础设施专项规划,2027 年实现济南青岛全域覆盖

    10 月 27 日消息,山东省通信管理局微信公众号消息,10 月 14 日,山东省通信管理局联合省发展改革委、省自然资源厅、省交通运输厅印发《山东省低空信息基础设施专项规划》。这是全国首个省级低空信息基础设施专项规划。 规划提出,以济...

    2025.11.11 05:26:41作者:陈译辉微博
  • 全球内存芯片市场迎来“超级周期”,供需紧张加剧

    全球内存芯片市场迎来“超级周期”,供需紧张加剧

    行业高管和分析师表示,全球芯片制造商争相生产人工智能(AI)芯片,导致智能手机、电脑和服务器中使用的一些本不那么引人注目的芯片供应紧张,引发部分消费者恐慌性抢购,价格飙升。 人工智能热潮带来的意外连锁反应,给包括三星电子在内的存储芯片制造...

    2025.11.09 04:34:35作者:陈译辉微博
  • 长飞公司执行董事兼总裁庄丹荣获毕马威首届“未来企业家大奖”

    长飞公司执行董事兼总裁庄丹荣获毕马威首届“未来企业家大奖”

    近日,在深圳举办的首届毕马威“未来企业家大奖”颁奖典礼上,长飞光纤光缆股份有限公司执行董事兼总裁庄丹凭借其在企业长期发展、技术创新、国际化及社会责任等方面的卓越贡献,荣获“未来企业家年度大奖”。这一荣誉是对庄丹卓越领导力及长飞公司全球行业...

    2025.11.09 03:48:00作者:陈译辉微博
  • 光荣时刻!一起看空军新学员授衔现场

    光荣时刻!一起看空军新学员授衔现场

    近日,空军工程大学中心校区大操场上,2025级新学员授予军衔仪式庄严举行。经过两个多月的淬火磨砺,顺利完成新训任务的学员们佩戴上了象征责任与荣光的“一道杠”肩章,正式开启军旅生涯新阶段。为新战友点赞加油! (记者杨...

    2025.11.08 05:24:37作者:陈译辉微博
  • 3所军队院校开展新学员入学入伍训练的见闻与思考

    3所军队院校开展新学员入学入伍训练的见闻与思考

    尊法学法,系好军旅“风纪扣” ——3所军队院校开展新学员入学入伍训练的见闻与思考 新的学期,军校迎来一批新的学员,新学员入学入伍训练工作也随之紧锣密鼓展开。各单位要抓住新训时机,通过多种途径引导新学员尊法学法,...

    2025.11.08 03:47:43作者:陈译辉微博
  • “常态战备+体系练兵”!海军常态化远海训练迈上新台阶

    “常态战备+体系练兵”!海军常态化远海训练迈上新台阶

    走开远海“常态战备+体系练兵”新模式 海军常态化远海训练迈上新台阶 海军某部舰艇编队开展远海战备训练(资料照片)。 乔晨曦 摄 解放军报讯 张懋瑄、记者钱晓虎报道:第47批护航编队在亚丁湾海域游...

    2025.11.03 07:50:48作者:陈译辉微博
  • 双语海报丨国防部奉劝菲方早日迷途知返

    双语海报丨国防部奉劝菲方早日迷途知返

    国防部奉劝菲方早日迷途知返 China's MND Urges the Philippine Side to Mend Its Ways before It's Too Late 10月30日下午,国防部...

    2025.10.31 04:23:07作者:陈译辉微博
推荐内容