开源LLM推理引擎vLLM的核心维护者们正式宣布成立初创公司Inferact,并完成了1.5亿美元的种子轮融资,估值达8亿美金。

本轮融资由Andreessen Horowitz和Lightspeed领投,红杉资本、Altimeter Capital、红点创投、真格基金等机构跟投。融资额在种子轮中确实罕见,反映出市场对AI推理基础设施领域的高度期待。

有行业观察者指出,vLLM已经成为开源推理领域的事实标准,围绕其构建公司既有利于加速vLLM发展,也能让研究人员获得应有的回报。从开源项目到商业化公司,这条路径正在成为技术创业的新范式。

推理的挑战正在加剧

Inferact团队在公告中直言不讳:“推理问题远未解决,反而变得越来越难。”模型体积不断膨胀,混合专家、多模态、智能体等新架构层出不穷,每个突破都需要新的基础设施支持。与此同时,硬件生态日益碎片化——更多的加速器、更多的编程模型,需要优化的组合呈指数级增长。

这种模型能力与服务体系之间的差距正在扩大。如果放任不管,最强大的模型将受限于基础设施,只有能构建定制系统的机构才能充分发挥其潜力。

更关键的是,推理在整个计算中的占比正在从少数变为主流:测试阶段计算、强化学习训练循环、合成数据生成等场景都对推理提出了更高要求。

vLLM的生态优势

vLLM处于模型与硬件的交汇点,这一地位是多年积累的结果。当模型供应商推出新架构时,他们会与vLLM团队合作确保首发支持;硬件厂商开发新芯片时,也会优先集成vLLM。

目前,vLLM支持500多种模型架构,在200多种加速器上运行,为全球范围的推理提供动力。这个由2000多名贡献者共同构建的生态系统,成为了Inferact最坚实的基石。

开源承诺不变

团队强调,vLLM从一开始就是开源项目,这一原则不会改变。Inferact的存在是为了加速vLLM的普及,他们开发的优化将回馈给社区。未来计划包括进一步提升vLLM性能、深化对新兴模型架构的支持,以及扩展对前沿硬件的覆盖。


说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。

结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”

我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。

即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!

这绝非空谈。数据说话

2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。

AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。

与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。

当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程

  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)

  • ✅大模型书籍与技术文档PDF

  • ✅各大厂大模型面试题目详解

  • ✅640套AI大模型报告合集

  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

在这里插入图片描述

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤640套AI大模型报告合集

在这里插入图片描述

⑥大模型入门实战训练

在这里插入图片描述

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐