Subquadratic 获 2900 万美元种子轮融资:推出颠覆性线性扩展架构,上下文处理能力提升近千倍
在Transformer架构统治大模型世界三年后,一种颠覆性的线性缩放方案终于从实验室走向了商业战场。Subquadratic带着2900万美元种子轮融资和号称能将注意力计算降低近1000倍的技术,向业界投下了一枚深水炸弹。其推出的SubQ 1M-Preview,成为首个完全亚二次方(subquadratic)的大型语言模型架构,并已支持高达1200万个token的上下文窗口——这几乎是GPT-5.5和Claude Opus当前能力的数十倍。
线性vs.二次方:一场算力暴政的终结?
传统Transformer的“二次方诅咒”早已是公开的秘密:当上下文从4K扩展到128K时,注意力计算成本会呈指数级飙升。Subquadratic的解法并非简单的工程优化,而是从数学上重新定义了注意力机制——将O(n²)复杂度压缩至O(n)。在RULER 128K基准测试中,SubQ 1M-Preview以95%的准确率追平了Claude Opus和GPT 5.5,但后者需要消耗近千倍的算力才能维持同等表现。这不仅是技术突破,更意味着推理成本的断崖式下降:处理百万级token的对话历史或代码仓库,可能从数小时缩短到几分钟。
但线性缩放并非没有代价。Subquadratic联合创始人Justin Dangel承认,在短上下文(<4K)场景下,其模型在复杂推理任务中偶尔会出现“精度抖动”,这是亚二次方架构在信息压缩时的固有缺陷。不过,团队认为这属于“甜蜜的烦恼”——毕竟,业界对长上下文的渴求远超对短文本的极致优化。
三位一体产品矩阵:从API到代码搜索的降维打击
Subquadratic没有选择单点突破,而是同步推出了三款进入私人测试阶段的产品:全上下文API(Full-Context API)、SubQ Code和SubQ Search。这暴露了其野心——它要成为下一代AI基础设施的“操作系统”。全上下文API允许开发者直接调用1200万token的模型,无需分片或摘要;SubQ Code则针对仓库级代码库,能一次性理解整个Git仓库的依赖关系;SubQ Search更像是对传统向量数据库的宣战——它用原生长上下文替代了检索增强生成(RAG)的复杂pipeline。
这种产品矩阵的巧妙之处在于:它同时解决了三个长期困扰业界的痛点——长文档分析的碎片化、代码理解的上下文割裂、以及搜索系统的多跳推理成本。如果SubQ Search能证明在百万级文档集合中,其线性注意力模型比RAG+向量数据库的组合更高效,那么整个搜索和推荐系统的基础架构都可能被重构。
2900万美元的赌注:创始人光环与隐忧
这轮2900万美元的种子轮融资由多家顶级风投联合注资,但具体估值未披露。创始人Justin Dangel是一位连续五次创业的老兵,此前曾将一家AI公司卖给微软;联合创始人Alex Whedon则是前Meta工程师,在TribeAI领导过生成式AI团队。研究团队更是星光熠熠:来自Meta、Google、牛津、剑桥、字节跳动、Adobe和微软的博士们构成了核心研发力量。
然而,豪华团队背后是隐形的技术风险:亚二次方架构虽然在长上下文上表现惊艳,但在短文本任务(如问答、摘要)中,其性能是否真能媲美同等规模的Transformer?此外,当前生态中几乎所有工具链(如Hugging Face、PyTorch)都围绕Transformer设计,Subquadratic需要重建一套完整的训练和推理栈——这不仅是技术挑战,更是生态壁垒。
竞争壁垒:不是技术,而是“时间差”
Subquadratic最深的护城河可能并非技术本身,而是“先发优势”与“场景锁定”。当OpenAI、Google和Anthropic还在优化传统Transformer时,Subquadratic已经用线性架构跑通了百万级token的商业场景。一旦开发者开始依赖其全上下文API进行代码分析或法律文档处理,迁移成本将变得极高——因为竞争对手即使推出类似产品,也需要重新训练用户习惯。
但危险在于:Transformer阵营的反击可能比预期更快。Google的Gemini 1.5 Pro已经支持100万token,虽然仍基于二次方注意力,但通过稀疏化技术大幅降低了计算成本。而Meta的LLM团队也在探索线性注意力变体。Subquadratic必须在这波技术平权到来之前,用客户粘性和场景深度筑起真正的壁垒。
辩证总结:Subquadratic的融资与技术发布,标志着大模型竞赛从“参数军备竞赛”转向了“架构效率竞赛”。线性注意力不是万能药,但它撕开了一个关键缺口——当上下文窗口突破百万级时,传统Transformer的算力成本将变得不可持续。然而,Subquadratic的长期命运不取决于技术是否更优,而取决于它能否在Transformer生态的围剿中,快速找到那个“非它不可”的黄金场景。毕竟,在AI领域,最好的技术往往不是赢家,最会“卡位”的才是。