电磁学暗中主宰世界

电磁学在暗中掌控着我们的世界。“暗中”,因为地球上只有少数人能直觉地理解它的运行方式。
你手机的 GPS 由向地面广播带时间戳的电磁(EM)波的卫星供能。你公寓里的无线网络是由在墙壁间反射的电磁波构成的。空中交通管制使用雷达,也就是发出脉冲并监听从飞机反射回来的电磁波。当《壯志凌云》中的 Maverick 锁定一个目标时,他使用相控阵雷达通过电子手段引导电磁束。非接触式支付?电磁。微波炉?电磁。横跨海底并穿过 Somos 网络的光纤?那是光……同时也是电磁。
每一条无线信号、每一张医学影像、每一次雷达扫描、每一块在数据中心内相互通信的芯片——所有这些都是电磁波,通过为操控这些波而设计的物理结构被塑形和定向。随着电力与智能竞相定义我们的时代,电磁现象的存在感只会愈发显著。在我们的数据中心,芯片通过短程电磁波相互通信。如果 Elon 成功将数据中心迁至太空 ,人工智能就会通过卫星以电磁波的形式向你的设备下发。
正如 Packy 和 Sam 在 The Electric Slide 中写道,一切在经济上可行地改成电动的都会这样做。汽车、卡车、公共汽车、无人机、船只、炉灶、热泵、电池、自行车,甚至飞机,任何运动、供暖、照明、计算或能量转换的东西都在从机械化转向电气化。所有这些新变成电动的设备都会充满电磁组件。
1970年,电子设备平均占一辆新车成本的5%。到2020年,这一数字达到了40%。预计到2030年,消费者汽车中电子设备的成本将占到车辆总成本的50%。
电子设备占 F‑35“闪电 II”成本的 35%,超过发动机本身的成本;而普惠 F135 发动机(价值 2000 万美元)中电子设备占 15%。到 2030 年代,预计国防承包商将制造 F‑47 时,他们将在 3 亿美元机体上用于电子设备的支出将超过 40%。
这很好。我们希望看到这种电气化持续推进。电动设备在环境影响更小的同时性能更佳,能提供内燃机无法实现的能力,更适合实现自动化,而且其成本/性能曲线正在扩展优势。
但在《The Electric Slide》中讨论的众多挑战中,尤其是与生产相关的那些 , , — Wait. Oops. Need to produce correct translation. Let’s restart. Sorry.
有个原因解释了为什么射频(RF)工程——设计塑造和引导电磁波的硬件的实践——常被称为黑魔法 。世界上可能只有大约十个人能够深刻直观地理解电磁学,能在脑海中看到哪些形状会产生哪些电磁场 1。我不是那样的人,但我见过他们。我在我的公司 Arena Physica 雇佣他们,并且我曾与许多人在同一所学校就读。
我们物理课程里有个家伙,教授问道:“你们知道这个人有什么特别的吗?”我们都说不知道。“这个人的思维像电子。”
他的意思是,如果电子有感知,它们会感到各种不同场在拉扯着它们。电子很可能会对这种感觉有直觉,就像我们对重力有直觉一样——我们本能地知道放开一个球,球会落到地上。那些我们祖先中无法直觉到重力的朋友,活不到足够长的年龄去繁衍后代。
有些人——极少数——花了大量时间研究、测试、设计和模拟电磁系统,以至于能像对重力那样直觉地感知它们。但对我们大多数人来说,电磁现象大多是看不见的。
在人类绝大多数历史时期,为了生存我们并不需要看到可见光谱以外的波段。因此我们也没有。那些把宝贵资源浪费在观察电磁波全谱上的远祖同侪,也不会活着将这些特质传承下来。
人类只能看到电磁波谱的一小部分,即波长在 400 纳米(紫色)到 700 纳米(红色)之间的“可见光”部分。我们看不到更短波长的电磁波(紫外线、X 射线或伽马射线),也看不到更长波长的电磁波(红外线、微波或无线电波)。
这一直都管用。直到电磁学开始主宰世界。
我们依赖着一种基本力,但很少有人能天然驾驭它。这减缓了技术进步,限制了我们的制造能力。
幸运的是,AI 没有我们的盲点。它尤其擅长发现模式、建立联系并理解那些对人类来说不一定直观的依赖关系。
因此,我们相信计算机将比我们更能掌握电磁学。我们应该能够构建一个 Large Field Model (LFM)——类似于跨越语言泛化的 LLM,只不过我们的模型是在电磁领域泛化。我们应能利用这个 LFM 理解电磁波并塑造它们以实现我们的目标。
这就是我们在 Arena Physica 所下的重大赌注。要理解我们为何这么做,我首先要确保你理解电磁学。
电磁学简要入门
Packy 和 Sam 在 《电磁学简史》 中做了介绍 《电动舞步》。
我将在此基础上补充一份关于电磁学的简要入门 。我会穿插相关历史,但我的目标是确保我们对电磁学有一个可实际运用的理解。
我们的宇宙中有四种基本力支配着一切事物的运作:
-
强相互作用
-
弱核力
-
引力
-
电磁学
强力强相互作用和弱相互作用在亚原子尺度起作用。强相互作用将质子和中子束缚在原子核中。弱相互作用使放射性衰变和核融合成为可能。
引力在四种力中要弱得多(大约比电磁力弱 1036 倍)。然而,在宇宙尺度上它占主导地位。它只有吸引力,从不排斥,这意味着它的作用会不断累加。它作用于每一个具有质量或能量的粒子。引力在基本层面上也充满谜团:引力理论与量子理论都是极其强大的解释我们世界运行方式的理论,但它们在根本上不相容。这仍然是物理学中最深刻的未解难题之一。但我们对引力有一种强烈且直观的感受。在日常生活中,我们可以感觉到这种力。
电磁学是我们在日常生活中最直接接触到的力,也是我们工业化最积极的领域。它支配着光、电、磁和化学,基本上决定了核尺度以上物质的所有行为。它解释了物质为何具有结构、化学为何起作用以及技术为何可行。它负责原子的结构(电子束缚于原子核)、分子间的键合、固体的刚性,以及所有电子和通信技术。与引力不同,电磁力存在正负两种电荷,这意味着它既能吸引也能排斥,而且大量积聚时往往会自我中和。我们对电磁学的数学理解非常精确:它由量子电动力学(QED)描述,是所有科学中经受最严格检验的理论。
然而……尽管如此精确,电磁系统仍然极具反直觉性。例如,射频工程就有“黑魔法”的名声。在某些频率下,场的波动性与分布性会产生违背从简单电路理论构建的直觉的效应。
但让我们尽力建立起直觉理解。
每一种力都携带能量。 电磁能以我们称之为光子(光的粒子)的量子形式存在,但对于我们大多数构建的东西——天线、雷达、通信系统、相控阵——用波来思考更容易,从频率、波长和相位的角度来理解 。 光子的能量随其频率不同而不同,这可以在电磁频谱上看到。超高能量的光子类似于用极紫外(EUV)制作芯片的 ASML 设备。EUV 频率非常非常高,因此能量很高,波长也非常短。当你穿过可见光谱到另一侧时,会到达红外,电磁能量变成热。然后是射频(RF)。在射频下,光子的能量非常低。但这一切实际上都是遵循相同原理的电磁波。高能量 = 高频率 = 短波长,反之亦然。( 在此探索电磁频谱 .)
现在,想象一个棱镜。棱镜是一种物体或材料,会以不同方式对待入射的电磁波——或者不同的光子。因此,如果你是红光子,你的折射率,或者说你被折射的程度,是某个特定数值;如果你是蓝光子,则不同。对整个光束折射后,棱镜另一侧就会出现那道美丽的彩虹。

棱镜是人类操纵电磁场的早期范例。 人们注意到,当光穿过某种形状的玻璃或晶体时,会形成一道彩虹。自那以后我们想出了许多操纵电磁场的方法,其中最重要的也是最简单的。
如果一个穴居人发现他能操纵电子,他做的第一件事很可能是最简单的:电子通,电子断。通,断。一,零。
棱镜实际上比通断开关复杂得多。它更微妙,更富表现力,且其意义更为深远。但计算的基础正是穴居人翻开开关的想法。
早期计算机确实建立在这个简单的理念上:它们使用称为继电器的机械开关来计算。当金属接触时,电流通过(1/通)。当金属分离时,电流停止(0/断)。
机械开关的一个问题是,当你在空气中频繁切换时,空气会电离并产生微小的闪电,能跨越间隙形成电弧。这些电弧会使你的“位”不可靠。有时本应切换却没有切换。
另一个问题是它们非常慢。正是电子开关的出现让我们走上了能够构建在 GHz 速度(109 次每秒)下工作的处理器的道路。
于是我们发明了真空管 2。它们抽去了空气。没有大气,就不会有电弧。但真空管易碎、耗电且无法扩展。真正的突破是半导体,像硅这样的材料,其导电性可以被控制。它们可以在施加电压时导通或不导通(因此称为半导体)。半导体促成了从机械到数字的转变,并带来了晶体管,晶体管是使用电压开关通断的微小硅器件。这带来了摩尔定律,带来了布尔逻辑,进而造就了现代计算的一切。正是这一单一创新——晶体管——在过去七十年里推动了我们大部分的技术进步。
但如果你读过戈登·摩尔 1965 年的论文 ,也就是他描述后被称为摩尔定律的那篇论文,你会发现只有前半部分谈的是数字硅;后半部分谈的是模拟硅。

没有人注意模拟部分,但我认为它今天比数字部分更令人着迷。
数字硅基技术关乎开关:晶体管开或关、导通或不导通、1或0。所有门电路、所有逻辑、所有计算都建立在这种二进制基础之上。它很强大,但正如我们所讨论的,那也是用电子能做的最简单的事情。这就是穴居人的数学。
模拟硅基技术关乎塑形 。不只是开/关,而是要问:如果我能弯曲电磁波会怎样?如果我能引导它、定向它、在特定频率吸收它而在其他频率反射它,又会怎样?在实践中,这就是射频前端、天线、封装和印刷电路板(PCB)共同表现为一个统一的电磁体。
这也是世界的运作方式。世界是模拟的。世界不是由0和1驱动的,而是在它们之间的连续谱中运作。即便所有计算都是以数字方式完成,一旦需要与真实世界交互(例如在麦克风中捕捉声音、在扬声器中产生声音、通过空气发送无线信号、在光纤中传输光),你就必须处理模拟信号并塑造波。
还记得三棱镜吗?模拟硅的作用就像那个,但适用于所有电磁频率,而不仅仅是可见光。与用玻璃折射光不同,你可以用印在硅片上的精心成型的导体来弯曲、引导并塑造电磁波。
到这里,我们离开了确定性计算的领域,进入了黑魔法的世界。
在家试一试
下面是一个实验。你可以在家里试一试。
拿起你的铜线,接到电池上,让电流直接通过它。它产生的磁场会以螺旋形绕着导线包绕。你可以用指南针靠近它来确认这一点,观察针偏转成与导线垂直的方向。
现在,把同一根电线绕成弹簧形(螺线管),在铅笔或螺丝上绕10到15圈。通电后,磁场完全不同:它不再缠绕在导线上,而是直接穿过线圈的中心。相同的导线、相同的电流,但形状不同 = 磁场截然不同。
这就是电磁学的根本游戏: 几何决定行为 。每个天线、雷达或相控阵单元不过是这一原理的更复杂形式。找到合适的形状,就能让电磁场几乎做任何事。
要理解形状为何如此重要,先考虑电磁波碰到导体时会发生什么。
导体的特殊之处在于它有自由电子。自由电子不像绝缘体中那样被锁在晶格里,而是在物理学家所谓的“电子海”中自由运动。当光子(电磁波)撞击这个电子海时,这些电子就会开始做出响应。它们随波动振荡。
这基本上就是天线的工作原理。你爷辈屋顶上那根弯曲的电视天线之所以被设计成特定形状,就是为了接收从远处电视台广播的超高频(UHF)信号。穿过大气的电磁波会撞击天线,激发金属中的电子,这些振荡的电子沿着导线传入电视,成为信号。
那个信号承载着信息,比如被编码成电磁振荡模式的《我爱露西》图像,通过空气广播,被你的天线吸收,电视机解码。如果你后退一步想想,整条链条其实荒谬至极。我们用看不见的波通过空气传输动态图像。而将这些波再变回图像,竟然全取决于一根金属线的形状。
雷达的工作原理基本相同,只是功率更大并且方向相反。
第二次世界大战加速了雷达的发展,也让我们意识到它的迫切需求。盟军遭受重创,需要追踪来袭威胁。他们转向雷达——这种技术因战争而迅速发展。19世纪末和20世纪初,海因里希·赫兹(以赫兹命名)证明了无线电波可以从物体上反射。几位物理学家还注意到,当船只或其他物体靠近时,无线电信号的行为会异常。20世纪20年代和30年代初,美国、英国、德国、法国、苏联、意大利和日本的科学家都在试验利用无线电回波探测物体。
1935 年,一位名叫 Robert Watson-Watt 的英国人(与蒸汽机发明者瓦特无关)提出并演示了一种利用脉冲无线电波的实用飞机探测系统。这催生了沿英格兰海岸的 Chain Home 预警网络。Chain Home 在二战爆发时已投入使用,在不列颠之战中为英国皇家空军提供了大量早期预警,因此常被认为是阻止德国入侵的关键因素之一。美国在稍晚些时候开始发展此项技术,得益于英国的技术转让,并在能力和制造规模上进行了扩展。在美国,Alfred Loomis 领导了位于 Tuxedo Park 的研究工作 3,并促成了麻省理工学院雷达实验室的建立,该实验室开发了火控雷达、机载雷达和导航雷达。德国也建造了并行系统,在不同方向上推动了技术的前沿发展。
雷达不是接收广播信号,而是发射多波长的波束,等待其从物体(例如轰炸机)上反射回来,然后监听回波。如果目标足够大且足够近,就能被探测到。
但要扫描天空,就需要把波束指向不同方向。在20世纪40年代,那就意味着要实际转动一个大型抛物面天线。你需要机械马达来完成这项工作。一个机械万向节在旋转着巨大的天线。

这方法可行,但存在明显局限。一个是机械部件会损坏;另一个是天线盘的旋转速度有上限。如今,Starlink 卫星需要每秒多次更新指向,因为它们以每秒 7.6 公里的速度运动。试着用机械方式做到这一点,而且还要同时驱动 5000 束波束。
这就是摩尔1965年论文后半部分相关之处。摩尔意识到可以用晶体管来解决旋转天线盘的问题:以电子扫描取代机械运动。
关键见解是相长和相消干涉 ,这与你在池塘水纹相遇时看到的现象相同,要么相互加强要么相互抵消。
想象一下,你不是用一个大天线盘,而是用一格格小天线单元组成的网格,就像棋盘一样,每个格子都是一个微小的天线。每个单元都可以发射信号。每个单元都是完整的射频前端和跨芯片/封装/PCB 的天线结构,作为一个整体的电磁体。现在,如果你先从最左边的单元开始发射信号,然后稍微延迟一点再启动下一个单元,再稍微延迟一点启动下一个,如此继续,每个单元的波前就会相互干涉。把时序调对,它们会在某个特定方向上相长干涉,产生一个指向你想要方向的单一聚焦波束。
改变时间模式,光束就会指向别处。你可以用控制每个单元何时发射的模拟和数码逻辑来替代机械运动部件。
这就是所谓的 相控阵 。这也是现代雷达的工作原理。如果你想通过操作它来培养更好的直觉,我们在这里做了一个 小型模拟器 。
F-35 上的雷达被称为 AESA(有源电子扫描阵列)。它内部没有任何机械移动。它只是由半导体模块组成的网格,通过时序控制“波束”在天空中扫过。同样的原理也被用于 Starlink。每个 Starlink 终端都有 1280 块用于形成波束的硅片。这就是为什么你只需花 300 美元就能买到一块平板,完成过去需要价值百万美元的旋转天线才能实现的功能。

那些瓷片上发生了什么?
记住:数字硅片关乎晶体管的通断。但相控阵中的这些瓷片通过它们的物理几何形状来塑造电磁场。
回想电视天线,那是一根特意弯曲以接收特定频率的导线。想象你可以将那种形状逐层打印到硅芯片上,按特定几何形状铺设铜迹,创造出以精确方式与电磁波相互作用的结构。
在一层上,你可能有一个螺旋。在下一层,是一个网格。再下一层,则像一个二维码。将它们叠加起来,并用称为通孔的小连接将层与层连接,你就创造了一个三维结构,能够在特定频率和特定方向发射、接收、吸收和反射电磁波,而这些都在你的完全控制之下。

这就是相控阵单元的真实面貌:由铜和硅构成的三维雕塑,设计使得电子在其中流动时恰好产生你所需要的电磁场。
为什么这如此难以构建
创造一个符合你期望的电磁场全在于几何学,也就是说全在于形状。但你如何知道该制造哪些形状?
使用数字硅时,规则相对简单。晶体管要么导通要么关断。你可以以完全准确地模拟数十亿个晶体管。设计问题在于布线和时序,但物理特性表现良好。
模拟硅则不同。物理是波动物理, 波会做出违背我们直觉的事情 。
在光学(高)频段,我们常常可以靠“光线光学”的直觉;光大多沿着近似直线传播,发生反射和折射,你可以把它的分量视为相当局部的。
在射频时,波长足够大,以致于整个器件都成为电路的一部分。场会耦合到外壳、印刷电路板、螺丝、附近的瓷砖……一切都相互影响。这就是射频看起来像魔法的原因,也是你必须对整个对象进行仿真以预测其性能的原因。
例如,在设计 Starlink 瓦片时,你不能只把瓦片单独建模。它发出的电磁波会与整个 Starlink 单元发生相互作用:金属外壳、其它瓦片、安装支架、支撑结构。你必须同时对整个系统进行仿真。
这就是为什么没有用于模拟电路设计的自动化工具。数字电路可以从代码“综合”出来;数字设计师可以编写描述其数字电路工作原理的“RTL”代码。然后有工具可以读取这些代码,并将其“编译”成芯片。但模拟设计不存在这样的工具。模拟电路没有“标准单元”,没有标准的模拟设计,没有标准的构建模块。一切都相互影响。
这就是为什么没有 ARM 式的模拟硅方案 4。没有公司能以高度盈利的方式向众多客户销售“IP”、标准化的电路设计——没有这样的标准电路存在。每个新系统都不同,因此每个新客户的需求也各不相同。
ARM 能设计出能在任何手机中运行的芯片,因为数字芯片是自成体系的。但为 Starlink 终端设计的模拟相控阵单元在另一颗卫星上就行不通。干涉图样会完全不同!
而这些模拟工具运行缓慢 。控制电磁场的方程被称为麦克斯韦方程组 ,这是四个著名地难以求解的偏微分方程。
它们只是方程。有何问题?
如果电磁波频率更高,它就更“粒子化”——直观地说,就像一个球——你知道它在哪里,并且它会干净利落地弹开。如果球在一个角落,它不会影响另一个角落。随着电磁波长变长(进入射频),它们变得更像波,粒子有点“扩散”开来。波开始大量相互干涉,就像池塘上的涟漪。它们可以相互增强或相互抵消。
所以,如果你是 NVIDIA,出售装在盒子里的高频芯片,你可以只出售一种产品。你可以设计一个 GPU 并卖给所有人。海军把你的芯片装在舰艇上,或者索尼把它放进 PlayStation,本质上没有区别。他们都可以直接购买芯片并插上去。但例如,如果你在为相控阵系统采购组件,你就必须对整个系统建模,因为这是第二类问题,而不是第一类。为海军舰艇设计的方案在 Starlink 终端上行不通。电磁场会与周围的一切相互作用——金属外壳、安装结构、附近的组件。改变环境,就需要全新的设计。一切都变成了由这些稀有专家和仿真能力限定速率的定制化服务问题。
总之,即便使用超级计算机或像 Ansys 这样的程序,求解器也很慢,因为这些方程难以求解且需要专业知识来操作。方程之所以非常难解,是因为边界条件(边缘处,平滑微积分不再适用),例如,金属的尖锐边缘会通过产生强烈的电磁反射引发问题,使场以意想不到的方式集中。
对一个拟议设计进行完整模拟可能需要数小时甚至数天。以下是一个示例设计循环:对形状做出最好的猜测,等待数小时进行模拟,发现它并不完全可行,调整形状,再次等待数小时。随着我们与领域专家合作,目睹使用传统工具的每次模拟迭代耗时一周。这没有足够的“进球机会”来开发电磁超智能。
射频设计不能靠蛮力计算完成。搜索空间是无限的,每次评估又耗时太长。
拿一个简单的两层电路举例,每个像素在 64×64 的网格中可以是金属或介质。这已经大约是 264×64,或 101,233,种可能的单一小组件配置。显然,人类射频设计的全部历史只探索了这个空间中极其微小的一部分。在这里, 看看你能想出多少种这样的配置 。
在这个搜索空间中航行需要直觉 。你需要一个能看着期望的场分布就……感知出可能产生它的形状的人。
能够做到这一点的人花了几十年时间培养对电子如何在结构中运动、场如何在拐角处弯曲、波如何相互干涉的直觉。他们可以在白板上勾勒出一个螺旋,并大致告诉你它会在哪些频率上强烈发射、在哪些频率上吸收。然而,除了我那位能像电子一样“看见”的同学之外,这种直觉对这些少数特殊的人来说也并非天生。他们是在漫长的职业生涯中艰难获得的。因为与重力不同,进化从未对理解可见光谱以外的电磁场施加过压力。我们感觉不到它们。它们对我们是看不见的。
我看着我的小女儿学习这个世界。她对力学已经有直觉了。她知道如果把玻璃杯从桌子上推下去,它会摔碎。她对电磁学没有直觉,这很可能是遗传的。99.99% 的人也是如此。
我们能够在如此程度上将电磁波为我所用,实属奇迹。但世界正变得越来越电磁化,我们将需要更多形状。
这就意味着我们需要构建一些真正对电磁学有直觉的东西。
电磁学的 AlphaGo
2016 年,DeepMind 的 AlphaGo 击败了历史上最伟大的围棋手之一李世石。
让所有人记住的瞬间是第二局的第37手。
专家评论大致是这样的:“那是个错误。”接着:“那很愚蠢。”然后:“那是个非常奇怪的举动。”最后:“那真漂亮。那真优雅。”
AlphaGo 做了一件没有人类会尝试的事——一个非常非常规的着法,世界上最好的棋手起初把它当作失误。但它奏效了。机器发现了一种人类即便经过数千年下围棋也从未找到的策略。
是什么让 AlphaGo 成为可能?有两点。第一,围棋有明确的规则和完美的模拟器。你总能确切知道棋盘的状态以及哪些着法是合法的。第二,正因为这些限制,电脑能非常快地自我对弈数百万盘。AlphaGo 通过下比人类历史总和还要多的围棋盘数来学习。
我们想把 AlphaGo 对围棋所做的事运用到物理学上——如果我们能构建一个系统,让它进行数百万局电磁学设计的“对弈”,并培养出人类根本无法获得的直觉,会怎样?
在我们和那个梦想之间有一个明显的障碍。AlphaGo 能行是因为围棋可以被完美模拟。你知道下子后会发生什么。但物理更复杂,模拟器很慢。麦克斯韦方程组需要数小时才能求解。你不可能在一夜之间“进行百万局对弈”。
所以我们首先需要构建模拟器。
我们构建并持续扩展的电磁基础模型,是电磁物理的模拟器。
我们所构建的起点被称为神经网络替代模型 。想法很简单:与其每次都从头求解麦克斯韦方程(这很慢),不如训练一个神经网络去近似解(这很快)。这就像手工计算角度的正弦和查表的区别,只不过这个“表”是一个可以对从未见过的角度进行插值的神经网络。
传统的物理模拟器靠蛮力工作。它们把空间划分为很小的单元,在每个点上应用方程,然后迭代直到解收敛。这样很准确,但一次模拟可能需要数小时。
但我们构建的东西超越了替代模型。物理学中的大多数替代模型都很狭窄:仅针对一类特定问题去逼近某一特定模拟器。Arena Physica 的模型直接学习形状与场之间的关系,从而具有泛化能力。它不是更快的计算器(甚至根本不是计算器)。这个神经替代模型在学习物理的“语法”。正如 GPT 学会了语言的“逻辑”,我们的模型正在学习场的“逻辑”。向它展示足够多的“这种形状产生这种场分布”的例子后,它几乎可以瞬间为新形状预测新的场分布。我们谈论的是 1.8 万倍的加速,从数小时到毫秒级。
如果你仔细读,可能会想:当然,如果只是想要一个近似答案而不是完美解,你可以更快。
说得好。这就是魔力所在。
当你在寻找优秀设计时,速度和方向比精确度更重要。
想想有经验的射频工程师是如何工作的。他们用直觉筛掉那些可能行不通的想法,并把可能可行的想法的大致轮廓找出来。然后他们对这些进行仿真。他们做出快速、近似的判断,以决定把那些缓慢而精确的仿真时间投入到哪里。
Arena Physica 的模型也进行同样的筛选,只是速度快得多。它不需要告诉你某种形状究竟能达到怎样的性能,只需说明每种形状相对于其他形状的表现如何。对于搜索来说,“够用”远比发表论文所需的标准要低得多。
速度让我们可以把问题颠过来。我们不再问“这种形状会产生什么场?”,而是问“什么形状会产生这种场?”。这就是生成式设计 。我们指定想要的目标,比如一个在 28 GHz 有强发射但在邻近频率能抑制干扰的天线。系统利用我们期望的状态来生成可能实现目标的形状。
然后, 我们将两个模型配对成闭环:一个生成设计,另一个评估它们 5。
生成器提出一批形状,其中很多都很狂野、奇怪,是人类想不到的东西。移动37个形状。评估器在几秒钟内对它们全部进行特征化,给出方向性判断:这个很糟,那个有前景,这个很有意思。最好的候选通过小幅变异和扰动进行细化。评估器再评估这些细化结果。重复。
在每一步,我们都会问:“这个比我们之前的形状更有助于实现我的目标吗?”因为我们知道规则是什么,像 AlphaGo 一样,也知道我们的目标是什么,像 AlphaGo 一样,我们可以为模型更接近目标而给予奖励。并且像 AlphaGo 那样,通过使模拟变得廉价,我们可以比如果每次尝试都需要精确的数小时模拟时探索更多的设计空间。
在 验证的不对称性与验证者的法则 中,OpenAI 的 Jason Wei 描述了“验证者的法则”。本质上,它指出任何易于且快速验证的任务都将被 AI 自动化。我们这个世界的困难之处在于验证依赖于那些缓慢且昂贵的专业人类和模拟器。通过首先以领域基础模型作为快速模拟器来攻克这一点,我们首次使生成式 AI 能够触及这个问题。我们的生成器通过反馈循环学习权重。
这就是让 AlphaGo 成功的同一循环: 生成、评估、学习、重复 。
在此亲自运行该循环 。 你会切身体会到速度的重要性。
当然,这个循环只有在有足够的训练数据可供输入时才有效,与可以从互联网抓取训练数据的 LLMs 不同,电磁场仿真在自然界中并不存在。几乎每一个数据点都必须被创建。因此我们正在建立自己的数据工厂 。
为此,我们正在聘请能找到的最优秀的射频首席设计师。把他们集中在一个地方,从理论上讲,可以把这群稀缺人才的能力摊销到各种现有和新可能的客户身上。让他们创建设计、提供反馈、测试他们的设计、并在循环中反复运行。
我们以合成方式生成随机设计,专家创建种子设计,系统据此进行程序化放大,然后制造出最优候选样品,并将真实世界的测量结果回输用于训练。

数据工厂有三层:高产量合成数据、高信息量的专家引导数据以及真实的制造数据。
由于当前数据工厂高度依赖人工,我们需要有策略地选择用例。我们从模拟硅(芯片封装、相控阵组件、射频前端)和上述完整的相控阵系统开始。我们将在与合作伙伴的对话中拓展到新领域,例如超导量子计算。
工厂就是护城河。没有它,你无法为电磁学构建基础模型;据我们所知,还没有其他人在做这件事;即便想尝试,也得从我们在 Arena Physica 汇聚的那一小批专家中招聘。
然后,当我们在某个有希望的方向上达成一致后,通过将数据工厂的输出输入到我们的循环中,我们会用缓慢但精确的传统求解器对最优候选进行验证。或者更好的是, 制造该设计并在现实世界中验证它。
还记得为什么模拟领域没有 ARM 吗?在射频频率下,波长足够长,电磁波会与周围的一切发生相互作用。为 Starlink 终端设计相控阵时,不能只对芯片建模;必须对芯片、电路板、金属外壳、安装结构以及所有其它部分建模。这些都会影响电磁波的行为。
正因为如此,我们甚至在用自有组件从零开始构建一个用于成像与探测的完整相控阵系统。

我们将在年底前完成硅片版图的流片。而对于问题中任何非模拟部分,我们实际上在使用我们的代理栈——我们的硬件感知代理,运行在我们的元图上——这是对硬件的动态图表示——通过 MCP 与工具对接——以加速流程的每一个环节,从而实现端到端更快的进程。通过这种方式,我们受益于基础模型带来的所有惊人飞跃,同时也拥有它们无法复制的东西:由我们的数据工厂供给的电磁(EM)基础模型。
系统合成:快速近似评估实现广泛搜索,广泛搜索发现有前景的候选,试制验证并产生训练数据,训练数据改进生成器,改进的生成器又能实现更广泛的搜索。
如果你能在我们的循环中完成所有射频设计工作,你就可以构建一个模拟知识产权工厂。
射频的知识产权工厂与原子的编译器
我们的电磁基础模型相较于现有代理模型的主要优势在于它可以泛化 。
与我一起做一次哲学上的飞跃。
LLMs 不会机械地学习去对句子进行分类。它们是基于词语和句子之间相互关系的结构进行训练的。它们其余的行为是自发出现的。
在 LLMs 出现之前,垃圾邮件检测是一个独立的重要问题。摘要生成是一个独立的问题。翻译是另一个单独的问题。实际上曾经有一些优秀的公司和优秀的机器学习团队各自负责这些工作。他们犯的共同错误是只关注狭窄的问题。我们学到的是,如果你能在根本层面理解语言,并且看到规模定律, 你可以免费获得所有下游应用 。
所以如果几何与电磁场之间确实存在一种基本关系,就像语言中那样,并且如果尺度定律成立,那这个模型应当能够推广适用。
电磁仿真看起来很像语言在 LLMs 出现之前的状态。安赛斯(Ansys)等仿真器在特定领域会失效——例如某个工具用于天线仿真,另一个工具用于汽车发动机的电磁干扰(EMI)仿真——我们可以用一个模型来应对所有这些,就像 LLM 可以同时处理翻译、情感分析、垃圾邮件检测及更多任务一样。
我们认为 LLMs 是首批基础模型,而不是最后一批。语言是智能的一个原始要素——人类用它来交流和思考。但宇宙还有其他原始要素。牛顿创立微积分,因为宇宙的语言不是英语。LLMs 将让我们与新的基础模型接口,这些模型能推动人类对宇宙的理解更进一步,赋予我们对生物进化未曾适应事物的直觉。这类模型是一个对 AI 带来正和未来的关键组成部分。
这是 Arena Physica 所下注的大赌注。这是我们的论点。我们已经在建立一个强有力的业务,帮助公司更好地理解并迭代他们的电磁系统,但我们认为泛化也将使我们能够构建射频知识产权工厂 。
通过我们的循环,我们可以自动化 IP 的创建和设计。这是我们模型与 ARM 之间的关键区别。如果泛化奏效,那么我们就能不再像 ARM 那样将一个设计卖给众多顾客,而是几乎即时为每位顾客和每种使用场景生成独特的设计,所需的工作量与 ARM 创建通用 IP 大致相当。
我们认为,并且已看到早期体征,我们的模型能够将这一自动化扩展到整个电磁频谱,在这种情况下我们的可寻址市场是任何具有波的事物。
我们常被问到的一个问题是:LLMs 难道不能做到这一点吗? 我们一直在用前沿 LLMs(包括常规和扩展思维型)对其进行内部测试——它们与我们的基础模型之间存在显著的性能差距。我们的模型在加权平均绝对误差(Magnitude weighted-MAE)上远低于 1 dB(作为参考,射频工程师通常关注的范围大约在 20–30 dB 之间,所以小于 1 dB 是一个非常强的结果)6.

我们构建的东西不同于 LLMs,并且在其设计目标上更胜一筹。一个有助于理解其意义的比喻是“ 原子编译器 ”。
在软件领域,编译器将高级编程语言翻译成 CPU 可执行的二进制指令集。我们经历了从汇编到 C++ 再到 Python 的演进,现在 Claude Code 可以说是一种以英语为编程语言的编译器。LLM 将代码编译成它认为最合适的编程语言,然后再进一步编译成机器码。在这一系列过程中,每一步的抽象层次都更高,能够“编程”的人群也随之增多。
物理学还没有编译器。宇宙有一套指令集:以特定配置排列的材料和几何结构。以一种方式摆放,你得到一台电动机;以另一种方式摆放,你得到隐身披风。我们知道这一切都是可能的,因为方程告诉了我们。人类物理学家花了几个世纪来学习这套指令集。但要真正利用它,你仍然需要聘请相当于汇编语言程序员的人:一位花了几十年时间学习如何在人的意图与物理世界的指令集之间进行翻译的物理学家。
我们在 Arena Physica 打造的,从某种意义上说,是一个原子编译器 :一种用高级术语表达你想要的东西,并将其编译成产生该效果的几何结构和材料的方法,起始于麦克斯韦方程,未来我们希望最终能加入薛定谔方程。
下周我们发布电磁(EM)基础模型时,会通过一个具代理性的用户界面提供交互。你可以用简单英语输入一个请求,比如,“我需要一个用于卫星上行链路的八千兆赫带通滤波器。”LLM 将该目标散射参数——我们要优化的技术参数——进行翻译。我们的 LFM 使用物理作为推理基底生成候选几何结构,而不是依赖语言。然后,LLM 再次参与,解释模型做了什么以及为什么这样做,借助我们已内置到系统中的基础射频工程知识。
Andrej Karpathy 说 LLMs 是“人类精神”。在我们的系统中,射频工程圣经《Microwave Engineering》作者 David Pozar 的“精神”为我们的电磁基础模型生成的几何形状提供了他最好的解释。与一个恰好会说电子语的实习生合作类似,只不过这个实习生在传达数十年积累的射频智慧。
我认为这将成为未来的强大范式。每个人都在思考人与模型的交互。但像我们这样的系统中大部分工作是模型与模型之间的:LLM 与 EM 基础模型对话,EM 基础模型回应,双方以机器速度在设计空间中反复迭代。人与模型的那一层将成为少数,负责意图设定与解释。真正的工作发生在我们无法使用的语言中,由能用该语言的模型为我们翻译。
未来,语言模型可能会成为人类与一整套专门基础模型生态系统之间的通用界面:用于电磁场、用于生物学、用于材料科学。在这样的未来,LLM 将成为不同智能物种之间的外交官。
最终,我们希望达到这样的世界:任何人都可以说,“我要一件隐身斗篷”或“我要更便宜的星链”,机器就会为他们设计出来。但在今天,即便有了我们的编译器,我们仍处在 C++时代。专家级的“物理代码员”仍然需要告诉机器,“我需要一只用于卫星上行链路的 8 吉赫带通滤波器”。
与此同时,我们希望把那个“终有一天”的未来带到今天。
彻底为客户解决问题
自从我们的模型显示出可扩展和泛化的潜力以来,我一直在认真思考如何以正确的方式将其能力交付给客户。
我曾考虑过是否应该为 Analog 构建 ARM。我也考虑过直接出售对模型或 IP 工厂的访问。我认为两者都不太合适。我觉得有必要讨论我们最终的选择及其原因,因为随着人工智能的发展,合适的商业模式正在发生很大变化,而我们最终选择的模式很可能不是几年前会采取的那种。
如果你仔细想想是什么让 Arena Physica 与众不同,实际上有四点:我们拥有一支人才密集、由世界顶尖射频工程师组成的团队;一个能在专家手中生成有价值知识产权的“物理编译器”;一个随着这些射频工程师生成并验证更多知识产权而不断改进的数据工厂;以及一个软件平台(配备 FDEs),使得应用基于 LLM 的代理来推理硬件变得简单。
由此衍生出的商业模式是服务 。我们已招聘了一些世界顶尖的射频设计师和一支优秀的电气工程师团队。每一位工程师在我们的电磁基础模型、我们的代理以及 LLMs 的协作下,都能覆盖巨大的工作量。因此,我们不再把工具卖给客户然后让他们自行摸索, 而是开始直接替客户解决问题 。
你想创办一家航天公司,但对机架在轨通信的方式有未解决的问题?我们会为你解决。你需要下一代芯片的硅布局?我们会做布局。我们派出配备了工具的射频和电气工程师,交付客户所需的产品。这是以往无法实现的端到端电磁工程即服务,具备前所未有的速度和成本优势,因为这些稀有的专家现在能完成过去需要整个团队才能完成的工作,速度更快、效果更好、成本更低。
因为我们在构建电磁基础模型的旅程还处于早期,直接与客户合作让我们能够更快学习,并根据真实世界的需求改进我们的模型。
为此,我们还在寻求研究合作伙伴关系。 这也源于我们的模型。随着我们将 LFM 从一代扩展到二代及更远,我们需要决定下一步生成哪些训练数据,而这取决于我们要解决的问题。从事芯片封装的合作伙伴需要我们对与从事超导量子计算的合作伙伴不同的结构进行建模。他们可以优先访问我们的模型和团队以解决他们的特定问题,而我们则获得推动泛化所需的数据。研究合作关系为数据工厂提供源头,数据工厂喂养模型,而我们则占据更多的电磁频谱。
这里一个违反直觉的举动是我们并不打算出售该模型 。我们计划公开发布它,并出售围绕它的一切:平台、专家以及为客户问题提供的解决方案。模型使这一切成为可能,但它并不是产品。正如 Packy 在 《智能时代的力量》 中写道,“如果你的技术这么好,为什么不用它来竞争?”我们的产品是:把你的电磁问题交给我们,我们来解决。
公司不应被这样的事实所制约:按现状,你需要数亿美元才能构建我们能够构建的那类系统。我们应该能够将专业知识几乎像 AWS 一样为他们“云化”。
我还有很多想做的事情。
随着我们的模型不断改进,并且我们从 C++ 时代迈向 Python 甚至 Claude 时代的电磁(EM)基础模型,我怀疑我们的商业模式也会随之改变。我们可以把“设计器”卖给公司,让他们用它来生成自己的知识产权。这有点像一只金色的模拟硅鹅。随着这一进展,操控电磁光谱的成本下降,人类的能力随之提升。
从长远来看,我的梦想是把 Arena Physica 打造成一个现代版的贝尔实验室,用商业业务来资助一种新型的研究网络。
如果一旦我们证明了基础模型可行,就把它开放出来,会怎样?我们可以免费向学术界提供我们的模型和计算资源。作为交换,当他们用它设计新结构或发现新现象时,知识产权通过 Arena 回流到我们这里。我们抽取一部分(也许像应用商店一样是 20%),其余归他们所有。
现在,一位研究某种特殊天线几何结构的教授必须撰写科研经费申请、等待资助、雇用研究生,并在能凑到的算力上缓慢地通过仿真反复迭代。要是他们可以直接……使用这个模型怎么办?去探索那些用人工搜索需要数年才能覆盖的设计空间?当他们的发现具有商业价值时还能获得报酬?
如果我们的模型能为任何电磁应用自动生成知识产权,我们就成了那个平台。那些能推动边界的少数人将成为贡献者,并在他们的稀有知识变得可扩展时得到回报。由于具备这类专长的人群非常少,我们实际上可以着手与他们共享其成果带来的上行收益。
当然,随着我们向电磁谱更广的范围扩展,且我们的模型成为多物理场模型,我们不会雇佣全世界所有伟大的物理学家。但通过开放该平台,成为一种新型的贝尔实验室,我们可以与他们合作。
我希望 Arena 成为学者们可以休假驻留并访问我们模型的地方。我们不仅仅是卖软件,而是资助实验。我们要创造激励机制,让才华横溢的人从事基础研究,而不被令人窒息的助学金周期所束缚。我们要压缩物理研究与应用之间的周期,利用人工智能不是去做那些人类能更廉价完成的事,而是去做当今人类根本无法完成的事。如果我们成功,人类将受益。
但我有些言之过早。首先,我们需要替客户分担问题。
我们的客户能建造什么?
那么,如果我们为他们提供一流的射频与电气工程支持,客户能建造什么?
首先,通过与 Arena Physica 合作,任何想要使用相控阵列的公司都能获得定制产品,且比以往更快。
他们能够构建的东西并不限于传统意义上的雷达。
我曾听过一句让我难以忘怀的话。我一直把雷达当作一种探测系统,但那人告诉我,雷达实际上是一个成像系统。频率越短,分辨率越高。你可以对事物进行成像。所以雷达不仅仅告诉你“那里有东西”。它还告诉你那个东西长什么样。雷达可以像相机一样生成图像。
拿无人机打个比方。人人都在谈论无人机是未来战争的主角,但目前我们用雷达或传感器却无法看到它们。你可能会惊讶地发现,美国海军并没有大规模部署反无人机相控阵雷达。我也感到惊讶,所以当我们进一步调查时,听到的说法是,在现行体制下,成本太高。让雷神为他们建造一套新的舰载相控阵雷达,成本可能会高到相当于一半舰船的造价。
制造相控阵雷达不应该接近十亿美元的成本。但还记得我们之前讨论过的那个缓慢设想并模拟设计的过程吗?现在想象那种过程发生在一个动作迟缓的传统定焦公司内部——每花一美元上面还要加收利润。结果就是,我们的海军没有善于探测无人机的相控阵雷达。
我们可以更廉价地帮助海军探测无人机。也确实应该这么做。对于无人机探测,你可能面临 1000 个来袭目标。相控阵的好处在于你可以从一个天线形成多束波束,就像 Starlink 那样,而不是像老式雷达或 LiDAR 那样旋转。(顺便一提,那些装在 Waymo 车顶上的旋转 LiDAR 几乎肯定也会成为相控阵,当那一天到来,整个装置将变为固态——更便宜、更可靠且没有机械零件。)
我们也有一些人联系到我们,想为无人机设计相控阵用来捕获 。他们正在构建能够用机械臂在空中抓住无人机的系统。无人机捕获系统很智能;它们具备机载计算和传感器,可主动跟踪并拦截来袭无人机。它们必须能够“看见”,这意味着需要定制相控阵,能够以高精度跟踪快速移动的无人机,在任何可视条件下工作,并且足够小且廉价以安装在捕获机构本身上。把成本压到十亿美元显然行不通,但通过自动化设计和快速迭代,我们在近期内至少可以将这些成本降低一个数量级。
<span>一旦你意识到这是一个全天候成像系统,且无人机只是相控阵的一个应用,应用场景就会成倍增加。驱动雷达波束的相同物理原理也能驱动通信波束。</span>
如果太空相关产业按照大家预期的方式持续增长,那将是数以万计的卫星和数百万个地面终端。每一个都需要这些精确成形的硅片。每个地面站都需要相控阵。Northwood 刚刚筹集了大量资金来建设相控阵地面站。每一台房屋和卫星上的 Starlink 天线都由相控阵供能。
现在,假设有个对手试图干扰你的雷达信号。注意这些小点如何降到零:
还记得我说过你可以动态移动这个波束吗?这就是相控阵的好处之一。它允许你移动那些点。那些被称为零点 ,也是干涉图样消失的地方,就像你的降噪耳机一样。所以想象一下我正在被干扰。相控阵的一个惊人之处在于,我可以发射信号,然后周期性地移动我的零点来吸收干扰信号。想一想,实在是太神奇了。你仍在发射和接收,但你就在敌人对你尖叫的位置开辟出一小块寂静的空间。
但如果你能真正巧妙地利用物理——比如在这种情况下,我们仍然用老牌的数字晶体管来决定动作,而模拟结构则决定所产生电磁场的质量——这正是戈登·摩尔的梦想可能成真的地方:他的硅基布尔晶体管在与模拟硅对话。这真的很酷。有了数字硅,我们可以计算。 但有了模拟硅,我们可以传输能量、传输定向能量、吸收能量。模拟硅让一切变得更具物理性。
让你能通信的同一套物理规律也可以让你阻止他人通信。同样,让你能传输的物理规律也能让你吸收。隐身只是雷达的逆问题:不是把信号反射回去,而是让它们消失。
这一切都是形状的作用。
想象一下,如果我们能改变这一切的经济结构。
这正是 Arena Physica 正在努力做的事情。我们的使命是创造 “电磁超智能”。 这听起来大胆,但请记住,在电磁领域实现超智能——即相对于人类——比在语言甚至数学领域要容易得多。它恰好描述了我们正在构建的东西:一个能对几何如何塑造电磁场形成超出人类的直觉的系统,一个能够看到我们看不见事物的头脑。
作为一名软件工程师,我不知道如何做基础设施工程师。那是因为我不需要去做。Amazon 为我处理了这些。如果可以说公司不再需要射频专业知识,那么我们所讨论的一切成本都可以显著降低,可能降低十倍或更多。我们可以将射频能力赋予所有人,从小公司到为海军服务的企业。
一个明显的影响是我们可能会看到更多的卫星公司和航天公司,因为他们现在可以自己设计相控阵。雷达领域会有更多竞争。干扰设备领域也会有更多竞争。
另一个不那么明显的可能是背包式雷达。想想部队进入像乌克兰这样的战场时面临的情形。他们面临的一个大风险是无人机悄然逼近。他们应该配备背包式反无人机雷达:小型、廉价的相控阵,让每个作战人员都能看到即将到来的威胁。
背包式雷达是一个非常具体的事例,但关键在于,这类在此前既不切实际也不经济的东西,现在变得在实际上和经济上都可行了。
我们甚至可以以一种间接的方式帮助改进 AI 模型。
数据中心需要在芯片之间以极高速度传输海量数据。问题是,在那些速度下,连接芯片的导线会开始表现得像天线。它们会意外地广播并接收信号。这就意味着芯片间通信会达到带宽极限。因此,他们的目标与我们相反:他们试图制造非常差的天线。他们不希望在 GPU 与 CPU 之间传输的电子携带或接收到信号,否则数据会被损坏。这被称为信号完整性 。解决方案与形状化硅方法相同:精心设计的结构引导高频信号而不产生干扰。
这不仅仅是芯片之间的事。想得更大一些。最近一家数据中心公司问我们是否可以实现机架到机架的无线数据传输,因为布线本身正成为他们部署速度的瓶颈。也不仅限于地面。对于轨道数据中心来说,这将没有任何选择。你不可能在太空中在机架之间铺设光缆。
最有意思的是市场的反应:他们向我们提出了许多我们从未想到的应用场景。
例如,高频交易公司曾联系过我们,希望借助我们的技术更快地进行交易。我原以为光纤的传输速度已经等同于光速,但由于光在玻璃内的全反射,信号实际只以光速的60%到70%传播。通过自由空间发射的相控阵则以实际光速传播。在纽约与芝加哥之间的距离上,这种差异可能足以带来巨额利润。
如果你回顾我们刚才描述的内容,实际上发生了两种截然不同的事情。我认为我们将看到硬件领域的 K 型未来 。

K 的下半腿正在让商品化设备变得极大地更便宜、更易获得。 例如:海军获得无人机探测雷达而无需向雷神公司支付数十亿美元,卫星初创公司自行设计相控阵而不是外包给主承包商,每名作战人员配备背包式反无人机雷达,以及数据中心通过机架间无线链路更快部署——这些能力今天确实存在,但以昂贵且受制约的形式出现。我们希望消除这些瓶颈,使这些能力更便宜、更充足。
K 的上臂正在制造处于物理可能性前沿的新型精密装置。 这正是贝尔实验室所促成的——他们的研究带来了前所未有、更强大的能力。对于未来战争中廉价、可牺牲系统的前景,人们非常兴奋,这种兴奋是有道理的。但在我与军方高层的对话中,他们认为,要在印太地区赢得(或威慑)冲突,我们将需要一些世界上最精密的机械。F-117 对赢得海湾战争至关重要;它仅占联军空中力量的 2.5%,却摧毁了 40% 的所有战略目标。我们希望为国防及其他领域创造使新型精密硬件成为可能的条件。
通过让设计更强大的射频组件变得更简单、更快速且更便宜,我们认为这将有助于将市场扩展到超出当前分析师估计的范围——那些估计并未预见到不可想象的变化。 这些估计预测射频组件将在未来十年以 12%的复合年增长率,从 448 亿美元增长到 1405 亿美元。我认为这是错误的,几乎肯定被低估了。他们之所以预测相对缓慢的增长,其中一个原因是如今射频太难了。但如果你将专业知识大众化并改变成本结构,是否每个人都会在他们的机器人上增加更好的全天候感知设备?是否每个士兵都会在背包上配备雷达?
我最兴奋的是这种开放的可能性空间。我甚至不知道在人们能够操控这些东西之后还会想出什么新花样。如果我们是对的,他们的雄心将不会被速度、经济性,甚至为实现所需能力而必须采用的形状所限制。
外星设计
我们系统生成的许多形状已经与人类设计大不相同。基本上,我们正在与近似外星的人类共同打造一个最终会产生外星设计的系统。
人类射频工程师接受过某些典型结构的训练:偶极子、贴片、螺旋、喇叭。他们知道这些形状之所以有效,是因为经过数十年优化。当他们设计新东西时,通常从这些熟悉的形态出发,再做调整。
我们的系统并不在意这些。它从噪声出发,向功能演化。结果常常看起来像二维码、随机点画,或似乎完全没有逻辑可循的结构。

当我们把这些设计展示给射频工程专家时,他们的第一反应通常是怀疑。“那看起来不像天线。”“我绝不会想出那样的东西。”“你确定这能行吗?”
然后,我们把它制作出来。

今天,我们在印刷电路板层面进行制造。我给团队的目标是今年完成我们的首次硅片流片。也就是说,我们将制造真正的硅芯片。模拟硅的优势在于不需要台积电的最先进晶圆厂;因为工艺节点通常较大,像三星、格罗方德以及一些国防类晶圆厂这些较老且更便宜的工厂也能胜任。

而且它奏效了。这就是 AlphaGo 时刻。还记得第 37 手的专家评述吗?
我们看到的是同样的模式。工程师们看我们的设计会说:“这非常非常规,非常不同寻常,不在教科书上。”然后它奏效了。之后他们又说这是“有创意的”。
我们的目标不仅仅是自主地与人类表现相匹配。我们要超越人类,找到所有相当于“第37步”的电磁学方案:那些令人难以置信、无人会去尝试却比我们任何尝试都更有效的设计。
我的直觉是,这在电磁学领域会相当快地发生,原因就是我们在开头讨论的: 大多数人类并非进化出能直观判断哪种形状会产生哪种电磁波的能力。因此,我们在直觉上很糟糕。另一方面,计算机可以变得超越人类——我们可以在模拟中将它们进化到那里。
在本·里奇(Ben Rich)那本讲述他在著名洛克希德部门任职经历的个人回忆录《Skunk Works》中,有一个极好的故事,讲述了 F-117 隐形轰炸机是如何诞生的。
一位名叫丹尼斯·奥弗霍尔瑟(Denys Overholser)的三十六岁数学家和雷达专家,偶然读到了一篇由莫斯科无线电工程研究所首席科学家皮奥特·乌菲姆采夫(Pyotr Ufimtsev)撰写的晦涩技术论文的译本,题为物理衍射理论中的边缘波方法 。乌菲姆采夫“重新研究了苏格兰物理学家詹姆斯·克拉克·麦克斯韦一百年前推导出的一组公式……这些计算预测了特定几何构型将如何反射电磁辐射”,并将其推进了一步。“本,”奥弗霍尔瑟对本·里奇说,“这个人向我们展示了如何准确计算机翼表面和机翼边缘的雷达截面,并把这些计算汇总以得到准确的总量。”
凭借乌菲姆采夫的工作,Skunk Works 团队能够开发出计算雷达散射截面(物体对雷达的可见度)的电脑软件,前提是这些形状为二维。如果他们将轰炸机设计成成千上万个平面三角形,就可以把它们加总起来,得到雷达散射截面。
这正是奥弗霍尔瑟所做的,最终形成的设计“是一个四面斜切的菱形,本质上形成了四个三角形”,从上方看,“非常像一个印第安人的箭头形石器”。
他称它为“无望之钻”,并计算出它将“比斯坎克工坊此前制造的最不易被发现的形状还要少一千倍可见度”。在雷达屏上,它看起来只有一只老鹰眼球那么大。
凯利·约翰逊是斯坤克作坊的创始人和首领,他在飞机设计方面如此出色, 他的上司曾这样评价他:“那个该死的瑞典人居然能看见空气。”

他对这个设计极为不屑,看到后竟当场踢了里奇一脚,把提案揉成一团,扔到里奇脚下,大声斥道:“本·里奇,你这个蠢货。你丧失理智了吗?这玩意儿根本起不来。”
事实证明,模型是对的,连伟大的凯利·约翰逊也错了。那颗被称为“无望钻石”的模型最终成为 F-117“夜鹰”,其隐身性能比此前任何飞机都强出三个数量级以上,在 1991 年海湾战争期间执行了超过 1300 架次作战出动,没有一架在战斗中被击落。

F-117 的几何形状宛如外星物体,这赋予了美国超凡的能力。
我们正试图做类似的事情,但从硅基尺度开始。并且由 AI 进行搜索,而不是人类工程师在白板上勾画,我们计划在远比现有更广阔的问题空间和搜索空间中开展这项工作。
未来事物的形态
我们面临大量工作,要解决核心问题:构建一个大型场模型(Large Field Model),能够为电磁学实现类似 LLMs 对语言所做的变革。
仿真必须更快。生成模型必须更聪明。制造闭环必须更紧密,我们需要真正制造模拟硅器件,然后要为大量客户做到这一点。我们需要招募更多那些以电子思维工作的稀有人才,并与他们合作生成训练数据。
不过,很难只看到我们今天的模型能做什么而不去设想它们未来可能做到的事。
如果它能像我们预计的那样在整个电磁谱上扩展,事情将变得非常有趣。
有多有趣?Packy 问我,我们的模型是否有朝一日可能帮助最终提出一个大统一理论,如果那样的理论存在的话。
我不知道。但我更广泛地看待发现新物理学的方法是这样的。
自计算机出现以来,我们今天所有的工具都是关于演绎的。求解、计算、推算、预测。给出一个输入;告诉我会发生什么。但很多真正有创造性的人类推理是归纳的。你假设一个问题或想法,然后去研究它。那是极具创造性且深刻的人类活动。
这与我个人的一些经历有关。斯坦福的我的本科生研究导师 Hari Manoharan 在 2000 年做了一个登上封面的 Nature 实验 。
他在铜表面上把 80 个钴原子排成一个椭圆。你知道那些在角落低声细语而对面的人能听见的“耳语长廊”吗?那是声波的相长干涉。Hari 知道电子也表现出波动性,他怀疑电子也应该以同样的方式发生干涉。
这正是他看到的。“量子幻影”。当一个真实原子位于一侧焦点时,在另一侧焦点出现的幽灵原子。让所有人震惊的是没有时间延迟 。物理学本来预测会有极短的延迟,以解释信息以光速传播。但事实是瞬时发生的。这催生了整个量子通信研究领域。

哈里熟悉薛定谔方程。他熟悉麦克斯韦方程。人人都熟悉那些方程。但他以一种无人尝试过的方式将它们结合,假设可能出现的结果,并构建实验去检验。这就是新物理学产生的方式。
如果我们真的有能理解这些方程并给予帮助的机器,那将是多么了不起?目前,我们不得不等待几十年才会出现一位天才推动某个领域前进。如果那些天才能得到一些帮助,我们能从中获益多少?我们能把未来拉近多少?在有生之年,我们又能理解宇宙多少?
如果我们的基础模型也能开始做出那样的飞跃会怎样?现在,它还不是突破性归纳 ,也就是说它还不能自己创造实验。它更像一位应用物理学家:我们告诉它工程目标,它会给出一个设计。但随着它学习更多,发展出类似直觉的东西,模型会开始提出假设吗?它会注意到人类忽视的模式并提出实验建议吗?
也许(在这里我任由自己做白日梦),也许如果我们为每一种基本力都构建基础模型,并让它们彼此对话,我们会更接近某种更宏大的东西。基本力有四种:强力、弱力、引力、电磁力。我们现在只是试图在其中的一种上取得突破。但物理学彼此深度相互关联。Hari 的量子幻影之所以发生,是因为电磁学与量子力学以一种无人预料到的方式相交。
当能够理解多种力的基础模型串联起来,去探索它们之间的空间时,会发生什么?我对此无法停止思考。
归根结底,这就是这一切的意义所在。这也是我为什么花四年时间攻读量子电磁学的哲学博士(后来以典型的硅谷风格退学),以及我为什么创办 Arena Physica。
我想理解现实的本质,以便为人类的福祉加以操控。为此,我们需要直接从物理中学习的模型,发展出我们从未进化出但能拥有的直觉。
研究生时期我曾想过一个问题,我记得当时在想,人们怎么会提出这些问题:为什么物理学起作用?数学为什么有效?现实竟然如此……可描述,这难道不奇怪吗?为什么它不更随机一些?
也许这些模型能帮我们找出答案。
电磁学在暗中主宰着世界。一个世纪以来,我们一直在操纵它,但手脚受限——受限于能看到我们所看不到之物的人极其稀少。
我们正在创造一些东西,以理解几何与电磁波之间的相互作用,并将其演化以培养新的直觉。
宇宙由场构成。场被几何形状所塑造。事实证明,几何是计算机能比我们学得更好的东西。我们应当依赖它们,以便触及新的问题。
如果我们学会塑造这些波动,或许就能塑造未来。
非常感谢 Pratap 和整个 Arena Physica 团队分享他们的知识,也感谢 Badal 的封面艺术。
今天的内容就到这里。我们将在周五通过邮件为您带来本周简报。
感谢阅读,
Packy
在今天这些人工作的公司里,与人交谈时不断出现的数字是十。真正的世界级射频设计师人数可能只有几百人。他们似乎都互相称呼名字相识。这个圈子就是这么小。
“bug” 这个编程术语来自昆虫爬进真空管的现象。
Tuxedo Park:一位华尔街财阀与改变第二次世界大战进程的秘密科学宫殿 ,作者 Jennet Conant,是一本对想了解更多的人很有价值的书。
对于想了解技术细节的人,我们将在下周发布一篇技术博客文章。
评估指标是 MAE,但我们这里测量的值是 S 参数(散射参数),它是一个复数,因此有实部和虚部……这就是我们将相位和幅度分开的原因。





