研究显示:苹果最新 AI 模型识别健康状况准确率高达 92%

一项由苹果支持的新研究指出,行为数据(活动、睡眠、运动等)往往能比心率或血氧等传统生物特征测量指标传递更强的健康信号。为验证这一观点,研究人员开发了一个基于可穿戴设备行为数据训练的基础模型,其表现令人惊喜。以下是具体细节。
这篇题为 《超越传感器数据:基于可穿戴设备行为数据的基础模型提升健康预测能力》 的预印本论文源自苹果心脏与运动研究(AHMS) 项目。研究团队利用超过 25 亿小时的可穿戴数据训练出新基础模型,证明其性能可媲美(甚至超越)基于底层传感器数据构建的现有模型。
该模型被命名为 WBM(Wearable Behavior Model,可穿戴行为模型)。与以往主要依赖苹果手表心率传感器(PPG 光电体积描记)或心电图(ECG)等原始传感器数据流的健康基础模型不同,WBM 直接从更高层级的行为指标学习:步数、步态稳定性、活动能力、最大摄氧量等——这些正是苹果手表能大量生成的数据类型。

但如果 Apple Watch 已配备这些传感器,新款机型的意义何在?
这个问题问得好。答案就藏在这项研究中:
“智能手表和健身追踪器等消费级可穿戴设备能提供跨越多维健康领域的丰富数据(…)。健康监测的关键在于识别静态健康状态——例如某人是否有吸烟史、曾被诊断为高血压或正在服用β受体阻滞剂。另一个核心问题是检测瞬时健康状态,比如睡眠质量或当前是否怀孕。这些预测所需数据的关键特性在于:它们通常以人类行为的时间分辨率(如天和周)为单位,而非可穿戴设备采集原始传感器数据时的微观时间尺度(如秒级)(…)。
尽管过去大多数研究都集中在低层级传感器数据(或其简单特征)的建模上,但来自可穿戴设备的高层级行为信息——如身体活动量、心血管适能指标和移动性指标——才是解决这类健康监测任务的天然数据类型。与原始传感器数据不同,这些高层级行为指标是通过经过严格验证的算法从原始传感器数据中计算得出的。专家们特意选择这些指标,是因为它们与生理相关参数及健康状态相吻合。更重要的是,这些数据能灵敏反映个人行为模式,而非单纯受生理因素驱动。这些特性使得行为数据在健康监测任务中展现出独特优势。例如,表征步态特征和总体活动水平的移动性指标,可能就是帮助检测妊娠等健康状态变化的重要行为因素。”
换言之,虽然 Apple Watch 会采集原始传感器数据,但这些数据可能存在噪声干扰、信息过载的问题,且未必总能与有意义的健康事件相关联。
WBM 采用的指标虽然基于传感器数据,但经过提炼以突显现实行为模式和健康相关趋势。这些数据更稳定、更易解读,且结构更优,便于建立长期健康趋势模型。
实际运作中,WBM 通过分析经处理的行为数据模式进行学习,而非直接依赖原始传感器信号。
技术细节揭秘
WBM 的训练数据来自 AHMS 研究中 161,855 名参与者的 Apple Watch 和 iPhone 数据。模型输入并非原始数据流,而是 27 项人类可理解的行为指标,包括活动能量、步行速度、心率变异性、呼吸频率和睡眠时长等。
数据被分解为每周区块,并通过基于 Mamba-2 架构的新模型处理,该架构在此应用场景中表现优于传统 Transformer 模型(GPT 的基础架构)。

在 57 项健康相关任务的评估中,WBM 模型在 47 项静态健康预测任务(如判断某人是否服用β受体阻滞剂)中的 18 项表现优于基于 PPG 的强基准模型,并在除一项外的所有动态任务(如检测妊娠、睡眠质量或呼吸道感染)中全面胜出。唯一例外是糖尿病检测,仅使用 PPG 数据的效果更佳。
更令人惊喜的是:结合 WBM 和 PPG 数据表征能产生整体最准确的结果。这种混合模型在妊娠检测中达到惊人的 92%准确率,并在睡眠质量、感染、损伤以及房颤检测等心血管相关任务中持续保持优势。

最终,这项研究并非试图用 WBM 取代传感器数据,而是对其进行补充。WBM 这类模型能捕捉长期行为信号,而 PPG 则能捕获短期生理变化。但两者结合使用时,能更早地有效识别出有意义的健康变化。