DeepReinforce发布开源编程模型家族Ornith-1.0,基于Gemma 4和Qwen 3.5,在学习过程中自主构建强化学习框架,397B旗舰版在SWE-Bench Verified上得分82.4,权重使用MIT许可。