一家初创公司试图解决大语言模型生成内容同质化的问题。
Meta报告显示Llama 3训练期间在16,384块H100 GPU上发生419次意外中断,Filecoin表示其系统可满足此类训练吞吐量。
白领工人面临与锈带城镇相同的人工智能冲击,制造业岗位流失的历史可能在办公室岗位重演。
零跑单月交付破9万台,蔚小理双双站上4万大关;松下计划三年投资5000亿日元转向AI;97年大模型专家孙天祥加入百度
Anthropic恢复Claude Fable 5和Mythos 5模型的访问权限,此前因出口管制导致全球用户无法使用。
Anthropic正与三星洽谈定制AI芯片代工合作,以掌握大模型算力系统主动权
今日(7月2日),快手旗下领先的视频生成大模型可灵AI落地近30亿美元融资,投后估值有望达到180亿美元。此次融资,可灵AI创下全球视频大模型公司最大额融资纪录,标志着其独立商业化发展进程正式开启。 本轮融资由CPE源峰、国方创投、BlueFive、腾讯、中关村科学城基金(联合国科投资)、中信证券联合领投,以及数十家一线机构共同参与。据悉,该轮融资汇聚阿里云、百度等顶级产业资本,华策影视和芒果产业投资人(厚为资本)等头部文娱产业方积极参与。
今日(7月2日),快手旗下领先的视频生成大模型可灵AI落地近30亿美元融资,投后估值有望达到180亿美元。此次融资,可灵AI创下全球视频大模型公司最大额融资纪录,标志着其独立商业化发展进程正式开启。 本轮融资由CPE源峰、国方创投、BlueFive、腾讯、中关村科学城基金(联合国科投资)、中信证券联合领投,以及数十家一线机构共同参与。据悉,该轮融资汇聚阿里云、百度等顶级产业资本,华策影视和芒果产业投资人(厚为资本)等头部文娱产业方积极参与。(硬AI)
Anthropic据悉正与三星洽谈定制人工智能芯片:据三位直接了解该项目的人士透露,Anthropic已开始开发自有的AI芯片,并与三星电子进行了谈判,作为潜在的制造合作伙伴,效仿竞争对手OpenAI试图获得对其模型背后昂贵计算系统的更多控制权。如果Claude制造商继续推进该芯片,与其他公司相比,它在开发自有AI服务器芯片方面将是相对较新的。
据三位直接了解该项目的人士透露,Anthropic已开始开发自有的AI芯片,并与三星电子进行了谈判,作为潜在的制造合作伙伴,效仿竞争对手OpenAI试图获得对其模型背后昂贵计算系统的更多控制权。如果Claude制造商继续推进该芯片,与其他公司相比,它在开发自有AI服务器芯片方面将是相对较新的。
辽宁:深化人工智能、物联网等新一代信息技术在海洋领域的融合应用:据“辽宁发布”微信公众号7月2日消息,近日,辽宁省人民政府印发《辽宁省“十五五”海洋经济发展规划》。其中提出,加快数字化智能化转型。加强“数字海洋”建设,系统布局海洋数字基础设施,强化海洋观测监测、卫星遥感、无人机航拍等数据资源汇聚整合与标准化处理,构建空天地海一体化海洋信息采集传输网络。推进北方海洋数据应用工程中心建设,建立黄渤海海洋垂直领域大模型与海洋大数据综合应用服务平台,强化海洋数据要素安全利用。深化人工智能、数字孪生、物联网等新一代信息技术在海洋领域的融合应用,拓展“人工智能+海洋”应用场景,探索量子技术在海洋科技领域应用。
AI代理运营的咖啡馆实验显示,Gemini因误发折扣导致亏损,GPT因过度节俭导致原材料断货,均未能成功盈利。
Palantir CEO Alex Karp批评大模型Token收费模式不合理。
全球首份大语言模型安全防范能力测评报告发布:7月2日,在2026全球数字经济大会云智算安全论坛上,《全球大语言模型安全防范能力测评报告(2026)》正式发布,据介绍,该报告是全球首份大语言模型科技安全专项测评报告,以313条科技类高风险问题为测试集,报告显示,多数模型具备基础拒答能力,直接攻击总体成功率为7.6%,但在前缀注入、场景伪装、情感伪装,以及伪装与示例诱导结合的复合攻击下,部分模型的安全边界明显承压。(科创板日报)
辽宁:拓展“人工智能+海洋”应用场景 探索量子技术在海洋科技领域应用:辽宁省人民政府近日印发《辽宁省“十五五”海洋经济发展规划》。其中提出,加快数字化智能化转型。加强“数字海洋”建设,系统布局海洋数字基础设施,强化海洋观测监测、卫星遥感、无人机航拍等数据资源汇聚整合与标准化处理,构建空天地海一体化海洋信息采集传输网络。推进北方海洋数据应用工程中心建设,建立黄渤海海洋垂直领域大模型与海洋大数据综合应用服务平台,强化海洋数据要素安全利用。深化人工智能、数字孪生、物联网等新一代信息技术在海洋领域的融合应用,拓展“人工智能+海洋”应用场景,探索量子技术在海洋科技领域应用。
金山云下半年将加速GPU算力集群建设,以满足头部客户爆发式增长的算力需求。其中,小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,相关投入预算由最初的近40亿元增至百亿元以上。另外,阿里大模型团队已与金山云签署了5年期的算力租赁合同,涉及3000余台八卡GPU服务器,按签约时月租价格测算,全部交付后月流水约3亿元,年化收入超过40亿元。记者就此向金山小米和阿里求证,对方暂无回应。(界面新闻)
金山云下半年将加速GPU算力集群建设,以满足头部客户爆发式增长的算力需求。其中,小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,相关投入预算由最初的近40亿元增至百亿元以上。另外,阿里大模型团队已与金山云签署了5年期的算力租赁合同,涉及3000余台八卡GPU服务器,按签约时月租价格测算,全部交付后月流水约3亿元,年化收入超过40亿元。记者就此向金山小米和阿里求证,对方暂无回应。(界面新闻)
金山云加速GPU算力建设:小米百亿预算落地,阿里签五年数十亿长约:据悉,金山云下半年将加速GPU算力集群建设,以满足头部客户爆发式增长的算力需求。其中,小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,相关投入预算由最初的近40亿元增至百亿元以上。另外,阿里大模型团队已与金山云签署了5年期的算力租赁合同,涉及3000余台八卡GPU服务器,按签约时月租价格测算,全部交付后月流水约3亿元,年化收入超过40亿元。
金山云加速GPU算力建设:小米百亿预算落地,阿里签五年数十亿长约:据悉,金山云下半年将加速GPU算力集群建设,以满足头部客户爆发式增长的算力需求。其中,小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,相关投入预算由最初的近40亿元增至百亿元以上。另外,阿里大模型团队已与金山云签署了5年期的算力租赁合同,涉及3000余台八卡GPU服务器,按签约时月租价格测算,全部交付后月流水约3亿元,年化收入超过40亿元。
金山云加速GPU算力建设:小米百亿预算落地,阿里签五年数十亿长约:7月2日,记者获悉,金山云下半年将加速GPU算力集群建设,以满足头部客户爆发式增长的算力需求。其中,小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,相关投入预算由最初的近40亿元增至百亿元以上。另外,阿里大模型团队已与金山云签署了5年期的算力租赁合同,涉及3000余台八卡GPU服务器,按签约时月租价格测算,全部交付后月流水约3亿元,年化收入超过40亿元。界面新闻就此向金山小米和阿里求证,对方暂无回应。
金山云加速GPU算力建设:小米百亿预算落地,阿里签五年数十亿长约:7月2日,记者获悉,金山云下半年将加速GPU算力集群建设,以满足头部客户爆发式增长的算力需求。其中,小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,相关投入预算由最初的近40亿元增至百亿元以上。另外,阿里大模型团队已与金山云签署了5年期的算力租赁合同,涉及3000余台八卡GPU服务器,按签约时月租价格测算,全部交付后月流水约3亿元,年化收入超过40亿元。界面新闻就此向金山小米和阿里求证,对方暂无回应。
“互联网企业云端招聘月”释放超20万就业岗位:记者从人力资源社会保障部了解到,“互联网企业云端招聘月”自6月开展至今,各地积极搭建供需对接平台,5000多家互联网企业超20万个岗位。活动期间,互联网大厂集中发布招聘资讯和岗位信息:京东集团释放就业机会2.5万个,覆盖技术服务、销售顾问、线下门店运营、到家服务等多类岗位。腾讯发布招聘需求8000余人,涵盖AI算法、大模型、高性能计算、基础架构等技术研究岗位。字节跳动提供约7000个岗位,涵盖大模型应用、AI搜索、视觉智能等前沿技术领域人才以及综合运营管理等多个方面。美团招聘6000人,涵盖技术、产品、金融、零售、商业分析、运营等岗位。各地深入走访互联网企业,摸清岗位空缺情况,动态更新招聘信息。运用AI、大数据等新技术,开展“沉浸式走播”、会场巡播等直播带岗活动,助力青年人才与企业精准对接。(央视新闻)
据吴晓波频道,梳理AI革命的五个阶段,分别是引爆期-体验期-奇点时刻-基建期-超级应用期,我们现在走到哪儿了? 第一阶段:<u>引爆期</u>。OpenAI在2023年11月进入应用层面,DeepSeek在2025年1月爆发。两个产品隔了13个月,分别在全球和中国点燃了AI的火药桶。 第二阶段:<u>体验期</u>。大模型开始进入普通人的生活,文字变图片、图片变视频,可以说几乎所有人都用过AI。 第三阶段:<u>奇点时刻</u>。当大家都开始用AI做写文案,短视频,就要消耗Token。全球Token使用量以成倍的速度增长,商业应用场景被找到了。 第四阶段:<u>基建期</u>。需求爆发后,算力不够了。“每隔100天,算力需求翻一倍,是互联网革命的6到10倍。”于是全球开始大规模建设数据中心、材料、组件、发电设施。 第五阶段:<u>超级应用期</u>。基建完成后,AI将进入具身机器人和软件大应用的全面爆发。碳基人类和硅基人类共存的时代正在到来。 对于大多数不直接从事技术研发的普通人而言,应对策略或许在于找到自己与这条产业链的接入点。你不可能自己去搞大模型,但可以用AI工具提升自己的专业能力;你不可能自己去建数据中心,但可以通过投资的方式参与这场红利。
浙商证券:维持中控技术“增持”评级,打造流程工业的AI大脑:浙商证券日前研报指出,中控技术是国内流程工业自动化领域具有绝对统治力的龙头企业,传统业务壁垒极高且仍在强化。根据睿工业统计数据,公司DCS系统连续十五年保持国内市占率第一,2025年份额提升至45.1%,大幅领先第二名。在核心的化工和石化板块,DCS 市占率分别高达68.5%和59.4%,化工、石化、冶金、造纸、建材五大行业均居首位。根据中国工控网统计,公司安全仪表系统(SIS)连续四年行业首位,市占率31.4%。公司构建了以时序大模型TPT(Time-series Pre-trained Transformer)为核心、具备生产闭环执行能力的差异化工业AI 产品体系,是AOP自主运行工厂的智慧大脑。工业AI业务正处于从标杆验证向规模化放量的关键拐点,管理层通过股权激励将自身利益与AI 高增长深度绑定。维持“增持”评级。
传美团限制业务团队使用豆包 官方暂无回应:有市场消息称,美团内部开始限制使用豆包大模型。消息称,美团向所有涉及到豆包大模型的业务部门下发通知,要求自查并规划迁移至LongCat、DeepSeek等模型,若无法迁移,需单独走审批流程。对此消息,截至发稿,美团暂无官方回应。(新浪科技)
Gemini桌面端接入Spark智能体,实现本地自动化与手机远程操控。
Anthropic 主力模型 Claude Sonnet 5 正式登陆 B.AI API 平台,为开发者提供更强 AI 语言模型能力。
互联网企业集中释放超20万岗位:记者7月2日从人力资源社会保障部获悉,为期一个月的互联网企业云端招聘月活动已于近日开展,超5000家互联网企业集中释放超20万个就业岗位。 各地深入走访互联网企业,摸清岗位空缺情况,动态更新招聘信息。例如,浙江瞄准具身智能、智慧物联等新兴领域,归集千余个高质量就业岗位;江西九江市深耕短视频传媒、电商运营等赛道,发布数据标注、设计剪辑等热门岗位。 不少互联网企业集中发布招聘资讯和岗位信息。例如,京东集团释放就业机会2.5万个,覆盖技术服务、销售顾问等多类岗位;腾讯发布招聘需求8000余人,涵盖AI算法、高性能计算等技术研究岗位;字节跳动提供约7000个岗位,涵盖大模型应用、AI搜索等前沿技术领域以及综合运营管理等多方面;美团招聘6000人,涵盖技术、产品等百余种岗位。 活动中,各地运用AI、大数据等新技术,开展“沉浸式走播”、会场巡播等直播带岗活动,助力青年人才与企业精准对接。同时,将政策宣讲、职业指导等服务融入招聘活动,将就业服务链条延伸至社区、高校。(新华社)
Polymarket预测GPT-5.6在7月7日前向公众开放的概率升至64%,24小时内上涨26%。
1. Meta正构建云业务,出售过剩的AI计算能力。 2. 英伟达推出AI基础设施新合作模式,与AI云厂商共享收入助力算力建设。 3. 媒体爆SpaceX展示纤薄手持AI设备原型,马斯克公开辟谣:完全不实。 4. SK海力士:计划2029年前投资80万亿韩元建设新NAND产线。 5. 联合国秘书长呼吁各国加强人工智能治理。 6. 英媒:白宫正加快人工智能模型标准制定计划。 7. 恒生指数公司联同数码港推出主题指数探索计划,促进以人工智能驱动指数创新。 8. 英国国家电网向美国AI电力公司投资17.5亿美元。 9. 亚马逊云科技将投入10亿美元设立全新AI部门。 10. 纳睿雷达发布“睿宸”超精细化短时临近AI气象大模型等新产品。 11. 行云科技:海南行云签署55.09亿元算力服务协议。 12. 北京亦庄建成全市首个词元工厂,日产能突破1.4万亿词元。
6月29日,优艾智合发布工业原生人形机器人“隙锋”,并宣布首批4000台意向订单完成签约。作为面向工业场景打造的新一代具身智能机器人,“隙锋”全面承接工业具身智能大模型FabriX能力,聚焦半导体、锂电、3C、能源等真实场景应用,并搭载RoboSense速腾聚创数字化激光雷达,为自主导航、精准操作及集群协同提供高清三维环境感知能力。 数字化激光雷达正成为工业具身智能实现高可靠环境感知的重要基础设施。此次“隙锋”4000台意向订单签约,标志着工业原生人形机器人迈入规模化落地阶段,也进一步验证了数字化激光雷达在工业具身智能领域的商业化应用价值。于此同时,双方在具身智能产业化协同层面迈入全新阶段,RoboSense将持续助力优艾智合实现“3年内赋能10000个工业现场”的目标。未来,RoboSense将依托数字化芯片、AI感知与量产硬件的技术闭环,成为机器人进入真实世界的三维感知入口,助力物理AI从实验室走向真实工商业现场的规模化落地。
DeFiLlama宣布新所有者已接管DL News网站,两者不再有任何关联。
葡萄牙政府1日发布国家人工智能(AI)大模型“阿马利娅”,并宣布追加投资150万欧元,使项目总投资增至700万欧元。新增资金将用于支持大模型迭代和自主人工智能基础设施建设。
葡萄牙发布国家人工智能大模型“阿马利娅”:葡萄牙政府1日发布国家人工智能(AI)大模型“阿马利娅”,并宣布追加投资150万欧元,使项目总投资增至700万欧元。新增资金将用于支持大模型迭代和自主人工智能基础设施建设。据葡萄牙卢萨通讯社报道,“阿马利娅”是一款以葡萄牙语为核心的大语言模型,开发历时18个月,未来将应用于教育、国防、文化、医疗卫生和政务服务等领域。
通用人工智能公司VAST完成超10亿元A3轮融资:7月2日,通用人工智能公司VAST(三启万物)宣布,其于本月再次完成超10亿人民币A3战略轮融资。本轮融资由吉利资本等产业方,四三九九、贪玩游戏、巨人网络等游戏厂商,某知名互联网战投,亦庄国投、基石资本、毅达资本、成都科创投、复星创富、华控基金、锡创投、慕华科创、策源资本等投资机构及地方产业基金联合参投。老股东渶策资本、元生资本持续追投。本轮融资完成后,公司将继续加大力度,持续投入AI 3D大模型与世界模型的核心算法迭代、数据沉淀与顶尖人才引进,同时加速全球市场商业化布局与产业生态构建。
帝奥微战略投资光羽芯辰 驱动端侧AI上下游合作:据帝奥微消息,近期,帝奥微完成对上海光羽芯辰科技有限公司(光羽芯辰)的投资,携手其他产业和财务投资人,共同助力光羽芯辰端侧大模型芯片技术迭代与产业落地,并进一步探索公司已有模拟芯片业务在各类智能设备商与端侧AI的协同合作,拓展公司业务边界。
美国大数据分析公司Palantir首席执行官Alex Karp对OpenAI及Anthropic等业者采用的Token计价模式提出严厉批判,直言该模式已“出现大毛病”。Karp表示:“我并非要贬低他们,但这套模式绝对出了问题。美国企业界的普遍认知是:与其浪费时间在那里刷Token,不如放松休息。”“刷Token”指的是企业为追求模型输出长度而耗费大量运算资源,却忽略实质效益。随着新一代AI模型比前代产品更加昂贵,企业正逐渐摆脱这种思维,转而追求具体的投报率。这促使许多公司开始采用成本极低的开放权重模型,或是转向构建自家的高效专有工具,以降低对通用大模型的高度依赖。在此趋势下,Palantir本周稍早宣布扩大与英伟达的合作,利用后者的AI工具为美国政府机构打造客制化模型。
中国3D大模型人工智能初创公司哇嘶嗒科技完成1.5亿美元融资:根据公司新闻稿,哇嘶嗒科技(Vast,亦称为Tripo AI)近期完成了A3轮融资,筹资逾1.5亿美元。吉利资本、复星创富和策源资本参与了本轮融资。现有投资者渶策资本和元生资本也参与了本轮融资。
“红底股”大幅扩容 硬科技重塑港股市场生态:2026年上半年,港股市场呈现鲜明的“冰火两重天”格局:新股发行热度空前,AI大模型、半导体、高端制造等领域的科创企业批量登陆港交所,持续为市场注入新鲜血液。二级市场上,大模型、存储芯片、光通信、PCB等赛道牛股辈出,百元“红底股”阵营大幅扩容;传统互联网、消费电子等板块则持续走弱,万亿市值俱乐部迎来洗牌。港股市场冰火交织的背后,是第四次科技革命浪潮下,中国经济结构转型、新质生产力加速发展,与资金偏好转移形成共振,推动港股加速“新陈代谢”,市场生态与估值体系迎来系统性重塑。(上证报)
一家初创公司正试图解决大语言模型在生成内容时陷入群体思维(如偏好输出数字7)的问题,致力于让AI输出更随机。
6月24日,OpenAI与博通联合发布首款智能处理器“Jalapeño”。该芯片专为大规模语言模型(LLM)推理设计,是双方共同打造的多代计算平台中的首款AI加速器,旨在提升AI运行速度与可靠性,并降低使用门槛。
Pramaana Labs 在 LLM 上构建确定性验证层,完成由 Khosla Ventures 领投的 2700 万美元种子轮融资。
溜溜梅上市首日大涨186%,因股票简称“LLM”与AI术语相同引发炒作。
Together AI 开源 OSCAR,一种注意力感知的 2 位 KV 缓存量化系统,可将长上下文 LLM 服务的 KV 内存减少约 8 倍,解码速度提升 3 倍。
SSV 是一种用于提高 LLM 推理效率的稀疏投机验证方法。
Stackit与neuland.ai合作,计划在欧洲数据中心提供大语言模型(LLM)服务。
Subquadratic 以 2900 万美元种子轮资金推出,并发布采用亚二次稀疏注意力架构、支持 1200 万 token 上下文的 LLM SubQ。
LLM-eval-kit v0.3.0 分布式大模型评估框架发布。
LLM 0.32a1版本修复了0.32a0中工具调用对话未正确从SQLite恢复的问题。
LLM 0.32a0版本发布,这是一次重要的向后兼容重构。
针对大型语言模型(LLM)引发的焦虑现象进行了讨论。
LLM-wiki项目发布,一个命令即可部署Karpathy风格的wiki,支持QMD搜索并适配Claude/Codex。
llm-openai-via-codex 0.1a0发布,劫持Codex CLI凭证通过LLM调用API,实现类似GPT-5.5的功能。
2026年大型语言模型(LLM)漏洞赏金计划现状分析。
Hacker News平台分析156个大型语言模型(LLM)发布帖,追踪其社区讨论趋势。
英伟达开源TensorRT-LLM,旨在优化大型语言模型推理性能。
Cloudflare发布Unweight技术,通过张量压缩将大型语言模型(LLM)压缩22%而不损失质量。
Claude AI 构建了 LAD(LLM-as-DOM)项目,探索如何让大型语言模型像浏览器 DOM 一样浏览网页。
文章指出,人们对大型语言模型(LLM)的令牌使用直觉可能存在误解,并探讨了相关技术细节。
LLM-Wiki项目发布,旨在通过社区协作构建大型语言模型知识库。
随着硬件性能提升和模型量化技术普及,员工在本地设备上运行大型语言模型(LLM)进行推理已成为新趋势,这给企业安全带来数据完整性、合规性和供应链风险,迫使CISO将治理重点从网络控制转向终端设备管理。
开源项目The Synthetic Mind提出了一种用于大语言模型(LLM)代理的认知架构,旨在增强AI代理的推理和决策能力。
LLM Router 是一款 MCP 服务器,可将 Claude Code 任务路由至更便宜的模型以节省成本。
文章建议用户在与大型语言模型(LLM)交互时避免使用大写字母或命令式语气,因为这可能降低模型性能,提倡更自然、礼貌的沟通方式。
文章探讨了生成与验证之间的差距如何解释大型语言模型(LLM)的实用性,强调其作为工具的价值。
ShieldStack TS 是一款专为 TypeScript 设计的 LLM 安全中间件,旨在增强大型语言模型应用的安全性。
Go-LLM-proxy v0.3 发布,这是一个为 Claude Code 和 Codex 设计的翻译代理工具。
Andrej Karpathy发布关于大型语言模型(LLM)的Wiki文章,提供技术概述和资源链接。
datasette-llm 0.1a6 发布,简化模型设置并改进 Python API 文档。
作者在三月发布了关于软件错误分类的文章、AI辅助写作的免责声明、LLM-ELIZA插件等个人项目,并分享了涉及AI模型应用、成本担忧及非AI技术反思的链接内容。
Liter-LLM 是一款用 Rust 编写的通用 LLM 客户端,支持 11 种语言绑定,已在 GitHub 开源。
作者在个人MacBook Neo上成功训练了一个大型语言模型(LLM),展示了本地设备进行AI开发的可行性。
Datasette-LLM 0.1a1发布,新增插件钩子和函数,支持为不同目的配置AI模型(如GPT-5.4-nano和Sonnet 4.6),以增强数据管理和SQL查询功能。
艺术家Sam Lavigne开发了'Slow LLM'工具,旨在通过使AI聊天机器人运行极慢来引发用户对依赖Claude和ChatGPT等工具的反思。
文章探讨了大型语言模型(LLM)在艺术创作中的角色与潜力。
Pairform Running 是一款利用 LLM 提供跑步教练服务的 AI 工具,通过连接 Strava 等平台自动同步数据,能根据用户目标和历史记录快速生成个性化训练计划。
研究人员利用苹果的'LLM in a Flash'技术,在48GB MacBook Pro M3 Max上通过量化与流式加载,成功以5.5+ tokens/秒的速度本地运行Qwen3.5-397B-A17B模型。
LinkedIn 宣布已将其面向13亿用户的动态流推荐系统,从原有的五个独立检索管道统一为一个基于大型语言模型(LLM)的系统,通过生成式推荐器提升个性化内容匹配,并优化了GPU与CPU的计算架构以控制成本。
LessWrong 平台更新其编辑政策,明确规范了用户使用大型语言模型(LLM)生成内容的规则。
Hacker News 出现大量疑似使用廉价 API 的 LLM 机器人账户,伪装人类发表无实质内容的评论。
文章讨论了大型语言模型(LLM)的发展现状与未来趋势,聚焦于技术演进与应用潜力。
LLM-eliza插件为开发者提供访问经典ELIZA语言模型的接口,支持通过LLM工具集成。
开源项目LLM9p将大型语言模型(LLM)实现为Plan 9文件系统,允许通过文件操作与AI交互。
开源项目 LLM-cpp 发布 26 个单头文件 C++17 库,专为大型语言模型集成设计,简化开发者实现。
Python 字符编码检测包 'Chardet' 被 LLM 生成的克隆版本替代并重新授权许可。
CloakPipe 是一款 Rust 开发的隐私代理工具,通过伪匿名化处理敏感数据,保护用户在使用 LLM API 时的隐私安全。
文章探讨了大型语言模型(LLM)的认知机制与知识获取方式。
有建议提出建立一个网站,专门展示大型语言模型(LLM)解决Knuth问题集的方案,认为这能比现有测试更好地评估LLM能力。
一篇博客文章探讨了大型语言模型(LLM)倾向于生成不准确或虚构信息的问题,并分析了其背后的技术原因。
LLM Prose Tells 是一篇关于提示工程的文章,讨论了如何优化与大型语言模型的交互。
OpenCode Benchmark Dashboard 发布,可帮助用户比较不同 LLM 提供商、量化版本和模型,以找到适合本地计算机的最佳 LLM。
一篇关于精简代码大型语言模型(LLM)开发原则的宣言在Hacker News上引发讨论。
ÆTHERYA Core 是一款用于管理 LLM 提议行动的小型确定性策略引擎,确保在行动执行前进行治理,包括故障关闭执行、带外批准证明、防重放保护和可验证审计链。
Orkia 是一个基于 Rust 的开源 LLM 代理运行时,通过类型系统强制执行策略、信任评分和审计跟踪,确保所有代码路径都经过治理,默认采用故障关闭机制,支持签名会话证据,代理可通过行为表现获得自主权,采用 Apache 2.0 许可证。
文章探讨将大型语言模型(LLM)的正常运行时间作为宏观经济指标的可能性,引发对AI系统稳定性与经济关联的思考。
开源插件UE LLM Toolkit发布,使大型语言模型能够读取和写入虚幻引擎资产。
研究表明大型语言模型(LLM)能够通过匿名在线帖子精准识别用户身份,从少量评论中推断个人位置、职业和兴趣,并在网络上进行搜索匹配。
Secure LLM Scripting工具发布,旨在提升大型语言模型应用的安全性。
文章探讨在敏捷开发中如何有效利用大型语言模型(LLM)提升效率。
Unsaturable LLM Benchmark推出,旨在评估大型语言模型的技能、可靠性和元认知能力。