吃瓜集锦 × 吃瓜大合集

DuraTech 2025创新大会11月3日在陕西西安开幕

发表于2025年10月31日由admin

来源：环球网 11月3日，2025硬科技创新大会将在西安盛大开幕。会议聚焦半导体、生物医药、人工智能、XR等重点领域，汇聚高水平专家和创新团队，探讨技术创新和产业变革时代的建议。自2017年起，硬科技创新大会已连续8年在西安成功举办。如今，它已成为这座城市的一张靓丽名片。这不仅体现了西安市对科技创新的长期坚韧，也彰显了西安市推动硬科技高质量发展的坚定决心。西安是我国高校和科研机构高度集中的城市，科教资源丰富，人才基础雄厚。肩负着建设国家首都和科学技术的伟大使命具有全国影响力的科技创新中心，在科技实力建设中发挥着重要作用。近年来，西安在诸多科技领域频频发布好消息。在航天领域，2025年4月，中国空间技术研究院西安分院研制出保障神舟二十号飞船通信顺畅的关键设备。 10月，中国科学院西安光动力研究所研制的GC-2相机子系统支持二维长征火箭发射任务。多项关键技术已填补国内空白。在航空制造领域，西安星航航空科技攻克了国家大型飞机蒙皮生产瓶颈，获得多项专利，推动了行业自主发展。新能源领域，隆基绿能公布太阳能电池技术两项进展六月的科学，创造了新的世界纪录。 7月，相关研究成果发表在《自然》杂志上。在新材料领域，西部超导、四方超轻等企业正在取得令人瞩目的成就。四方超轻自主研发的镁锂合金创下了金属结构材料“轻量化”的新纪录。西安持续发力创新驱动发展。加强高层设计，市委科技委健全科技创新支撑体系，组建新的组织机构，颁布《科技创新促进条例》。针对科研成果转化问题，深化“三改”，形成和推广“一所、一校、一港、一企”成果转化模式。西安大学绩效变化率近三年科技人员占比均超过60%。与此同时，西安市加快秦庄市新型引领创新平台建设，构建全链条创新体系。开创“科技企业信用融资”先河，截至2025年9月底，已帮助390家科技型中小企业获得贷款18.91亿元。帮助受惠企业建立产业创新中心，打造重点领域产业集群。此外，西安还实施了“人才计划”。当前，西安正在加快建设以科技创新为引领的现代产业体系。我们将以改革精神和创新传统，为科技强国建设贡献“无条件的力量”，谱写新时代发展的辉煌篇章。
特别提示：以上内容（含图片、视频、如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括照片和视频）（如有）由仅提供serviceios存储的社交媒体平台网易号用户上传并发布。

发表在每日更新 | 留下评论

苹果iOS 26.1下周发布：锁屏防止误触、液态玻璃透明度可调

发表于2025年10月31日由admin

来源：环球网【环球网综合报道】据外媒 Macramer 10 月 31 日消息，苹果 iOS 26 操作系统即将迎来首次重大更新。根据官方消息和测试进度，iOS 26.1 正式版预计将于下周初（11 月 3 日或 4 日）向所有受支持的 iPhone 用户发布。本次更新虽然不包括传闻中的新一代 Siri，但重点打磨细节和优化体验，引入了界面定制、操作逻辑改进、隐私和安全改进、多个原生应用更新等 10 余项新功能，旨在为用户提供更贴心、更安全、更个性化的移动操作系统体验。据外媒macrumors报道的截图显示，本次更新包括一系列视觉和交互设置。流行的“液体玻璃”效果支持透明度切换d 用户可以在“设置”-“显示与亮度”中选择“灯光”或“色调”模式，以满足不同的审美和对比度需求。同时，“设置”、“主屏文件夹”等系统级界面的文本对齐方式统一调整为左侧，以提高视觉一致性和可读性。手机应用键盘还首次融入了液态玻璃设计元素。在交互逻辑上，iOS 26.1更加注重防止错误。备受争议的“锁屏向左滑动快速启动相机”功能终于可以单独禁用，让您在使用设备时获得更多隐私控制。另外，停止闹钟或定时器的操作也从“点击”改为“滑动”，有效避免了睡觉时不小心停止闹钟的尴尬。从隐私和安全的角度来看，iOS26.1改进了系统更新机制，增加了“下载并安装安全”的新选项这是我们快速安全响应功能的更新，旨在为潜在威胁提供更无缝、更及时的响应。辅助功能方面，新的“显示边框”选项取代了原来的“按钮形状”，允许您为所有按钮添加清晰的边框，以提高界面的可视性。(wan wan)
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。

发表在吃瓜热门 | 留下评论

中国航天科技点燃亚太青年“太空梦”

发表于2025年10月30日由admin

新华社曼谷10月30日电（记者夏康进）日前在曼谷举行的泰国航空航天展览会上，地理信息系统工程师Thanaboldi Sagnarumpeh在电子屏幕前向参观者展示了泰国山洪风险区域的预警图，并介绍了遥感卫星数据在防灾减灾方面的重要作用。这种可视化是他的团队基于卫星数据开发的应用程序之一，涵盖灾害监测、健康跟踪和土地利用。他能够从事这项开发工作，与他在中国留学的经历是分不开的。作为中泰两国共建的“诗琳通国际地球与空间信息科学研究中心双硕士项目”的学者，Thanapordi先生曾在武汉大学留学一年，学习地形与制图工程，亲身体验了中泰两国不断深化的交流与合作。中泰在空间技术相关科技和人力资源领域的合作。 “在中国的学习加深了我对测绘工程的理解，增强了我的实践技能。”他说，“中国拥有大量自主研发的卫星，数据更丰富，分析技术更先进。”目前在泰国地理信息和空间技术发展局工作的塔纳博迪先生将就泰国未来应发展什么样的卫星数据利用系统提供专家建议，为泰国的航天事业做出贡献。这是 2025 年 4 月 8 日在泰国是拉差的泰国地理信息学和空间技术发展局展出的航空航天模型的一部分。新华社（拉亨供图）从高校交流到多边机制合作，人力资源开发是中美合作的重要环节中泰航天合作，其中亚太航天合作组织发挥重要作用。亚太空间合作组织项目运营和数据服务部副主任达迪亚·陈拉孔告诉新华社，泰国和中国作为该组织成员，正在加大在航天领域的合作，在人力资源开发、专家交流和项目开发等方面取得了显著成果。他表示，APSCO与中国高校和科研院所合作，为成员国学生提供硕士、博士奖学金，让包括泰国学生在内的众多亚太地区年轻人能够到北京航空航天大学等中国高校继续深造，接受世界一流教授专家的指导，追求更先进的航天研究。他表示，自己将有机会亲身体验技术。 “我们周围有丰富的航空航天资源和机会，”达迪亚说。同为亚太航天合作组织成员的巴基斯坦今年2月与中方签署了《关于选拔培训巴基斯坦宇航员并参加中国空间站任务的合作协议》，开启了两国深化载人航天领域合作的新篇章，迈出了中国选拔培训外国宇航员参加中国空间站任务的第一步。 2025年2月28日，中国和巴基斯坦签署航天员选拔和培训合作协议。未来几年，外国宇航员将进入中国空间站执行短期任务。这是巴基斯坦总理的官邸，位于巴基斯坦首都伊斯兰堡。巴基斯坦总理沙赫巴兹·谢里夫（中）、副总理出席中国载人航天工程办公室主任林锡强（右）和巴基斯坦太空与高层大气研究委员会主席穆罕默德。优素福·汗互换交易。新华社（艾哈迈德·卡迈勒摄）时任巴基斯坦空间与高层大气研究委员会主席穆罕默德·优素福·汗接受记者采访时表示，中国载人航天技术在世界上名列前茅，中国在很短的时间内建成了世界一流的空间站。此次合作将鼓励更多年轻的巴基斯坦研究人员加入航空航天业。中国航天事业的发展也激发了马来西亚年轻人对航天事业的热情。今年5月在马来西亚兰卡威岛举行的第十七届兰卡威国际航展上，不少中国企业携明星产品亮相。专程从马来西亚首都吉隆坡赶来的“航空爱好者”祖哈菲克·伊兹万告诉习近平新华通讯社表示，随着中国科技创新能力的提升，人们对中国装备制造的兴趣与日俱增。认为“中国的产品在这方面非常有趣、创新，应用场景广泛”。中国民营航天企业在亚太地区开展的合作也注重人力资源开发和技术交流。 2024年7月，中国民营航天企业苍宇航天基地与马来西亚企业亚太航天集团在马来西亚赛城举行合作协议签约仪式。是的。除了加强卫星遥感等领域合作外，双方还将共同建立航天人力资源开发平台，以在轨立方体卫星为航天科普教育核心，培养具有实际操作能力的航天人力资源。作为中国的一员作为正在积极拓展海外的民营航天企业，银河航天于2024年在泰国玛哈纳科技大学建设了基于“小蜘蛛网”低轨宽带通信测试卫星群的地面测试站，并与学校共同完成了低轨卫星互联网宽带通信网络的测试验证。 “与中国商业航空集团公司的科研合作，不仅培养了马汉基尔理工大学的师生，也让我们接触到了低轨通信卫星的前沿技术。我们希望有一天，泰国的大学和科研院所能够研制出与中国同等水平的低轨通信卫星。”马汉基尔理工大学校长帕纳维·普卡贾德表示。 2024年5月17日，中泰双方人员在泰国马汉基科技大学调试近地轨道通信网络移动链路站。（新华社王腾供图）从课堂到实验室，从发展卫星应用到中国参与空间站任务，通过一系列学术交流、产业合作和人才培养项目，中国航天科技正在点燃亚太地区年轻人的“航天梦”。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号社交媒体平台用户上传并发布。 rm 仅提供存储服务信息。

发表在每日更新 | 留下评论

苹果最薄手机产品经理朱海洲谈iPhone Air：一旦用了就很难收回来了

发表于2025年10月30日由admin

快科技10月30日报道，产品经理朱海洲表示，iPhone Air一旦使用就很难退货。这款手机 90% 的时间都很薄，而其他手机 100% 的时间都很厚。他指出，iPhone Air 可以每天使用一整天，如果经常使用，则可以使用一天中的大部分时间。如果使用移动电源，即使只充到40%，也能持续一天多。超薄机身与超薄充电宝的结合，让 iPhone Air 拥有数十年的可更换电池体验。据报道，iPhone Air 是苹果公司的全新产品。它不仅是第一款以“Air”命名的车型，而且其设计也与其前辈有很大不同。苹果称这款型号为“超薄超轻”，因为它的厚度仅为 5.6 毫米，重量仅为 165 克。它还拥有 6.5 英寸大屏、lgadas 和 A19 Pro 芯片。这是苹果公司有史以来最薄的型号。请注意，iPhone Air 仅支持 eSI目前，中国移动、中国联通、中国电信三大运营商均已大规模推出eSIM手机办理服务。这意味着eSIM技术在中国大陆正式跨过物联网和智能穿戴设备的边界，进入手机商用的新阶段。然而，iPhone Air上市后销量却未达到预期。分析师郭明池表示，供应链已开始削减 iPhone Air 的产能，到 2026 年第一季度将削减 80% 以上。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由仅提供信息存储服务的社交媒体平台网易号用户上传并发布。已编辑。

发表在吃瓜热门 | 留下评论

Arm灵活接入解决方案特点Armv9计算平台

发表于2025年10月29日由bet356体育官方网站

Arm Holdings Limited（纳斯达克股票代码：ARM）最近宣布扩展其 Arm® 灵活接入解决方案，包括全球首个针对物联网和边缘人工智能 (AI) 工作负载进行优化的 Armv9 边缘 AI 计算平台。该平台由两个主要组件组成：Arm Cortex®-A320 CPU 和 Arm Ethos™-U85 NPU，预计分别于 2025 年 11 月和 2026 年初集成到 Arm 灵活访问解决方案中。此举将进一步在整个生态系统中引入快速创新，从小型初创公司到全球最大的原始设备制造商，加速下一代智能边缘设备的开发。 Arm 高级副总裁兼 ios IoT 业务部门总经理 Paul Williamson 表示：“下一波 AI 计算创新将在部署在边缘的设备、接口和系统上蓬勃发展，并使智能更接近数据源。” “从可穿戴设备和人工智能助手到智能相机、智能家居开发冰和机器人，实现这些场景并实现真正机会的关键在于拥有可扩展的高性能计算能力。”为了帮助我们的合作伙伴真正利用这个机会，Arm不断降低技术获取门槛，让生态系统中的所有公司更容易获得Arm的尖端计算技术，并显着缩短产品发布周期。降低门槛加速创新：Arm灵活接入解决方案采用Armv9边缘AI计算平台。通过在Arm灵活接入解决方案中引入Armv9边缘AI计算平台，Arm提供了为所有开发具有人工智能功能的边缘设备的公司提供更顺畅的市场路径、更具竞争力的成本结构和渠道更高效的创新策略，该平台不仅提供大规模部署智能设备所需的高性能和能源效率。es内置安全机制来保证设备安全。今年早些时候推出的Armv9边缘AI计算平台配备了高能效的Arm Cortex-A320 CPU和Arm Ethos-U85 NPU，可支持超过10亿个参数的最终AI模型。它还集成了先进的 Armv9 安全技术，如指针验证 (PAC)、分支目标识别 (BTI) 和内存标签扩展 (MTE)，以提供关键应用程序保护和边缘数据安全。 Armv9 AI边缘计算平台将ScalableVector Extensions 2 (SVE2)等Armv9架构的机器学习(ML)性能与Ethos-U85的能效相结合，为下一代边缘AI应用奠定了坚实的基础。无论是智能相机、智能家居应用、工业自动化还是先进的人机交互界面，都利用视觉、语音和手势来实现更智能、更自然的交互体验，赋予机器类人的感知和响应能力，同时确保最终安全地完成推理和数据处理。此次Arm灵活接入解决方案的增强更新是加速前沿人工智能创新的重要里程碑，完美体现了Arm对生态系统发展的坚定承诺。据VDC Research预测，到2028年，人工智能将成为工程项目中的主导应用技术。物联网，而Arm计算平台已经处于这一变化的中心。 Arm灵活访问计划使合作伙伴能够访问Arm广泛的计算技术，提供早期、低成本或免费（针对符合条件的初创公司）的工具和资源访问。这种模式一直是行业创新的重要催化剂。公司可以自由地试验和迭代设计，只需要为最终设计中使用的技术支付许可费。使用此模型，Raspberry Pi、Weeteq、Hailo 和 SiMa.ai 等合作伙伴我们成功创造了创新的尖端人工智能技术。在过去的五年里，通过 Arm 灵活访问计划已经成功录制了大约 400 次，有超过 300 名活跃成员参与。其中超过一半的设计针对嵌入式和物联网应用，为边缘智能注入新的智能力量。定义前沿的AI计算环境Arm始终致力于加速世界领先技术的采用，赋能所有生态系统参与者创新。随着Arm灵活接入解决方案中引入Armv9架构，Arm为新一代创新者提供了先进的架构和尖端的AI支持工具，帮助满足市场对更高性能、增强AI功能、提高能源效率和增强安全性的持续增长需求。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易号”的用户。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由仅提供信息存储服务的网络平台社交网络网易号用户上传发布。

发表在每日更新 | 留下评论

老黄推出Vera Rubin超级芯片！计算能力增加三倍，他们瞄准美国核武器实验室

发表于2025年10月29日由bet356官网首页

当地时间10月28日，在NVIDIA秋季GTC大会上，NVIDIA首席执行官黄仁勋展示了最新的Vera Rubin超级计算平台，NVIDIA称之为“超级芯片”。图|黄仁勋展示最新的 Vera Rubin 样本（来源：NVIDIA） Vera Rubin 这个名字来自著名天文学家 Vera Rubin，致敬她对太空和科学前沿的探索。该平台由新的 Vera CPU 和 Rubin GPU 组成。其目标是同时支持大规模人工智能模型、科学计算和全国超级计算任务的训练。首批系统将部署在美国洛斯阿拉莫斯国家实验室（LANL），惠普企业（HPE）将帮助英伟达建造两台下一代超级计算机“Mission”和“Vision”，用于国家安全任务和开放科学研究。 Vera Rubin 的出现具有战略意义。 Nvidia 的前竞争对手 AMD 刚刚赢得了 10 亿美元的超级计算合同美国能源部，对英伟达在高性能计算市场施加了巨大压力。从架构角度来看，Vera Rubin 是 NVIDIA 迄今为止最复杂的计算平台。它由Vera CPU和Rubin GPU组成，分为普通Vera Rubin NVL144版本和Ultra NVL576版本。 Vera Rubin NVL144 平台使用两个新芯片。 Rubin GPU 配备两个标线大小的芯片，具有高达 50 PFLOPs 的 FP4 性能和 288GB 的下一代 HBM4 内存。此外，NVL144 平台还包括采用 ARM 架构的定制 88 核 Vera CPU。（来源：Data Graph）在性能扩展方面，NVL144平台具有3.6 exaflops的FP4推理计算能力和1.2 exaflops的FP8训练计算能力，是GB300 NVL72的3.3倍，HBM4内存为13 TB/s，快速内存为75 TB，比GB300和NVLINK高出60%。并对CX9的特性进行了评估。它们的运行速度分别为 260 TB/s 和 28.8 TB/sy。 NVL144主要针对超大规模AI模型训练和实时推理，预计于2026年底发布。高端NVL576平台计划于2027年发布，FP4推理性能达到15 exaflops，FP8训练性能达到5 exaflops。（来源：资料图）黄仁勋表示，Rubin平台“不仅仅是为AI而设计，而是兼顾了科研和AI的双重任务”。因此，它可以支持高精度FP64科学计算，而无需牺牲传统高性能计算能力来实现较低p的AI性能精度，为物理模拟、气候模型、量子化学等科研任务提供足够的性能。洛斯阿拉莫斯实验室视觉系统将率先实施 Vera Rubin 架构，用于开放科学研究和人工智能模型开发。任务体系是针对国家核安全任务而设计的预计于 2027 年正式推出。根据计划，Vision 的性能将至少是其前身 Venado 系统的两倍（约 98.5 PFLOPS FP64）。 NVIDIA 指出，人工智能模型规模的不断扩大迫使计算平台在内存带宽、互连速度和功效之间取得平衡。图| NVIDIA 路线图（来源：NVIDIA）Rubin 平台支持 NVLink Gen6 和 CX9 网络，可以在节点之间提供 260 TB/s 和 28.8 TB/s 的带宽，允许数千个 GPU 以接近单机的延迟执行协作计算。在训练非常大的多模态模型时，此功能尤其重要。不过，NVIDIA 尚未公布 Vera Rubin 系统的功耗、散热解决方案和软件堆栈兼容性的完整细节，特别是与 CUDA、HPC SDK、OpenACC 和科学模拟软件的适配程度。 Vera CPU 的微架构信息也很有限d.据推测，它可能是基于 Grace 的进化版本，但这一点尚未得到证实。在本次大会上，NVIDIA还宣布了一项名为NVQLink的互连技术。黄把它称为“连接量子和经典超级计算机的罗塞塔石碑”。它将量子超级计算机和传统超级计算机结合成一个集成的、连贯的系统，标志着GPU量子计算时代的到来。（来源：Datamap）NVQLink 将量子处理器和多种控制硬件系统的方式直接连接到 AI 超级计算机，使量子专业人员能够克服在扩展硬件时面临的集成挑战。作为开放的系统架构，GPU计算和量子处理器可以紧密集成以加速量子超级计算机。量子位是一种信息单位，它允许量子计算机以普通计算机无法处理的方式处理信息。虽然它们非常准确，但它们也有错误r-容易发生，并且需要使用复杂的校准技术、量子误差校正技术和控制算法才能正常运行。此前，该算法必须依赖于传统用户对超级计算机低延迟、高吞吐量连接的高要求。只有这样才能控制量子位和相关量子应用的错误。你将能够实现这一目标。 NVQLink提供了上述流程所需的互连能力，并提供了创建跨行业应用所需的环境。黄仁勋曾公开表示，在不久的将来，所有基于Nvidia GPU的科研超级计算机都将具有混合特性，可以与量子处理器紧密结合，从而扩大计算可能性，最终为创建未来混合量子经典超级计算机奠定基础。用户现在可以通过与 NVIDIA 的 CUDA-Q 软件平台集成来访问 NVQLinkm，使他们能够无缝使用 CPU 和 GPU，并在量子处理器上构建应用程序。目前，NVQLink互联了17个量子行业组织、5个控制器行业组织和9个研究机构的量子计算和GPU。英伟达表示，该技术还可以将量子处理器连接到一些超级计算实验室的计算机。 NVQLink目前在美国布鲁克海文国家实验室等实验室使用。它将帮助量子专家实现大规模量子计算和量子纠错所需的控制算法，帮助构建混合量子经典系统，并加速化学和材料领域的下一代应用。参考文献： https://nvidianews.nvidia.com/news/nvidia-nvqlink-quantum-gpu-computing https://gizmodo.com/nvidia-supercomputers-for-trump-2000678264
特别提示：以上内容（包括图片、视频，如有）由本站用户上传发布媒体平台“网易号”。本平台仅提供信息存储服务。
请注意：以上内容（包括图片和视频，如有）由社交媒体平台和信息存储服务提供。由网易号用户上传发布，仅提供服务。

发表在吃瓜热门 | 留下评论

通过判别式监督学习促进推理法学硕士，解决难度偏差和熵崩溃问题

发表于2025年10月28日由admin

作者简介：李刚，德克萨斯农工大学博士生，专注于设计和应用高效算法到大规模人工智能和机器学习任务，包括改进大规模基础模型的后训练算法、鲁棒的对抗性学习算法和鲁棒的分布式学习算法。在NeurIPS、ICML、KDD等重要会议上发表多篇论文，并作为主要贡献者之一发布了著名的用于不平衡分类任务的LibAUC软件包。 DeepSeek-R1 的成功引起了人们对群体相对策略优化（GRPO）作为大规模推理模型（LRM）的强化学习技术的广泛关注。在本文中，作者分析了二元奖励设置下 GRPO 的优化目标，发现了其相对群体优势函数引起的问题难度的内在局限性，并揭示了 GRPO 与传统的关系传统的判别式监督学习方法。基于这些分析的结果，作者提出了一种新的判别约束优化（DisCO）框架来改进大规模推理模型。该框架基于歧视学习的基本原则。也就是说，正确答案的分数增加，错误答案的分数减少。与 GRPO 及其变体相比，DisCO 具有以下优点：通过采用判别性优化目标，我们完全消除了难度偏差。通过使用未修剪的评分函数和约束优化技术，GRPO 及其变体的熵不稳定性得到解决，从而获得长期稳定的训练动态。这允许结合使用先进的判别性学习技术来解决数据不平衡问题，例如训练过程中的一些问题。错误答案比正确答案多得多。提高数学推理能力的实验大型模型的性能表明，DisCO 显着优于 GRPO 及其变体（例如 DAPO），在 1.5 亿个模型的 6 个基准任务上，平均比 GRPO 高 7%，比 DAPO 高 6%。最大响应长度为8k的磁盘值得注意的是，O甚至比最大响应长度为32k的GRPO还要好。这篇文章以“5,5,5,5”的高分被 NeurIPS 2025 录用。文章标题：DisCO: Boosting Large-Scale Reasoning Models with Discriminative Constrained Optimization 文章地址：https://arxiv.org/abs/2505.12366 开源模型地址：https://huggingface.co/collections/ganglii/disco-681b705decb9979e65614d65 GitHub 地址：Analog of 难度偏差问题见https://github.com/Optimization-AI/DisCOGRPO GRPO的核心思想是针对一个输入问题q生成多个结果并定义一个相对群体优势函数。当使用预期形状而不是经验平均值时，最佳值其中，从上面的变异分析中，作者得到了两个重要的发现： 1. 与判别式监督学习的相关性 2. 难度偏差提出的方法：判别式强化学习 1. 判别式目标函数（类似AUC优化）是基于上述和AUC，通过分析最大化相关性，作者发现了以下内容。我们直接从判别式学习的原理出发，重新设计了一个新的判别式强化学习框架：避免这种现象2。基于DRO的判别目标函数（类似于局部AUC优化）。基于判别性学习原理设计目标函数的优点是可以使用文献中先进的监督学习技术来改进训练。微调推理模型强化学习的主要挑战是奖励稀缺，这会导致响应生成不平衡。具体来说，对于某些问题，包含错误答案的结果数量可能明显超过正确答案的数量，反映了典型的数据不平衡问题。这个问题在歧视学习领域得到了广泛的研究。 Q为了解决这个问题，作者使用局部 AUC 优化设计了分布式鲁棒性优化 (DRO) 目标。 3.约束优化（稳定训练）为了使训练稳定，作者利用TRPO的信赖域思想，添加一个KL散度约束，形成如下优化问题。与TRPO二次优化方法不同，作者采用了最近开发的非凸不等式约束。应用优化策略并将约束替换为软方形铰链惩罚（方形铰链惩罚）。为了将实验结果与分析测试的有效性进行比较，作者使用平均 DisCO 和其他参考方法对六个数学参考数据集，使用 16 个结果中的 Pass@1 作为评估指标。在下表中，pod我们看到作者提出的DisCO方法总是显着优于其他参考方法。特别是，训练和推理长度为 8k 的 DisCO (log-L) 与 GRPO 相比平均提高了 7%，并且优于 DeepScaleR-1.5B-Preview（使用最大长度 24k 进行训练并使用 32k 长度进行评估）。在模型 7B 的实验中，DisCO 的性能也显着优于所有基线方法，与 GRPO 相比平均提高了 3.5%。在上表中，作者展示了模型1.5B中不同强化学习技术的有效性比较。作者还添加了 OpenAI 的 o1 预览模型作为基准。表中的MRL（最大响应长度）表示训练或测试期间使用的最大响应长度。长响应限制了模型可以生成的时间推理结果。阴影模型是其他团队训练的结果，相应的指标也来自原始论文或 DeepScalaR 项目。除此之外，其余的结果都是通过对现有模型的直接评估或基于不同方法训练后获得的结果获得的。表下半部分中的所有方法都基于相同的数据集 (DeepScaleR)。请注意，这是拟合 pSeek-R1-Distill-Qwen-1.5B 模型的结果。其中，DS是DeepSeek-R1的缩写，DSR是DeepScalaR的缩写。训练动态比较随着大规模强化学习成为改进推理模型的核心技术，学习算法的稳定性非常重要，因为它决定了学习算法是否适合大规模训练。作者在训练奖励和生成熵方面比较了不同方法的训练动态。从下图中模型1.5B和7B的微调实验可以看到，由于GRPO、GRPO-ER、Dr.GRPO的熵下降以及DAPO的熵增加过多，我们只能获得过早的确定性策略或高度随机性的策略，并且所有基线都经历了过早的饱和。使用发散 KL 正则化在 TRPA 的后续步骤中也可以观察到生成的不稳定熵。相比之下，作者提出的具有两个未修剪评分函数的 DisCO 方法是最稳定的，因为它增加了训练奖励并产生相对稳定的熵。上图展示了不同方法在训练过程中的动态表现。左边两图是训练1.5B模型时intraining的情况，右边两图对应的是7B模型的训练。图 (a) 和 (c) 显示了训练奖励与训练步骤数的函数关系。这里，奖励是a的平均分为每个步骤中用于训练的问题生成答案。图 (b) 和 (d) 显示了生成结果的熵值（反映输出多样性）作为训练步骤数的函数。消融实验如下图所示，作者提出的每个组件对于改进 DisCO 都很重要，而使用未修剪的评分函数是关键。总结在这项研究中，作者强化了大规模推理模型，以消除难度偏差和熵崩溃。我们提出了一种新的约束判别优化框架来避免该问题。我经历的数学推理测试表明，我们的方法显着优于 GRPO 及其最新变体。虽然这项工作主要关注二元奖励，但对于非二元奖励，您可以考虑在监督学习中使用客观排名函数或在设计中使用其他新颖的评分函数。作者将应用程序留给未来的研究约束判别优化以适应大规模模型和其他推理任务。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。是的，本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由提供i存储服务的社交媒体平台网易号用户上传发布。仅供参考。

发表在每日更新 | 留下评论

非侵入性脑机接口公司Merge Labs OpenAI首席执行官准备利用声波读取大脑

发表于2025年10月28日由bet356在线官方网站

来源：环球网【全球网络技术综合报道】据 The Verge 10 月 28 日援引消息人士报道，OpenAI CEO Sam Altman 旗下的脑机接口初创公司 Merge Labs 正在紧锣密鼓地筹备中，已邀请加州理工学院生物分子工程师 Mikhail Shapiro 加入其创始团队。夏皮罗的加入标志着 Merge Labs 在非侵入性脑机接口技术方面向前迈出了一大步，而不是埃隆·马斯克 Neuralink 的侵入性方法。报道称，夏皮罗在生物分子技术领域取得了许多进展，特别是在非侵入性神经影像和监测技术方面。它专注于使用超声波与人脑互动，而不需要开颅手术。这种方法不仅降低了手术风险，还减少了对脑组织的损伤。 Shapiro 的实验室还在研究一种基因疗法，利用超声波使细胞可视化，这可能是 Merge Labs 第一个产品的关键技术。在最近的一次演讲中，夏皮罗详细介绍了如何使用声波和磁场来创建脑机接口。他建议，与其将电极插入脑组织，不如“将基因引入细胞以对超声波做出反应”，这会“更容易”、更安全。 “我的任务是开发微创方法来与大脑中的神经元和身体其他部位的细胞相互作用，”夏皮罗说。 Altman 还对 Neuralink 的侵入性方法表示担忧。他说像 Neuralink 那样杀死神经元的界面“永远不适合我的大脑”。它希望开发更安全、更便捷的脑机接口，让用户通过思维与ChatGPT等AI工具进行交互。据外媒报道，未来几周一旦宣布成立，Altman 将出任 Merge Labs 总裁，但不会参与日常运营。这是因为他和联合创始人 Alex 与 Brania 在另一家眼部扫描公司运行的模型相似。artup 称为“人类工具”。奥特曼在2017年表示，人与机器的融合是硅谷的热门话题，大多数人猜测它将发生在2025年至2075年之间。（青云）
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易哈用户上传发布。 o 是一个社交媒体平台，仅提供信息存储服务。

发表在吃瓜热门 | 留下评论

徐正元：虽然我们犯了一个错误，把球翻了，但并不是所有人都放弃了。我们必须反思这一点，并为下一场比赛做好准备。

发表于2025年10月27日由admin

10月26日晚，成都0-2领先，但与青岛西海岸2-2平。赛后，徐正源出席新闻发布会。徐正源总结道，今天的比赛非常令人失望。由于自身失误，球队丢了两个球，但即使丢球后，全体球员也没有放弃，全力拼搏，在比赛最后时刻扳平了比分。总的来说，所有球员和球队教练组都必须认真反思并为最后两轮比赛做好准备。球队客场0-2落后是一个非常困难的局面，但我一直告诉球员们，无论是还剩10分钟、1分钟还是10秒，球员们都决心赢得比赛，并在场上竭尽全力。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
笔记：上述内容（包括图片和视频，如有）由网易号用户上传并发布，网易号是一个仅提供信息存储服务的社交媒体平台。

发表在每日更新 | 留下评论

定位明确《电讯报》：伯恩茅斯在招募球员时会有长期计划

发表于2025年10月27日由admin

北京时间10月26日，《电讯报》报道称，在今年夏天出售了总价值2亿英镑的球员后，伯恩茅斯不仅避免了重建困难，而且还取得了英超历史上最好的开局。俱乐部凭借清晰的计划、灵活的策略和高效的管理结构，成功跻身英超联赛。以下是《电讯报》的分析。伯恩茅斯今年夏天出售了价值 2 亿英镑的球员，失去了四分之三的顶级门将和后卫。然而，《每日电讯报》报道称，塞梅尼奥同时拒绝了曼联和热刺的5000万英镑报价，并拒绝了其他三名一线队球员的追求。经历了如此动荡的夏天，伯恩茅斯不仅活了下来，而且还取得了队史最好的英超开局。虽然没有人对联赛只打了9场比赛感到满意，但球队积18分位居第二。一开始本赛季红军预计将努力避免降级。更令人惊讶的是，他们踢的足球可能是整个联盟中最有趣的足球。所有的成功都来自于长期的规划和执行，以及一些机遇。例如，他们以4000万英镑的价格将不是主力球员的丹戈·瓦塔拉卖给了布伦特福德，体现了他们灵活的管理。令人难以置信的是，伯恩茅斯目前不仅在令人垂涎的主教练安多尼·伊贾乌拉的带领下具有竞争力，而且还可以将球员出售给皇马（霍伊森）、利物浦（凯尔·凯斯）和巴黎圣日耳曼（扎巴尼）等豪门。将球员出售给顶级俱乐部是伯恩茅斯在补强过程中“出售”的梦想之一。俱乐部已向潜在签约球员明确表示，这是更重要情况下的平价点。没有人期望塞门永远留在伯恩茅斯。事实上，几乎可以肯定他明年夏天就会离队，但前提是有条件由伯恩茅斯设定。塞梅尼奥因此以同意俱乐部策略的方式拒绝了曼联和热刺的目标，并签署了一份包含加薪和解密条款的新合同。塞梅尼奥表现出色。这样的表现如果他继续这样做，这位25岁的加纳国脚明年夏天的身价可能会比今年夏天的报价高得多，他的薪水可能会翻倍。伯恩茅斯明白为球员找到“正确的下一步”的重要性，不仅在转会费方面，而且在他们的待遇方面。塞梅尼奥全力投入本赛季，离开俱乐部的可能性也是他合同的重要组成部分。得益于周密的计划和足够的通知，伯恩茅斯能够对市场变化做出冷静的反应。他们拒绝了埃弗顿和西汉姆联队对塔维尼尔的报价，拒绝了水晶宫对布鲁克斯的800万英镑的报价，以及勒沃库森对贾斯汀·克鲁伊维特的2600万英镑的报价。塔维尼尔和布鲁克斯都是埃洛拉 (Elora) 的核心人物ctics，前者是更衣室的支柱。两名球员都以更高的薪水续签了合同，贾斯汀·克鲁伊维特的合同仍到2028年，并且刚刚将经纪人更换为超级经纪人阿里·巴拉特，这通常是未来转会的预兆。上赛季末，俱乐部就已经预计休伊森（拥有 5000 万英镑解约金条款）和凯尔·凯德离开。球队也知道凯帕不会留队。伯恩茅斯曾希望与这位切尔西门将签订永久合同，但最终凯帕选择前往阿森纳取代大卫·拉亚。伯恩茅斯在一月份签下了20岁的阿根廷后卫朱利奥·索莱尔，并开始与雷恩左后卫图尔菲尔特进行谈判，后者在以1440万英镑加盟后迅速成为球队的中流砥柱。这位23岁的球员有潜力，但尚未引起大球队的注意，这使他成为凯尔·凯兹的理想接班人。由于塞内西的受伤，休伊森只打了更多的时间，但他的表现却很出色。他的出色表现最终吸引了来自欧洲强队的竞争。伯恩茅斯知道他们必须接受带着解约金条款离开的现实，正是因为他们愿意加入这个条款，他们才从尤文图斯签下了他。他们还有塞尔维亚中后卫米罗萨夫列维奇（MyRosavljevic）提前完成（1300万英镑）。随着塞内西的回归和詹姆斯·希尔的替补，一切似乎都已确定，直到巴黎圣日耳曼以 5700 万英镑收购扎瓦尼。对于伯恩茅斯来说，这笔交易不仅意味着“更多的钱”，也并不能阻止球员加盟欧冠冠军的梦想。尽管埃洛拉提出批评，俱乐部仍按计划进行。不惊慌，不盲目增援。他们早在4月份就开始与里尔中后卫迪亚基特进行谈判，最终同意支付高于预期的3460万英镑的费用，而这笔费用全部由扎巴尼的转会收益支付。迪亚基特迅速适应英超并再次确认博厄恩茅斯成功的选择策略。同样的逻辑也适用于丹戈·瓦塔拉。俱乐部此前曾承诺，如果提供4000万英镑的报价，就会让他离开。他们并没有指望找到买家，但已经预先签定了替代者：摩洛哥国脚阿德利（1825万英镑）和利物浦球星本多库（2500万英镑）。因此，当布伦特福德提出报价时，伯恩茅斯已经有了两名继任者。此外，俱乐部通过出售西尼斯特拉、比林斯、米潘和特拉弗斯，优化了薪资结构，满足了英超的盈利能力和可持续发展标准，阵容更加健康灵活。管理层不想再次经历如此激烈的人来人往，但该业务却赚取了超过1亿英镑的利润。伯恩茅斯毫不掩饰自己是一家“商业俱乐部”的事实。他们永远无法在收入上与曼联或曼城竞争，因此他们必须依靠聪明的买卖来保持竞争力，而且他们我做得很好。俱乐部的“商业宣言”非常明确。加入我们，表现出色，您的职业生涯将会得到改善。如果有富有的俱乐部提出报价，我们会支持转会。伯恩茅斯提供了“完美的跳板”，但前提是球员们全力以赴。因此，他们宣布“所有球员留下”。如果是的话，会变得多强？伯恩茅斯？ “别管外界的质疑，因为留不住的球员会失去动力。他们的管理架构精简高效，只有老板比尔·弗利、足球运营总监蒂亚戈·平托、一线队技术总监西蒙·弗朗西斯和主教练伊劳拉。没有多余的组织层级和权力链，保证了反应的速度和一致性。伊劳拉的合同本赛季末到期，俱乐部渴望续约。” 他的合同，但教练希望等到赛季结束后做出决定，以便他可以专注于自己的工作。蒂让高级管理层有点担心。 Elara 是理想的人选，因为他们的运营模式依赖于善于帮助球员提高并亲自指导训练的教练。无论埃洛拉的野心是什么，伯恩茅斯都希望避免波特的命运，后者在布莱顿取得成功后转会到切尔西。没有人想到埃洛拉也会效仿。步，但其目前的状况已经近乎完美。尽管如此，伯恩茅斯可能已经为他可能的退出制定了后备计划。【咪咕独家观看英超联赛】
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。

发表在吃瓜热门 | 留下评论

DuraTech 2025创新大会11月3日在陕西西安开幕

苹果iOS 26.1下周发布：锁屏防止误触、液态玻璃透明度可调

中国航天科技点燃亚太青年“太空梦”

苹果最薄手机产品经理朱海洲谈iPhone Air：一旦用了就很难收回来了

Arm灵活接入解决方案特点Armv9计算平台

老黄推出Vera Rubin超级芯片！计算能力增加三倍，他们瞄准美国核武器实验室

通过判别式监督学习促进推理法学硕士，解决难度偏差和熵崩溃问题

非侵入性脑机接口公司Merge Labs OpenAI首席执行官准备利用声波读取大脑

徐正元：虽然我们犯了一个错误，把球翻了，但并不是所有人都放弃了。我们必须反思这一点，并为下一场比赛做好准备。

定位明确《电讯报》：伯恩茅斯在招募球员时会有长期计划

近期文章

近期评论

归档

分类