北大DAIR实验室宣布:通用黑盒优化系统OpenBox开源发布
近日,由北京大学崔斌教授数据与智能实验室( Data and Intelligence Research LAB, DAIR)开发的通用黑盒优化系统 OpenBox 开源发布!
相比于 SMAC3,Hyperopt 等现有开源系统,OpenBox 支持更通用的黑盒优化场景,包括多目标优化,带约束优化场景等。在 25 个 LightGBM 调参任务上,OpenBox 在 7 个对比系统中取得了平均 1.25 名 (average rank) 的优异成绩。
相关论文已经被 KDD 2021 录用,"OpenBox: A Generalized Black-box Optimization Service"。
研究背景
近年来,人工智能与机器学习备受关注,越来越多企业使用机器学习模型解决实际问题,如人脸识别、商品推荐等。在应用机器学习模型的过程中,模型超参数的选择对模型性能有着至关重要的影响,因此超参数优化问题成为了机器学习的重要挑战之一。超参数优化作为典型的黑盒优化问题,对于优化目标不存在具体表达式或梯度信息,且验证代价较大。其目标是在有限的验证次数内,尽快找到全局最优点。除超参数优化外,黑盒优化还拥有着广泛的使用场景,如自动化 A/B 测试、数据库参数调优、处理器架构和芯片设计等。
现有开源的黑盒优化系统往往存在以下问题:
1)使用场景有限。由于系统基于某个特定算法,一些系统只能支持单目标或是无约束的优化问题;
2)性能不稳定。基于优化问题中“no free lunch”定理,现有系统中特定的算法无法在所有任务中表现出色;
3)有限的可扩展性。现有系统无法有效利用历史任务的结果以及分布式的验证资源。
针对这些问题,北京大学 DAIR 实验室 AutoML 项目组开发了一个名为“OpenBox”的轻量级黑盒优化系统,针对通用的黑盒优化场景,内置丰富的优化算法,并提供高效的并行支持,帮助用户“open the box”,解决棘手的黑盒优化问题。
项目 Github 开源地址:https://github.com/PKU-DAIR/open-box
OpenBox 设计思路
为了解决现有系统上述的问题,OpenBox 在设计上支持以下系统特性,包括:
多目标优化:同时优化多个不同(甚至相互冲突)的目标,例如同时优化机器模型准确率和模型训练/预测时间等。
带约束条件优化:最优化目标的同时,要满足(黑盒)条件,例如保证模型延迟不能高于某个阈值等。
多类型参数输入(FIOC):系统需要对多种待优化参数类型提供支持,主要为 FIOC,即浮点型、整型、序数型、类别型四类参数。例如超参数优化中,SVM 模型核函数用类别型表示,如果单纯用整型代替序数型或类别型参数,将对参数附加额外的序关系,不利于模型优化。
迁移学习:优化任务之间可能存在一定相关性,例如过去可能在不同数据集上进行过相同模型的调参。基于这种观察,系统需要能够利用过去优化的知识加速当前优化任务的执行效率。
分布式并行验证:内置算法支持并行运行,并且系统能够有效利用给定的分布式资源。
作者将现有系统对上述特点的支持情况总结如上 (其中△表示不支持通用场景)。从表格中不难看出,现有开源黑盒优化系统无法支持特定的使用场景,而 OpenBox 能够提供完整的支持。
上图展示了 OpenBox 的并行架构,包含五个主要组件。服务主机 (ServiceMaster) 负责节点管理、负载均衡和错误恢复。任务数据库 (Task Database) 保存所有任务的状态。建议服务器 (Suggestion Server) 为每个任务生成新配置。REST API 在用户/工作者和建议服务器之间建立了桥梁。验证工作者 (Evaluation Worker) 由用户提供和拥有。
OpenBox 内置大量优化组件,其中优化算法包括贝叶斯优化,遗传算法等,如下图所示:
北大 DAIR 实验室推出开源高效的通用黑盒优化系统 OpenBox
为简化用户的使用门槛以及提高系统在各问题上的性能,OpenBox 默认采用一种自动选择优化算法的策略,根据输入参数类型,目标个数,约束个数选择合适的优化算法。用户也可基于自身需求,在系统推荐的基础上自行选择优化策略。更多 OpenBox 的特性请参考开源文档:
https://open-box.readthedocs.io/zh_CN/latest/overview/overview.html
目前 OpenBox 已在快手、阿里巴巴集团等企业落地部署与使用。
OpenBox 性能验证
1、收敛效果对比
为体现 OpenBox 在通用黑盒优化问题上的性能,系统针对单/多目标,无/有约束,共 4 种场景对比 OpenBox 与现有算法与系统在优化数学函数上的效果,实验效果如下四图所示。可以看出在不同的优化场景中,OpenBox 相较现有系统都有较为显著的收敛效果提升。
2、端到端效果对比
针对实际场景,Openbox 以表格分类的机器学习任务为例,与现有开源系统 BoTorch,GPGlowOpt,Spearmint,HyperMapper,SMAC3,Hyperopt 进行对比。为保证公平性,Openbox 使用串行方式执行任务,并汇报调参结果在测试集上的准确率。以下展示使用 LightGBM 与 LibSVM 两个模型在 25 个 OpenML 公开数据集上的调参结果平均排名。值得注意的是,由于 LibSVM 的搜索空间复杂且包含条件选择,OpenBox 仅与支持复杂空间定义的 SMAC3 以及 Hyperopt 进行对比。
可以观察到 OpenBox 在两个模型调参中均获得了优异的性能。具体来说,OpenBox 在 Lightgbm 调参中排名中位数为 1.25,在 LibSBM 调参中为 1.50,体现了 OpenBox 相比其它开源系统在超参数优化任务中的优势。
(a) AutoML 任务 LightGBM 优化结果
(b) AutoML 任务 LibSVM 优化结果
3、并行性能对比
OpenBox 支持高效的并行优化算法,使得在达到相同的优化效果的前提下,所需要的时间代价大幅降低。下图展示了使用 OpenBox 中并行优化算法在 LightGBM 调参任务上的提升,使用的数据集为公开数据集 optdigits 。其中“Sync”表示同步并行,“Async”表示异步并行,“-n”表示并发度。
可以观察到,相比串行优化(Seq-1),并行能够带来很大程度上提升搜索效率。其中最显著的提升来自于并发度为 8 的异步优化算法,在达到与串行方法相同的优化结果时仅使用 1/80 的时间预算,也即实现 7.5× 的加速比。(理想加速比为 8×)
更多关于 OpenBox 的实验结果,请参考 OpenBox 论文:
https://arxiv.org/abs/2106.00421
OpenBox 使用示例
目前 OpenBox 支持主流平台(Linux、macOS、Window)使用。用户只需在代码中定义空间,给出目标函数,构造优化器即可运行。以下以一个简单的多目标带约束问题为例:
首先,我们需要 import 必要的组件:
接下来,我们定义一个包含两个连续变量的搜索空间:
随后,我们给出一个简单的以上述两个变量为输入的目标函数。这个目标函数包含两个目标以及两个约束:
最后我们定义一个优化器,传入指定的参数后,只需调用 run () 即可开始优化。
除了上述包调用的方法,OpenBox 还支持用户通过接口访问服务,从服务端获取推荐的参数配置,在本地执行参数性能验证,并通过访问网站页面,可视化监视与管理优化过程。
完整的示例以及更多的使用场景,欢迎参考 OpenBox 官方文档:
https://open-box.readthedocs.io/zh_CN/latest/
论文地址:https://arxiv.org/abs/2106.00421
项目 Github 地址:https://github.com/PKU-DAIR/open-box
欢迎大家关注点赞!
参考文献
[1]Yang Li, Yu Shen, Wentao Zhang, Yuanwei Chen, Huaijun Jiang, Mingchao Liu, Jiawei Jiang, Jinyang Gao, Wentao Wu, Zhi Yang, Ce Zhang, Bin Cui. "OpenBox: A Generalized Black-box Optimization Service." Proceedings of the 27rd ACM SIGKDD international conference on knowledge discovery and data mining. 2021.
[2] Bergstra, James, et al. "Algorithms for hyper-parameter optimization." Advances in neural information processing systems 24 (2011).
[3] Snoek, Jasper, Hugo Larochelle, and Ryan P. Adams. "Practical bayesian optimization of machine learning algorithms." Advances in neural information processing systems 25 (2012).
[4] Hutter, Frank, Holger H. Hoos, and Kevin Leyton-Brown. "Sequential model-based optimization for general algorithm configuration." International conference on learning and intelligent optimization. Springer, Berlin, Heidelberg, 2011.
[5] Balandat, Maximilian, et al. "BoTorch: A framework for efficient Monte-Carlo Bayesian optimization." Advances in Neural Information Processing Systems (NeurIPS) (2020).
[6] Knudde, Nicolas, et al. "GPflowOpt: A Bayesian optimization library using tensorflow." arXiv preprint arXiv:1711.03845 (2017).
[7] Golovin, Daniel, et al. "Google vizier: A service for black-box optimization." Proceedings of the 23rd ACM SIGKDD international conference on knowledge discovery and data mining. 2017.
[8] Nardi, Luigi, David Koeplinger, and Kunle Olukotun. "Practical design space exploration." 2019 IEEE 27th International Symposium on Modeling, Analysis, and Simulation of Computer and Telecommunication Systems (MASCOTS). IEEE, 2019.
[9] Falkner, Stefan, Aaron Klein, and Frank Hutter. "BOHB: Robust and efficient hyperparameter optimization at scale." International Conference on Machine Learning. PMLR, 2018.
相关阅读
-
地产、基建板块走强,中证1000指数ETF(159633)成交金额已超5.7亿,北辰实业、中华企业、鸿路钢构集体大涨
截至发稿,中证1000指数ETF(159633)跌0 77%,场内交投活跃,成交金额
2023-06-08 -
今日看点:港股通医药ETF(513200)成交金额已超7500万,国药控股、威高股份、石药集团飘红
截至发稿,港股通医药ETF(513200)微跌0 11%,成交金额7522万元;重仓
2023-06-08
精彩推荐
阅读排行
相关词
- 段林希简介_段林希是谁 焦点观察
- csgo第一次开箱子怎么开?csgo新号开箱子好出金吗?
- 今日看点:港股通医药ETF(513200)成交金额已超7500万,国药控股、威高股份、石药集团飘红
- csgo开箱子还是直接买?csgo箱子需要买吗?
- 《自由篮球》选秀赛季全新上线 泰山乔商店好礼派发 全球热资讯
- 天天热议:《跑跑卡丁车》竹片持续放送中 个人RP赛回归
- csgo游戏内如何开箱子?csgo每个箱子都能开出什么?
- 人民银行:长期坚持稳健货币政策 中国金融周期相对稳健
- 【全球快播报】喝咖啡真的能提神吗
- 每日精选:淘宝卖家的基本义务是什么啊_淘宝卖家的基本义务是什么
- 周小川:上海国际金融中心建设着力点应放在资本市场主力产品上|焦点滚动
- csgo有什么开箱网站?csgo开箱网站是什么原理?
- 再次震荡?游戏ETF(159869)盘中一度跌超4%
- 地产、基建板块走强,中证1000指数ETF(159633)成交金额已超5.7亿,北辰实业、中华企业、鸿路钢构集体大涨
- csgo开箱子出什么?csgo一天掉几个箱子?
- 《星辰变》第五季第十五集:白凤和白馨下线,引发观众共鸣和热议
- csgo开箱网站打不开是怎么回事?csgo开箱网站有什么用?
- 世界快讯:边缘计算市场规模将达4450亿美元,边缘AI打开行业想象空间!奥拓电子两连板
- 通讯:“中国为我打开机遇之门”——一个洪都拉斯青年的中国情缘
- thinkpadt480蓝屏怎么解决 环球观天下
- 全球时讯:中国星辰|中国人登月如何实现?
- csgo网站开箱流程是怎样的?csgo哪个网页可以开箱?
- 环球热资讯!hticons.dll丢失如何自动修复
- csgo开箱子哪个好?csgo最保值的箱子是什么?
- 飞猪:端午出游预订节奏大幅提前 跨省游订单占比近9成
- csgo怎么打开箱子?csgo哪里买箱子钥匙最便宜?
- 外星袭击什么时候出 公测上线时间预告
- 哪些方法可以还原sd卡内的数据_热点
- csgo每天免费开箱方法是什么?csgo开箱出金概率高吗?
- 如何修复缺少fwbase.dll文件的问题
- csgo开箱子机制是怎样的?csgo箱子对应刀清单
- F4蓝屏代码出现应该采取什么应对方法
- 炖鸡的做法大全视频教程(炖鸡的做法大全) 播资讯
- csgo开箱子推荐哪一个?csgo怎么卖箱子?
- csgo幸运开箱网有哪些?csgo开箱网站可以提刀吗?
- 重庆市长寿区五部门联合开展互联网危险化学品专项治理行动|世界实时
- 江西省新余市持续开展“三项行动”夯实消费品质量基础|天天热门
- csgo如何免费开箱?csgo开箱一定要钱吗?
- 诺基亚c500有wifi功能吗(诺基亚c500) 观速讯
- 英雄机长刘传健护航 成都大运会火种飞赴北京_天天观察
- 全球视讯!随着天空变成红色 《暗黑4》的宣发变得像是真的
- 艺术 | 外交顶流京剧《白蛇传》你看过吗?
- 全球即时看!南航伦敦至北京大兴直飞航线正式开通
- csgo开箱子秘诀是什么?csgo开哪个箱子划算?
- 电脑启动时蓝屏出现字母是否与驱动有关_世界观热点
- 意义非凡的爱地希:展现新一代ADC药物的卓越疗效
- 全球今热点:【2023高考】考点内外“双保障” 他们每天为高考“服务”近10小时
- csgo开箱价格是多少?csgo开什么箱子容易出刀?
- 价格跌至前低,创业板成长ETF(159967)连续7天获资金 环球关注
- 世界简讯:明星三缺一2005百度云(明星三缺一2006)
- 充满算计!日美澳在南太铺光缆,日媒炒“抗衡中国影响力”|当前通讯
- AI医疗大模型MedGPT发布,医药ETF(512010)成_天天快资讯
- 海南核电自备码头改造圆满完成工程竣工验收
- 无人机巡视、红外测温…… 上海电力“设备主人”护航高考
- 河南已收获小麦7506.8万亩,约占全省种植面积的88%
- 每日看点!上月房企融资数据继续“缩水” 6月份约349亿债券到期
- 我想完美的皮肤官网在哪下载 最新官方下载安装地址
- csgo开箱歌曲有哪些?csgo开箱沙雕音乐分享
- csgo开箱教学来了 csgo可以免费开箱吗?
- 弹幕射击游戏《弹幕无限3》将于6月13日登陆PS4|世界观点
- 厦门外贸自主品牌培育入选外贸新业态优秀实践案例
- csgo开箱攻略有哪些?csgo开箱子能赚钱吗?
- 环球即时看!广东自贸试验区八年固定资产投资超1万亿
- 中国专家最新研究证实:肠癌相关标准治疗方案非普遍适用|全球热消息
- 世界通讯!生存游戏《浩劫前夕》发布全新预告视频 将重新上架Steam
- 北交所上市公司迈入“200+”时代
- 全球热推荐:护航“平安高考” 大兴安岭市场监管部门在行动
- 《原子之心》发布首个DLC敌人前瞻预告 今年夏季发售
- 广西来宾市市场监管局开展药品不良反应监测有成效
- 四川省遂宁市蓬溪县市场监管局开展“儿童用品安全行”主题宣传活动-要闻速递
- csgo开箱秘籍是什么?csgo开箱小技巧了解一下
- 报道:双星新材董秘回复:短期波动受到多种因素影响,因坚定自身而努力发展,公司持续深耕新材料发展,积极调整产品结构
- 双星新材董秘回复:公司一直在不断优化产品结构,对普膜产品持续结构调整
- 贝云科技“点亮”伦敦设计双年展 LUZENSE探索“情绪照明”
- csgo能不花钱开箱子吗?csgo一周可以掉落几个箱子?
- 《影子武士3:最终版》发布新版本更新 改善整体视觉效果
- 云南:总投资1916.75亿元,141个新项目完成签约|全球热资讯
- csgo开箱子网址有哪些?csgo能在手机上开箱子?
- 焦点报道:2023中国·天门服装电商产业峰会将召开
- 海泰新光董秘回复: 公司第一代产品没有在市场上进行大量推广,这是与公司的产品和市场定位有关|热点在线
- csgo可以去哪开箱?csgo公认最好的开箱平台介绍
- 事关耕地红线!浙江推进“进出平衡” ,严控一般耕地转为其他农用地
- 焦点简讯:金桥信息(603918)6月8日14点41分触及涨停板
- 祥生医疗董秘回复: 祥生医疗主营业务为超声医学影像设备研发、制造和销售
- 环球速看:海南昌江一湿地公园首次记录到六只紫水鸡幼崽同框
- csgo开箱子钥匙如何获得?csgo怎么得到箱子?
- 无人机巡视、红外测温…… 上海电力“设备主人”护航高考 快消息
- 全球关注:港元拆息普遍上升 一周及两周利率结束六连跌
- 中国科传(601858)6月8日14点44分触及跌停板|环球滚动
- csgo手机开箱子可行吗?csgo开哪个箱子划算?
- 《麦登橄榄球24》Steam页面上线 游戏暂不支持中文
- *ST京蓝(000711)6月8日14点44分触及涨停板 每日消息
- 法国反对北约在日本设立办事处
- csgo开箱见金必中吗?csgo良心开箱网站分享
- 焦点快看:广东:向海图强 激发蓝色经济新动能
- 上海市历史博物馆与俄罗斯国家历史博物馆签订友好合作备忘录
- 河北井陉:保护古村风貌 留住乡愁古韵
- 日播时尚(603196)6月8日14点35分触及涨停板
- 泉峰汽车: 公司控股股东及一致行动人自公司上市以来从未减持公司股票|全球讯息
- csgo全球开箱网站有哪些?csgo开箱靠谱吗?
- 每日热议!75年后,新疆考古第一人黄文弼《罗布淖尔考古记》崭新再版
- 天天新消息丨星火成炬 | 此去,桃李满天下!
- 第七届平遥国际电影展面向全球征集华语剧本项目 天天快报
- 全球热文:洪都拉斯总统特别助理:期待访华增进双边关系
- “新歌唱新疆”巡演首场在乌鲁木齐举办
- 四书五经指什么 四书五经指什么生肖?
- 深圳阳光整形美容医院怎么样_是三甲医院吗
- 手机评测排名2022:不同价位段中的最佳选择
- 海泰新光董秘回复: 谢谢您对公司的持续关注,也感谢您对公司的理解和支持-播报
- csgo开箱回本率是多少?csgo开箱微信支付在哪里?
- 向海图强!海洋经济“扬帆远航”-今日热搜
- csgo开箱梗是什么?csgo怎么批量开箱?
- 每日看点!更宽敞!我国新一代载人飞船可坐7人,将实现回收技术
- 微信群待办怎么发 微信群待办怎么发起-天天微速讯
- csgo开箱玄学有哪些?csgo开箱看见金了必出吗?
- Win11永劫无间蓝屏出现应该如何应
- 雾霾蓝连衣裙配什么鞋子 雾霾蓝连衣裙搭配什么鞋子-世界讯息
- 深圳友华普惠眼科怎么样 手术案例效果证明一切_全球实时
- 每日热文:通讯:“中国为我打开机遇之门”——一个洪都拉斯青年的中国情缘
- csgo开箱多少钱一个?csgo开箱模拟器推荐
- 日本民众举行抗议活动 反对政府排放核污染水入海_环球时快讯
- 离婚协议书的格式 离婚协议书的格式怎样写图片
- 潘功胜:中国坚持稳健的货币政策是金融周期相对稳健的原因-短讯
- 全球要闻:普通话手抄报内容大全_普通话手抄报内容精选
- CPU蓝屏一进系统就重启该如何解决
- 热点评!公安部交管局公布近期三轮车肇事肇祸典型交通事故案例
- 海南司机 今日高考英语听力考试期间途经考点禁止鸣笛-世界视点
- 长三角铁路端午小长假预计发送旅客1500万人次
- 妄想山海营地怎么升级(妄想山海营地如何升级) 环球即时看
- 什么是新零售的前端表象(新零售的表现形式)
- 怎样快速去黑眼圈_怎么去除黑眼圈|世界聚看点
- api-ms-win-core-bicltapi-l1-1-0.dll文件丢失如何修复?|热点在线
- xmllite.dll文件被破坏怎么办|天天微动态
- 一公顷等于多少平方千米_等于0.01平方分米
- 星球神偷官网在哪下载 最新官方下载安装地址
- 今日热搜:和平精英第十周任务怎么完成 任务完成技巧方法详解
- “国企领导牵手门”最新进展:牵手门涉事女子已被停职并接受调查
- 如何解决msprivs.dll报错丢失问题 环球热头条
- 前沿资讯!英语四级多少分及格_英语四级简介
- 灵显第一季_关于灵显第一季介绍 焦点日报
- 国服csgo如何开箱?csgo国服开箱方法介绍
- 河南省开封市龙亭区市场监管部门就定量包装茶叶过度包装问题开展专项检查和行政指导
- 天天速读:安徽省市场监管局推进法治政府建设结硕果
- 7b蓝屏怎么解决
- 新知青_关于新知青简介
- 深圳思莉医疗美容门诊部怎么样 真实情况在线获取-全球播报
- 新石器_关于新石器简介 环球热点
- csgo去哪开箱?csgo新人玩家开箱攻略
- 端午假期火车票6月8日开售,年轻人寻找下一个“淄博”
- 视焦点讯!童年好词好句好段_童年好词好句好段总结