首页 > > 所有期刊 > 2020 > 202004 > 正文

抽样方法与样本数量对建筑能耗机器学习模型精度的影响研究

作者:朱传琪 田玮 史佳鑫 尹宝泉


关键字: 机器学习; 建筑能耗; 抽样方法; 样本数量; 模型精度;


摘要:

由于基于物理模型的建筑能耗模型计算成本较高,不适合直接用于不确定性、敏感性、模型校验等研究,通过机器学习算法建立的建筑能耗模型具有精度高和计算速度快的优点,可以解决这一问题。影响机器学习模型精度的因素有很多,本研究重点讨论样本数量和抽样方法对机器学习模型性能的影响。机器学习方法选用多元自适应回归样条法,以位于天津的办公建筑为例进行研究。结果表明,抽样方法对于机器学习模型精度的稳定性有较大影响,Sobol序列得到的模型精度的稳定性最好,通过随机抽样所得模型稳定性最差。随着样本数量的增加,建筑能耗机器学习模型的精度会随之增加,并且所得机器学习模型精度的稳定性也会随之提高。研究还发现,Sobol序列所得模型可实现精度与计算成本的平衡,非常适用于建筑能耗机器学习算法的模型构建。