基于XGBoost的大宗商品价格预测【摘 要】大宗商品已成为资产束缚与资产束缚的厉重实质,通过汇集数据发觉大宗商品 代价走势顺序,对辅助投资者采用适应的大宗商品举行投资等具有厉重的意思。著作通过待预 测的 6 种有色金属和 5 种辅助有色金属数据(包蕴 6 种日贸易数据),7 种墟市目标(包蕴 7 种日贸易数据)。办理的题目是正在切磋有色金属具有时序性的状况下,通过通晓靠山常识和对 数据的寻找,创筑了 7 类新的特质,并依据每一个待预测金属的分别待预测期间点的标签,筛 选出对该金属有着较大影响的特质。正在有用数据的筛选上,辨别采纳 2003—2017 年(缺失 钯、铂、银 3 种金属数据)和 2013—2017 年(包蕴悉数纽约金属贸易所的金属数据)成立 XGBoost 模子举行比较发觉,2013—2017 年模子的预测结果好于 2003—2017 年模子的预测结 果;正在模子采纳上,依据筛选分别金属的特质,成立 CatBoost、SVM、XGBoost 3 个模子举行 比较,结果显示 XGBoost 的预测结果彰着好于别的两个模子。于是,最终采纳 2013—2017 年 的数据和 XGBoost 行动练习数据和最终的模子,然后对每一种待预測金属成立模子(共 18 个),辨别预测百般金属正在 2018 年 1 d、20 d、60 d 的涨跌状况。
大宗商品电子贸易墟市行动一种新兴的贸易方法,对鼓动通畅新颖化、告竣通畅改进具 有厉重意思。目前,中邦经济的缓慢繁荣,稀奇是都市化、墟市化经过一直加疾,交易企业数 量陆续延长,变成对大宗商品墟市的庞杂需求。要是采用最直接也是最简明的大宗商品投资方 式,直接置备大宗商品举行投资,可以会形成很大的运输本钱和储蓄本钱,投资者很少采用这 样的方法。于是,通过汇集数据发觉大宗商品代价走势顺序,辅助采用适应的大宗商品举行投 资等有着厉重的意思 [1]。
华仁海等人(2004)应用协整检修和 Granger 因果检修步骤对邦外里期货墟市商品举行实 证检修,取得分别期货贸易之间可以存正在长远平衡闭连或协整闭连 [1]。曹旭等人(2017)基 于机械研习中的扶助向量机模子,采纳大宗商品中金融属性最强的黄金,对黄金代价举行预 测,并开端测验修建一个择时战略。结尾预测黄金代价的 SVM 模子,开端修建了一个择时交 易战略,并给出正在回测样本中的回测结果 [2]。陈宇韶(2018)提出将皮尔森特质筛选与 XGBoost 算法连合的预测步骤预测股票收盘价。以 A 股墟市 600677 股票为例,采用皮尔森相
闭连数领会法提取厉重特质,并天生高干系特质的数据集,再基于数据发现算法中呈现极为优 异的 XGBoost 框架,连合特质工程处置,博得杰出的练习预测成效 [3]。
biendata 竞赛供给了伦敦金属贸易所(LME)数据集、纽约商品贸易所(COMEX)数据 集、极少墟市目标(Indices)数据集、待预测金属的标签(Label)4 类数据集,每一类数据集 又分为练习集数据集和验证集数据集。
(2)标签分散。正在查看完悉数的数据后发觉,除了标签除外,悉数的数据均为络续性变 量,于是查看一下标签的分散状况,6 种有色金属的涨跌状况分散较为平衡。
(1)缺失值弥补。因为数据是基于期间序列举行转化的,要是对缺失值举行均值弥补或 者中位数弥补时,有可以会用到来自异日的数据,为了避免应用到异日数据而导致模子过拟 合,采用后值弥补,即应用前一天的非空值对当天的数据举行弥补 [4]。
(2)期间线筛选。对数据寻找之后发觉,除了纽约商品贸易所中的钯、铂、银 3 种金属 的根蒂数据损失吃紧,要到 2013-11-11,日贸易数据才较完好;其余的数据正在这个期间点后, 也都基础完好。于是,为了正在采用更众金属数据而舍弃 2003—2013 年的数据照样采用更长的 期间线 种金属之间做一个轻便的模子比较,一个是不包蕴钯、铂、银 3 种 金属的 2003—2017 年模子,一个是包蕴着 3 种金属的 2013—2017 年模子,都采纳 XGBoost 模 型,AUC 结果睹外 1。
通过比较发觉,2013—2017 年的模子比 2003—2017 年的模子成效要好良众,讲明对预测 金属来说,正在包管肯定数据量时,更众的干系金属品种数据的厉重性是大于过于长的期间、但 短少干系金属品种数据的,于是对有用数据的筛选期间线 特质工程
正在通晓股票涨跌、大宗商品干系的靠山常识和查看干系文献之后,基于有色金属的相闭 根蒂数据创筑 7 类特质[5]:range、hl、oc、MA、std_dev、rsi、Williams%