梯度提升模型在机器学习社区中脱颖而出,因为它们在众多用例(回归和分类)中取得了良好的效果。 尽管它们在预测中的使用受到限制,但近年来,已经表明它们可以取得非常有竞争力的结果。 使用这种类型的模型的一些优点是:

尽管它们具有潜在的优势,但在将机器学习模型应用于预测问题时,会出现一些问题,使分析师不愿意使用它们,主要是:

共享单车调度

共享单车系统是一种共享交通服务,其中单车可在短期内供个人共享使用。 许多单车共享系统允许人们从码头借用单车,然后在属于同一系统的另一个码头归还。 码头是特殊的单车位,可以锁定单车,只能通过计算机控制释放。

管理这些系统的主要挑战之一是需要重新分配自行车,以确保在所有码头都有可用的单车以及可供归还的空闲空间。

为了改进单车配送的规划和执行,建议创建一个能够预测未来 36 小时内用户数量的模型。 这样,在每天 12:00 时,负责管理系统的公司将能够了解当天剩余时间(12 小时)和次日(24 小时)的预期需求。 为了简化本文档中显示的示例,假设正在对单个站进行建模。

数据集

本文档中的数据代表 2011 年和 2012 年自行车租赁系统的每小时使用情况。除了每小时的用户数量外,还提供有关天气状况和节假日的信息。 原始数据已从机器学习存储库中获得,并且之前已应用以下修改进行了清理(代码):

生成的数据集包含以下列: