分位数损失

Huan Lee Lv5

参考文章

  1. 使用分位数回归预测目标的取值范围
  2. 分位数损失(Quantile Loss)

场景描述

在大多数真实世界的预测问题中,我们常常希望得到我们预测结果的不确定度。通过预测出一个取值区间而不是一个个具体的取值点对于具体业务流程中的决策至关重要。于是提出了分位数的概念。分位数(英语:Quantile),亦称分位点,是指用分割点(cut point)将一个随机变量的概率分布范围分为几个具有相同概率的连续区间。
quantile_r(X) = b 等价于 P(X < b) = r

分位数回归

不同于普通的回归分析,分位数回归能够更好地表达数据的实际分布,对实际决策有重要意义。对下图来说,左右两个分布的期望值(预测值)相近,但是实际的分布有显著差距,因此在实际决策中需要考虑,这个时候就需要用到分位值。
分位数回归的意义
上下两条虚线基于0.05和0.95的分位数损失得到的取值区间。从图中可以清晰地看到建模后预测值得取值范围。分位数回归的目标在于估计给定预测值的条件分位数。实际上分位数回归就是平均绝对误差的一种拓展(当分位数为第50个百分位时其值就是平均绝对误差)
分位值

分位数损失

为了能够实现对分位数的预测,设计了如下的损失函数:
损失函数
其中γ是损失函数的参数,从实际意义上可以理解为是我们需要的分位数,这个损失函数从结构上看,就是以一定的概率γ惩罚预测值大于实际值,同时鼓励预测值小于实际值,这样的效果就是学得了目标y的γ分位数期望值。

  • Title: 分位数损失
  • Author: Huan Lee
  • Created at : 2022-06-18 14:19:14
  • Updated at : 2024-02-26 04:53:15
  • Link: https://www.mirthfullee.com/2022/06/18/分位数损失/
  • License: This work is licensed under CC BY-NC-SA 4.0.