回归算法是用于预测连续数值的机器学习技术。他们是有监督的学习任务,这意味着他们需要标记的训练示例。
https://embed.notionlytics.com/wt/ZXlKd1lXZGxTV1FpT2lKbU9UTmpOR0psTWpnMFpXTTBZakZoWVdKbFlqazVaakEyTnpsaE1XSXlOeUlzSW5kdmNtdHpjR0ZqWlZSeVlXTnJaWEpKWkNJNklsZHNTR2hsVEZSUFdXeHpaVmRhUW1ZNU1YQmxJbjA9
案例:
以下是最常用的预测数值的算法的介绍:线性回归,决策树,神经网络和K最近邻
线性回归尝试将直的超平面拟合到最接近所有数据点的数据集中。当数据集中的变量之间存在线性关系时,这是最合适的。
优点:
可以使用正则化技术来防止过度拟合
缺点:
hyperplane(超平面) - 一维(1D)空间中的超平面是一个点。 在二维(2D)空间中,它是一条线。 3维(3D)空间中的超平面是一个平面,是一个平面。 为了泛化任何维度,该概念称为超平面。
线性关系 - 如果第一个变量的变化与第二个变量的恒定变化相对应,则关系为线性。
**过度拟合 -**过度拟合模型将在发现的数据中发现特定的有用功能后,对训练数据具有非常高的准确性。但是,由于无法泛化,它对测试数据的准确性较低。
非线性关系 - 非线性关系是指第一个变量的变化不一定与第二个变量的恒定变化相对应。但是,它们可能会相互影响,但这似乎是可以预见的。