使用自定义 SAS 宏进行特征缩放和转换的技术

Read your topic about the phone number list
Post Reply
seoexpertshagor
Posts: 103
Joined: Thu Feb 02, 2023 6:30 am

使用自定义 SAS 宏进行特征缩放和转换的技术

Post by seoexpertshagor »

在之前的博客文章中我们讨论了特征缩放技术并使用 SAS 宏在 Base SAS 中实现了这一点。然而,在这篇博文中,我们将重点关注使用 SAS 宏的特征缩放和转换技术。在这里我将解释它们是什么以及它们最适用的场景。 five.绝对最大缩放器 绝对最大缩放器 (Abs_MaxScaler) 是一种特征缩放技术,其中数据点除以最大数据值。然后它将重新调整 -1 和 1 之间的值。 虽然 Abs_MaxScaler 有其优点,但也有一些缺点。Abs_MaxScaler 最大的缺点是数据值会受到离群值的影响。数学公式在这里: 5.1 如何在 SAS 中使用 Abs_MaxScaler? five.2 Abs_MaxScaler SAS 宏定义 Abs_MaxScaler SAS 宏在幕后做了什么? Abs_MaxScaler 获取您要缩放的变量并创建一个具有缩放值的新变量“AMVariableName”。它还会创建一个单变量报告,您可以在其中查看实际变量和新缩放变量的直方图。

第 -2 部分——特征转换 我将讨论遵循正态分布也称为高斯分布的特征转换技术。在讨论的同时,我还将使用一些高级SAS 宏编程在基础 SAS 中实现特征 喀麦隆电话号码列表 转换。 什么是特征转换? 它是在统计和数学函数的帮助下,将数据从一种表示形式转换为另一种表示形式的过程,同时还保留数据中的信息。有许多不同的变换可以将数据分布转换为正态分布,但我主要使用五种基本变换:对数、倒数、平方根、指数和 Box-Cox。 为什么我们需要特征转换? 特征转换很重要,因为它使机器学习和统计模型更容易理解您的数据并做出准确的预测。此外,用户需要更少的学习和培训时间来获得所需的结果;然而,这并不适用于所有 ML、DL 和统计算法。

Image

有一些统计算法和模型假设数据呈正态分布例如回归分析特征变换必须服从正态分布,否则会得出错误的结果。 特征转换的类型 1. Log Transformation:当数据倾斜或存在影响分布的异常值时,此转换是最佳解决方案。它将使用日志功能转换数据。 2. Reciprocal Transformation:当我们将它与其他变换进行比较时,这种变换不是很有效,因为它对分布的形状影响不大。它将数据转换为其值的倒数。例如,3 将转换为 1/three。它仅用于非零数据值。 3 、指数变换:用大多数编程语言中给出的exp()函数将数据转换成“e的x次方”。 4.平方根变换:顾名思义,它将数据值转换为其值的平方根,这意味着我们可以将其应用于零值数据。应该注意的是,平方根变换不如对数变换有效。这是因为与对数转换相比,它对分布的影响较小。 5. Box-Cox Transformation:对于Box-Cox Transformation,数据值必须为正。
Post Reply