文章目录
摘要:在机器学习中,我们的数据集往往存在各种各样的问题,如果不对数据进行预处理,模型的训练和预测就难以进行。这一系列博文将介绍一下机器学习中的数据预处理问题,以
U
C
I
\color{#4285f4}{U}\color{#ea4335}{C}\color{#fbbc05}{I}
UCI数据集为例详细介绍缺失值处理、连续特征离散化,特征归一化及离散特征的编码等问题,同时会附上处理的
M
a
t
l
a
b
\color{#4285f4}{M}\color{#ea4335}{a}\color{#fbbc05}{t}\color{#4285f4}{l}\color{#34a853}{a}\color{#ea4335}{b}
Matlab程序代码,这篇博文先介绍下缺失值处理,其目录如下: