对于监督学习内容,标签(label)是一个很重要的内容。有了数据(Data)和标签(Labels),就可以利用监督学习通用框架进行建模了。
1、标签的类型
(1)单列0-1值(二分类问题,一个样本只属于一类并且一共只有两类)
(2)单列连续值(单回归问题,要预测的值只有一个)
(3)多列0-1值(多分类问题,同样是一个样本只属于一类但是一共有多类)
(4)多列连续值(多回归问题,能够预测多个值)
(5)多标签(多标签分类问题,但是一个样本可以属于多类)
2、标签的设计
不妨设label为y,label的设计大致有两种:
(1)y = 1,2,3分别代表第1类、第2类以及第3类;
(2)y = [1 0 0],[0 1 0],[0 0 1]分别代表第1类、第2类以及第3类;
对于实际问题,我们通常采用第二种形式,因为第二种形式没有加入先验知识,第一种label的设计加入了距离信息,因此不适合作为label。
3、特征列
特征列 (Feature Column) - 一种说明估算器进行训练和推理所需特征的数据结构。
有关详细介绍戳TensorFlow 特征列介绍。
转载自原文链接, 如需删除请联系管理员。
原文链接:Label的设计以及特征列,转载请注明来源!