美文网首页
sklearn-特征预处理之特征选择

sklearn-特征预处理之特征选择

作者: Jana_LU | 来源:发表于2019-08-23 22:17 被阅读0次

特征选择就是剔除与标注不相关或者冗余的特征,它是数据归约的思路之一(另一个思路为抽样)

特征选择主要包括三种思想:过滤思想、包裹思想和嵌入思想。

编程实现:

第一步,导入必要的包:

import pandas as pd

import numpy as np

import scipy.stats as ss

from sklearn.svm import SVR  #线性回归器

from sklearn.tree import DecisionTreeRegressor  #决策树回归

from sklearn.feature_selection import SelectKBest,RFE,SelectFromModel

第二步,导入一组DataFrame数据:

第三步,特征选择:

1.过滤思想:去掉相关性差的特征

过滤思想代码实现

2.包裹思想:构造简单模型,用线性回归器,每次迭代去掉一个弱特征

包裹思想代码实现

3.嵌入思想:利用回归方法,去掉系数比较小的特征,这种方法存在一定风险,因为可能导致重要特征被丢弃。

(SelectFromModel()必须要有feature_importances和coef_这两个参数才能用,但当数据量比较庞大又需要快速的找出特征的时候,可以用threshold来对样本数据进行简单的评估(threshold表示低于多少会去掉一个特征))

嵌入思想代码实现

相关文章

  • sklearn-特征预处理之特征选择

    特征选择就是剔除与标注不相关或者冗余的特征,它是数据归约的思路之一(另一个思路为抽样) 特征选择主要包括三种思想:...

  • 特征选择与特征学习算法研究--笔记1

    特征选择与特征学习算法研究 2.1特征选择 特征选择过程特征选择是对数据进行预处理的机器学习算法,通过从数据中筛选...

  • 小白的情感分析实战

    大神连接: 机器学习方法进行情感分析(详细步骤) sklearn- SelectKBest 特征选择---Sele...

  • 机器学习入门(猴子live)

    数据处理步骤 获得数据预处理数据特征提取特征选择和特征降维 数据预处理6个步骤 1.选择子集2.列名重命名3.缺失...

  • 特征工程

    数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限。特征工程对原始数据进行特征提取、特征预处理、特征选择等...

  • 用R语言实现遗传算法

    ——by不是杀杀 模式识别的三大核心问题包括: 特征数据采集与预处理 分类识别 特征选择与提取特征选择和提取的目的...

  • Python全栈工程师!要会哪些技术?全栈技术详解!最少五天掌握

    本章从商业数据分析和挖掘的角度详细地介绍了特征工程及其使用的响应方法:数据预处理、特征构造、特征抽取以及特征选择。...

  • 机器学习 —「特征工程」方法论

    什么是特征工程? 数据预处理 特征选择 降维 1. 什么是特征工程? 有这么一句话在业界广泛流传,数据和特征决定了...

  • 特征工程:特征预处理

    虽然现在深度学习非常盛行,它可以自动进行特征工程,但是实际工作中往往没有那么多数据量支撑你使用深度学习模型,因此对...

  • 特征工程-特征预处理

    特征工程 -Data PreProcessing(数据预处理)-Feature Extraction(特征提取)-...

网友评论

      本文标题:sklearn-特征预处理之特征选择

      本文链接:https://www.haomeiwen.com/subject/jvlxectx.html