美文网首页推荐系统
Hulu推荐算法-特征工程

Hulu推荐算法-特征工程

作者: Howyi | 来源:发表于2020-07-25 15:35 被阅读0次

推荐算法的第二节课特征工程是有广告组的同学讲,还是比较基础并且浅显易懂(可能我之前有学过统计学的缘故吧)。我会总结一下特征工程的知识点。


Screen Shot 2020-07-25 at 3.34.55 PM.png

这张图很好总结了如何从0开始构建机器学习模型的过程。做一个机器学习项目,可能要花大量的时间在理解问题,把问题转化为现有的AI问题,然后通过特征工程技术选择好的特征进行学习。学过深度学习的同学可能觉得深度学习可以解决特征工程,但深度学习的黑箱原理无法解释模型。

特征工程

特征设计(是否可能得到有用并且部署在线上的特征)

  1. 头脑风暴
  2. 询问有项目经验的专家

特征转化

1.离散特征(男女)(one-hot编码,multi-hot编码)
2.数值特征(年龄)(使用归一化或者标准化,让模型更好收敛并且把所有特征转成同一量纲)
3.时间特征(早上,下午)
4.文字特征(NLP)

  1. 统计类特征(方差)

特征选择(选择和最后结果最相关的特征)

1.过滤(通过皮尔逊系数,开森检验,找到相关性最强的N个特征)
2.包装法(通过AIC,BIC删除一些不重要的特征)
3.向量化(增加正则化L1等)

注意:如果发现特征太强的话,可能会发生信息泄露,那同样不是一个好的特征。信息泄露包含特征泄露和数据泄露两种。数据泄露指训练集可能包含未来做预测的数据。解决数据泄露的手段是尝试不同的数据划分。

通过树模型做特征选择

Facebook 提出了GBDT加LR的算法,GBDT做特征工程,让LR训练。


GBDT_LR.png

为什么特征工程还是很重要

1.模型的准确性(模型的交叉可能会导致噪音)
2.模型的高效性(简单模型可能高效地服务化)
3.模型的可解释性(深度学习模型提取的特征太过抽象,可解释性不强)

相关文章

  • Hulu推荐算法-特征工程

    推荐算法的第二节课特征工程是有广告组的同学讲,还是比较基础并且浅显易懂(可能我之前有学过统计学的缘故吧)。我会总结...

  • 阿里巴巴搜索事业部推荐算法内推

    【阿里巴巴 - 推荐算法】组内直聘 推荐算法工程师 机器学习专家【阿里巴巴 - 推荐算法】组内直聘 推荐算法工程师...

  • sklearn库-特征工程

    sklearn作为python机器学习的一个常用库,可以用来做特征工程,算法的调用,模型的评估 特征工程 特征工程...

  • [Deep Learning] 特征工程

    特征工程(Feature Engineering)是从原始数据中创造新的特征以提升算法学习效果的过程。特征工程与特...

  • 特征工程

    做多模态融合需要特征工程知识,所以来学特征工程,最近还要学深度学习算法,统计学方法,好多东西要学!特征工程入门的介...

  • 数据挖掘常用算法

    数据挖掘常用算法 逐步补充中... 特征工程 特征工程在实践中是很重要的一个环节,其中主要是特征提取(...

  • 2019-02-27

    内容为西瓜书的第10章特征选择和第11章特征降维。 1 在机器学习工程中,特征工程才是最重要,特征决定着算法的上限...

  • 数据挖掘中的关联关系+Apriori算法+FPGrowth算法

    推荐系统中常用的几种算法: 基于内容的推荐(静态):内容特征表示,特征学习,推荐列表 基于协同过滤的推...

  • 特征工程之特征标准化(Normalization)

    特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为算法和模型的输入。从本质上来说,特征工程是...

  • 无标题文章

    python 机器学习 预测分析核心算法 特征提取和特征工程 确定哪些特征可用于预测也需要尝试。这个过程就是特征提...

网友评论

    本文标题:Hulu推荐算法-特征工程

    本文链接:https://www.haomeiwen.com/subject/wqfmlktx.html