美文网首页
Kaggle-共享单车项目分析

Kaggle-共享单车项目分析

作者: 一只努力的小白 | 来源:发表于2018-08-28 22:43 被阅读0次

项目链接:Bike Sharing Demand | Kaggle

思路:1.认识数据

           2.特征工程

           3.建模并预测

首先,是一个关于自行车租赁预测的题目,Kaggle提供的训练数据是一个月前19点的使用情况,需要预测20天之后的使用情况,数据从Kaggle中下载。

数据共有12列,12个属性的意义如下:

属性的含义

读入训练数据

导入库和读入数据 训练数据总览

12列数据,并且数据没有缺失值。

测试数据总览

测试数据一共有9列,没有缺失值。

为了方便后面做特征工程,将训练数据和测试数据拼接起来。

数据中给出的datetime是例如2011-01-01 00:00:00这样的格式的,为了分析数据,需要将时间分割出月、日、几时

代码 按月份来看用量 按小时用量

根据小时用量可以将时段分为5个:0~7,7~10,10~15,15~20,20~24

各月自行车用量 按星期和小时查看骑行情况

按季节查看骑行情况

按季节的用量情况

每个季节每天的使用情况

每个季节每天的使用情况 工作日与骑行情况

天气与骑行情况

天气与骑行量

随着天气恶劣,自行车用量也在逐渐减少,天气是一个很好的特征。

温度与用量

确实40度的使用情况,41度那么热,可是用量却非常大,可能数据有些异常

各特征相关系数

各特征相关系数

由上图看出,注册用户和非注册用户的自行车使用量相差挺多的,非注册用户的相关系数是0

.69,而注册用户的相关系数为0.97

注册用户用量 非注册用户

剔除离群点

这是一个回归问题,如果目标值服从正态分布比较好,原数据不符合正态分布,需要进行处理

原数据 处理后

虽然不是标准的正态分布,但比原来的数据看上去好一些。

结果

代码地址:GitHub - missbai119/Code




相关文章

  • Kaggle-共享单车项目分析

    项目链接:Bike Sharing Demand | Kaggle 思路:1.认识数据 2.特征工程 3.建模...

  • 共享单车项目分析

    项目来源:Bike Sharing Demand | Kaggle 一、提出问题 在本项目中,参与者被要求将历史使...

  • 共享单车项目分析

    简介:随着共享单车的星期,这次探索三大美国城市的自行车共享系统相关的数据:芝加哥、纽约和华盛顿特区,帮助共享单车公...

  • 共享单车还能火多久?

    ** 什么是共享单车 **现在提到共享单车,大家应该都不陌生,距离共享单车进入市场已有段时间。共享单车是共享经济的...

  • 共享XX

    共享电单车 芒果电单车 七号电单车 共享汽车 gofun 共享单车 摩拜 ofo bluegogo

  • 设计模式之享元模式

    享元模式,刚好现在共享单车火,拿来开刀 抽象共享单车 天朝小黄车 50斤的摩拜单车 共享单车类型 单车托管所 客户...

  • 押金把共享单车带入疯狂,如果消灭押金未来会怎样?

    共享单车有多火? 摩拜单车、ofo共享单车、酷骑单车、1步单车、由你单车、7号电单车、黑鸟单车、熊猫单车、云单车、...

  • ofo出事摩拜补刀共享单车之伤 别将共享单车提供给孩童

    共享单车可谓方便了生活,但因为共享单车所造成的隐患可不少,除了违章停车、共享单车被毁以外,最严重的要属共享单车用车...

  • 共享大乱炖,几多热闹几多喧嚣 | 借把伞

    一、主流共享产品:共享单车、共享汽车、共享雨伞等 1、共享单车 共享单车市场很稳定没有特别的新闻,反正前排名前两位...

  • 共享单车

    说起共享单车,那可谓是无人不知,无人不晓。作为共享经济的代表之一,共享单车最先火了起来。在共享单车的红火时代,共享...

网友评论

      本文标题:Kaggle-共享单车项目分析

      本文链接:https://www.haomeiwen.com/subject/ybltwftx.html