美文网首页
会员数据分析1——数据整理

会员数据分析1——数据整理

作者: 秦_Eric | 来源:发表于2018-08-28 18:08 被阅读259次

最近做的一个会员数据分析,用Excel处理数据,总会遇到各式各样的问题。

1.CSV格式导入

客服团队从系统导出的数据基本为CSV格式,但是导出数据有错列的问题。数据量太小,就没有在请对方重新导出,而是自己处理。

CSV 空列

订单编号 "物流公司 " "物流单号 " "实际支付 " "订单状态 " "收货人姓名 " "用户注册时间 " "下单人手机 " "下单人生日 " "收货人省份 " "收货人城市 " "收货人地区 " "收货地址 " "邮政编码 " "物流方式 " "收货人手机 " "订单创建时间 " "商品标题 " "商品价格 " "商品数量 " "订单留言 " "支付流水号 " "备注 " "产品评分 " "服务专员评分 " "物流评分 " "订单建议 " "UID "

所有字段。

存在问题:

1.分隔符使用的是“,但因为错行的原因,导致多出了一个"。同时有部分记录错开,无法实现整列删除。

2.数据中有很多tab符号(不可见符)。

处理:

1.整理错行数据

2.删除空列

方法:

1.通过筛选,找出错行数据,直接向左拖拽。

2.因为空列较多,一列列的删除太麻烦。但Excel没有列筛选只有行筛选的功能,这里使用的是VBA脚本,脚本来源于Excelhome论坛。实现列筛选。统一删除。

其他问题:不可见符

不可见符(空值无法定位)

虽然没有C列没有数据,但定位空值是定位不到的,说明单元格内有不可见符。不同于空格(char(32))“ ”,不可见符是在编辑框中都无法看见的,常见的不可见符有:空字符(char(1))、制表符(tab符char(9))、换行符(char(10))、回车符(char(13))、HTML的空格(char(160))。

解决方法:

1.使用分列:当数据(只有几列)不多的时候,使用分列能将不可见符等去除。

2.当数据过多,最好用VBA脚本,不需要自己编写,网上还有很多现成的轮子可以套用。点击脚本例子

2.日期


注册时间字段

问题:

1.实际存储为文本格式,且有其他字符

2.数据颗粒度太细了。不需要精确到秒。

解决:

1.分列:单列数据用分列就可以了,注意需要右侧留出几列空白,防止其他数据被覆盖。

分列导出为YMD格式

2.增添年和月两个字段:使用日期函数提取年和月。year()、month()

实际分析:实际分析的时候需要用到注册字段,多以月为基本单位。

1.累计注册会员数

2.最近一个月的注册量

困扰:

因为Excel图表使用的是汇总数据,比如17年1-12月份注册会员数做一个折线图。在原表格上是无法直接出图的,必须要先整理出每个月的汇总数据,并整理成行列的二维数据。使用BDP(BDP个人版免费),可以不需要汇总数据,自动识别日期列。

以前觉得很多图表可以使用Excel制作,不需要花费时间学数据可视化软件(tableau、BDP、power BI)。Excel制作图表灵活度高,但是需要额外汇总,整理格式,适合为PPT配图。如果常规性数据监控使用的可视化,数据规整,非常适合使用tableau(tableau资源分享在后面)。

Excel作图需要汇总数据(一维数据) BDP直接使用原数据,自动识别

3.异常值

在注册时间和生日列,出现了异常值。

注册时间:最早时间显示为1970年,这显然是有问题。在问过电商团队后,了解到系统是在16年6月上线的,所以在此之前的注册时间都是有问题。注册时间是系统自动记录的,可能是系统刚上线时功能不健全。

处理方法是:删除16年6月以前数据。数据比较少,对总体影响不大。

生日:由用户自己填写,无法判定真假。有些极端值还是需要删除的,比如出生日期在1900年,2018年都是非常不合理的。

处理方法:不删除数据,在分析年龄构成时,去除年龄在一定阈值外的数据。比如保留16至100岁。

tableau资源:收费软件,可以申请public版(免费),或者在淘宝上购买。

链接: https://pan.baidu.com/s/1SE_HWTkGpD4OiFOsvZfhqA 密码: k2wx

BDP链接:https://me.bdp.cn/home.html   BDP

相关文章

  • 会员数据分析1——数据整理

    最近做的一个会员数据分析,用Excel处理数据,总会遇到各式各样的问题。 1.CSV格式导入 客服团队从系统导出的...

  • 会员数据化

    《Python数据分析与数据化运营》学习笔记 本书作者:宋天龙 1 会员数据化运营概述 会员数据化运营辅助于客户...

  • 销售数据分析 (python)

    分析思路: 1.了解数据 (1)对数据源的数据进行整理 (2) 数据导入到python (3)查看数据 - 数据有...

  • 如何在实际工作中使用数据

    (1)解读数据 掌握观察数据的“视点”(这是驾驭数据的基础) (2)基本的数据分析方法 掌握通用的整理和分析数据的...

  • 第二学段(3~4年级)

    【内容要求】 1.数据的收集、整理与表达 (1)经历简单的数据收集和整理、描述和分析的过程,了解简单的收集数据的方...

  • 第三学段(5~6年级)

    【内容要求】 1.数据的收集、整理与表达 (1)根据实际问题需要,经历数据收集、整理和分析的过程,能合理述说数据分...

  • 2018.10.10—工作复盘

    新进12个数据 整理最近所有的数据到会员跟进表

  • 数据处理工作经验总结

    审计工作常常用到数据整理,数据处理,数据分析,数据录入,数据导出。 当你需要数据录入工作,数据整理,数据处理,数据...

  • 数据清洗时的注意事项

    数据分析的流程:数据收集-数据整理-数据清洗-数据分析-数据展示 1.50%-60% 数据清洗时间,首先要明确本研...

  • 97、NumPy基础

    NumPy是高性能科学计算和数据分析的基础包 NumPy在数据分析中常用的功能: 1、用于数据整理和清理、...

网友评论

      本文标题:会员数据分析1——数据整理

      本文链接:https://www.haomeiwen.com/subject/ljpqwftx.html