数据分析其实是个很难的活,你需要考虑从哪些方面去分析,然后每个方面分析哪些数据才能得到一些结论。我理解哪些方面就是维度,每个方面下的具体数据就是指标。
举例:我在小区门口开了个小卖部,我想分析一下近一个月内各商品的销售情况,以决定明天的进货量(假设我每个月进一次货)。
分析过程:
一、确定三个大维度
任何数据分析问题我都先拆解成三个维度:物,人,物+人;这里也就是商品,顾客,商品+顾客这三个大的维度。
二、大维度拆解成小维度
1.就商品而言,我需要了解:
A.一个月内商品的周转情况(进了多少货,卖出了多少);
B.一个月内,不同商品的盈利情况;
C.此外,我还想从局部看下每天的分布是怎样的。(总体+局部)
2.从顾客的角度,我想了解:
A.顾客的人口统计特征分布(顾客都是些什么人);
B.单顾客创造的营业额、利润分布(顾客花多少钱,我能赚多少);
C.单天客流量及访问时间段的分布(大家都什么时候来);
3.从商品+顾客的角度,我想看:
A.不同属性的用户,购买每类产品(零食,生鲜,日用品等)的转化,购买数量及分布(不同类别的人都最爱买什么);
B.不同(统计特征)属性的用户,不同商品类别带来的营业额、利润及其分布(不同类别的人都爱买什么,哪类人可以给我带来最高利润);
C.利润最高的用户,不同类别下购买时段的分布(利润最高的用户,都是什么时候来买东西)。
D.利润最高的用户,购买商品的分布(利润最高的用户,都爱买什么)。
三、小维度下的指标
1.就商品而言,需要分析的指标有:
A&B的统计指标:商品ID,商品名称,商品单价,商品大小(特大/大/中/小四档),总进货量,总销售量,总营业额,总成本,总净利润;统计时间:近一个月,按月统计。
C的统计指标:商品ID,商品名(筛选后),日期,销售量,营业额,净利润;统计时间:近一个月,按天统计。
2.就顾客而言,需要分析的指标有:
A&B的统计指标:顾客ID,性别,年龄,身份,月访问次数,月购买次数,月营业额,月利润;统计时间,近一个月,按月统计。
C的统计指标:顾客ID,日期,访问时间段,访问次数;统计时间,近一周,按天统计。
3.就顾客&商品而言,需要分析的指标有:
A&B的统计指标:用户属性类别,商品类别,月访问次数,月购买数量,月营业额,月利润;统计时间:近一个月,按月统计。
C的统计指标:用户属性类别,商品类别,日期,购买时间段,购买次数;统计时间,近一周,按天统计。
D的统计指标:用户属性类别,商品类别,商品名称,购买次数。统计时间,近一个月,按月统计。
四、添删改查
根据实际需求,投入产出比,优先级,对上述的维度进行筛选和修改;
根据业务需求,对上述维度进行补充,例如:上述分析第三部分主要分析了高利润用户的特性和习惯,但对未购买的用户,购买次数多但利润不高的用户分析较少。更好地满足高利润用户的需求,转化低(无)贡献的用户是两种不同的思路。
最后,上述数据如果能够结合模型和机器学习等智能分析手段,可以分析出更多更有价值的内容。如不同商品间的关联性(喜欢买A,B的人,都会喜欢买C),如不同类别用户之间的特性,大量购买XXX保健品的用户,一个月后都会大量购买婴儿产品(XXX保健品为孕期的常用保健品),如XXX季节,XXXX天气下,XXX和XXX商品的销量会激增。