開始學習數據分析,可能會一股腦沉迷于工具的學習使用,或是只有統計的數據分析,做了很多圖表,卻不能發現其中的業務問題;又或是沒有數據分析意識,經常會說我覺得,我認為,得不出什么建設性的結論。
不知道你在進階過程中是否也有這樣的癥狀?為了解決這樣的問題,我們就要去學習分析方法,結合業務更好地提出問題進行分析,而不是讓數據分析只是提數。
一. 分析方法知多少
1.什么是分析方法?
分析方法就是將零散的想法整理成有條理的思路。好比蓋房子需要事先有設計圖,這里的分析方法就好比設計圖作用,蓋房子需要有挖土機等工具,數據分析中需要Excel,SQL,Python等工具,道理是一樣的。
2.分析方法的作用?
分析方法幫助我們面對問題有分析的思路,面對一堆數據如何展開去分析以及面試中的業務問題如何去回答。
3.常用的分析方法?
根據場景和分析目的不同選擇不同的分析方法:
帕累托分析
又稱為二八法則,即百分之八十的問題是百分之二十的原因造成的。在項目管理中主要用于找出核心問題。核心問題發現、核心價值發現
舉個栗子,根據帕累托分析找出轎車銷量比較好的核心品牌。
從上面圖表我們可以看出在這些轎車品牌中,排名前4的占據了50%左右的銷售市場,排名前10的品牌占據了80%左右的銷售市場,這也正是我們要找尋的轎車品牌的核心品牌。當然,對于這張圖既然給出了梯度分級,其實可以進一步根據兩個分界點對各品牌進行分層(運用RFM模型)。
那么如何繪制帕累托圖呢?
首先,我們可以先觀察一下上圖表的一些主要特點:
柱形圖的數據按數值的降序排列,折線圖上的數 據有累積百分比數據,并在次坐標軸顯示;
折線圖的起點數值為0%,并且位于柱形圖第一 個柱子的最左下角;
由于起點為0%,圖表中百分比數據會比原始數據多一個,所以在準備數據時需要多準備一個0%
折線圖的第二個點位于柱形圖第一個柱子的最右上角 ;
折線圖最后一個點數值為100%,位于整張圖形 的最右上角。
我總結了在Excel中繪制帕累托圖的方法:
1. 首先你得確保你的數據表中統計值是降序排列,添加累計值列(利用sum函數),累計占比列,另外折線圖中點比柱狀圖多一個,所以要多準備一個點數據0%,放在累計占比列的最前面。我們需要用到的列為兩列:統計列和累計占比列。
2. 選中表區域-選擇圖表類型-選擇“組合”-對統計值選用柱狀圖,累計占比選用折線圖-并將折線圖類型勾選次坐標軸;
3. 對圖表做初步調整:選中折線圖-調整圖表右側縱坐標范圍調整為到100%;選中柱子-將柱子間隙寬度設置為0,并選中柱子-添加邊框(用于清晰區別顯示,通常選擇白色)
4. 初始累計占比需顯示0,需進行以下調整:選中折線圖-選擇數據-去查看每個類別的表數據范圍-進行修改系列名稱(當前列名)和系列值(對應表數據)
5. 發現折線初始位置不在0處,需要前移半步,進行以下調整:選中圖標-點擊“+”-在坐標軸選項勾選次要橫坐標
6. 選中次坐標軸-改坐標位置-選擇在坐標軸上,再修改上方的標簽位置為無;
7. 根據數據表中計算的累計值列的最大值,修改縱坐標范圍(調整最大最小值)
8. 選中折線圖-勾選數據標簽-查找80%大致位置,記下位置-去除標簽-單獨點擊剛剛記下的點-添加數據標簽
9. 突出顯示這80%的柱圖區,填充其為別的顏色以示區別。
需要脫位
RFM模型
模型的名稱定義可以根據具體的行業、場景進行命名。
RFM模型是衡量用戶價值和用戶創利能力的經典工具,依托于三個要素。分別如下所示:
R(Recency)最近一次消費時間:表示用戶最近一次消費距離現在的時間。消費時間越近的客戶價值越大。1年前消費過的用戶肯定沒有1周前消費過的用戶價值大。
F(Frequency)消費頻率:消費頻率是指用戶在統計周期內購買商品的次數,經常購買的用戶也就是熟客,價值肯定比偶爾來一次的客戶價值大。
M(Monetary)消費金額:消費金額是指用戶在統計周期內消費的總金額,體現了消費者為企業創利的多少,自然是消費越多的用戶價值越大。