更新時(shí)間:2022-03-28 來源:黑馬程序員 瀏覽量:
數(shù)據(jù)解讀是數(shù)據(jù)分析師的基本功,如果不能充分理解數(shù)據(jù)分析中出現(xiàn)的各類指標(biāo)及術(shù)語,數(shù)據(jù)分析工作將很難展開。對(duì)于數(shù)據(jù)分析師來說,了解常用的分析指標(biāo)和術(shù)語是做好數(shù)據(jù)解讀的前提。本節(jié)將對(duì)數(shù)據(jù)分析常用指標(biāo)及術(shù)語進(jìn)行講解。
平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,包括算數(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、加權(quán)平均數(shù)、指數(shù)平均數(shù)等。通常我們?cè)谏钪兴f的平均數(shù)就是指算數(shù)平均數(shù)。
算數(shù)平均數(shù)是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以這組數(shù)據(jù)的個(gè)數(shù),它是反映數(shù)據(jù)集中趨勢(shì)的一項(xiàng)指標(biāo)。下面以計(jì)算叮叮網(wǎng)的日均UV為例進(jìn)行說明,如例1-4所示。
例1-4計(jì)算叮叮網(wǎng)的日均UV
假設(shè)叮叮網(wǎng)本周的UV數(shù)據(jù)如圖1-10所示,那么叮叮網(wǎng)本周的日均UV為:
(10002+9265+10016+10038+12065+9986+9564)/7=10048
在例1-4中,已經(jīng)給出了叮叮網(wǎng)本周每天的UV數(shù),按照算數(shù)平均數(shù)的算法將7天的UV數(shù)相加再除以7即可算出叮叮網(wǎng)本周的日均UV為10048。
案例中出現(xiàn)的UV(Unique visitor)即網(wǎng)站獨(dú)立訪客,是指通過互聯(lián)網(wǎng)訪問、瀏覽這個(gè)網(wǎng)頁的自然人,在后面的章節(jié)中還會(huì)對(duì)UV進(jìn)行詳細(xì)講解。
絕對(duì)數(shù)也是數(shù)據(jù)分析中常用指標(biāo)。統(tǒng)計(jì)中常用的總量指標(biāo)就是絕對(duì)數(shù),它是反映客觀現(xiàn)象總體在一定時(shí)間、地點(diǎn)條件下的總規(guī)模、總水平的綜合指標(biāo)。例如一定范圍內(nèi)糧食總產(chǎn)量、工農(nóng)業(yè)總產(chǎn)值、企業(yè)單位數(shù)等。
相對(duì)數(shù)又稱為相對(duì)指標(biāo),是通過對(duì)兩個(gè)有聯(lián)系的指標(biāo)計(jì)算得到的比值,它可以從數(shù)量上反映兩個(gè)相互聯(lián)系的現(xiàn)象之間的對(duì)比關(guān)系。相對(duì)數(shù)的基本計(jì)算公式為:
在上面的公式中,基礎(chǔ)數(shù)值是被用作對(duì)比標(biāo)準(zhǔn)的指標(biāo)數(shù)值,簡(jiǎn)稱基數(shù);比較數(shù)值是用作與基數(shù)對(duì)比的指標(biāo)數(shù)值,簡(jiǎn)稱比數(shù)。相對(duì)數(shù)一般是以倍數(shù)、百分?jǐn)?shù)等來表示,反映了客觀現(xiàn)象之間數(shù)量聯(lián)系的程度。
在使用相對(duì)數(shù)時(shí)需要注意指標(biāo)之間的可比性,同時(shí)要跟總量指標(biāo)(絕對(duì)數(shù))結(jié)合使用。
百分比是一種表達(dá)比例、比率或分?jǐn)?shù)數(shù)值的方法。它是相對(duì)數(shù)中的一種,也稱為百分率或百分?jǐn)?shù)。通常不會(huì)寫成分?jǐn)?shù)的形式,而是采用符號(hào)“%”來表示,如5%、40%、80%。因?yàn)榘俜直鹊姆帜付际?00,所以都已1%作為度量單位。
百分點(diǎn)則是指不同時(shí)期以百分?jǐn)?shù)的形式表示的相對(duì)指標(biāo)(比如指數(shù)、速度、構(gòu)成等)的變動(dòng)幅度。
在實(shí)際使用中一定要注意區(qū)分百分比與百分點(diǎn),比如本月某商品的轉(zhuǎn)化率為10%,而上月的轉(zhuǎn)化率是8%,那么可以說本月該商品的轉(zhuǎn)化率比上個(gè)月提升了兩個(gè)百分點(diǎn),而非百分之二或2%。
比例是一個(gè)總體中各個(gè)部分的數(shù)量占總體部分的比重,用于反映總體的構(gòu)成或結(jié)構(gòu)。例如A公司共有500名員工,男員工260名,女員工240名,那么男員工的比例為260:500,女員工比例為240:500。
比率是指樣本或總體中各不同類別數(shù)據(jù)之間的比值,因?yàn)楸嚷什皇遣糠峙c整體之間的對(duì)比關(guān)系,所以比率可能大于1。就像前面所說的例子,A公司有男員工260人,女員工240人,那么男員工與女員工的比率為260:240。
頻數(shù)也稱“次數(shù)”,指變量值中代表某種特征的數(shù)(標(biāo)志值)出現(xiàn)的次數(shù),頻數(shù)可以用表或圖形來表示。比如A公司有500名員工,其中有260名男員工,240名女員工,那么男員工的頻數(shù)為260,女員工的頻數(shù)為240。
頻率是指每組中類別次數(shù)與總次數(shù)的比值,它表示某個(gè)類別在總體中出現(xiàn)的頻繁程度。頻率一般用百分?jǐn)?shù)來表示,把所有組的頻率相加等于100%。還是以A公司的員工為例,260名男員工在500名員工中出現(xiàn)的頻率是52%,即(260÷500)×100%;而240名女員工在500名員工中出現(xiàn)的頻率為48%,即(240÷500)×100%。
倍數(shù)是指一個(gè)數(shù)除以另一個(gè)數(shù)所得的商,比如A÷B=C,就可以說A是B的C倍。倍數(shù)一般用來表示數(shù)量的增長(zhǎng)或者上升幅度,不適合用來表示數(shù)量的減少或者下降。
番數(shù)則是指原來數(shù)量的2的n次方,比如說公司今年的利潤(rùn)比去年翻了一番,意思就是今年的利潤(rùn)是去年的兩倍(2的1次方),今年的利潤(rùn)比去年翻兩番,意思就是今年的利潤(rùn)是去年的4倍(2的2次方)。
同比指的是與歷史同時(shí)期數(shù)據(jù)相比較而獲得的比值,主要是反映事物發(fā)展的相對(duì)性。例如A公司Q1銷售額同比增長(zhǎng)35%,意思就是今年第一季度的銷售額比去年第一季度的銷售額增加了35%,這就是同比。
環(huán)比是指與上一個(gè)統(tǒng)計(jì)時(shí)期的數(shù)據(jù)進(jìn)行對(duì)比獲得的值,主要是用來反映事物逐期發(fā)展的情況。例如A公司Q2銷售額環(huán)比增長(zhǎng)20%,表示該公司Q2的銷售額比Q1的銷售額增長(zhǎng)了20%。
電商運(yùn)營(yíng)怎么做數(shù)據(jù)分析?統(tǒng)計(jì)數(shù)據(jù)的工具和方法有哪些?
為什么使用python做數(shù)據(jù)分析?Python做數(shù)據(jù)分析的好處