統(tǒng)計(jì)學(xué)作為一門方法論科學(xué),具有自己完善的方法體系。統(tǒng)計(jì)研究的具體方法有很多,這將在后續(xù)課程中學(xué)習(xí),而從大的方面看,其基本研究方法有:
一、大量觀察法
這是統(tǒng)計(jì)活動(dòng)過程中搜集數(shù)據(jù)資料階段(即統(tǒng)計(jì)調(diào)查階段)的基本方法:即要對所研究現(xiàn)象總體中的足夠多數(shù)的個(gè)體進(jìn)行觀察和研究,以期認(rèn)識具有規(guī)律性的總體數(shù)量特征。大量觀察法的數(shù)理依據(jù)是大數(shù)定律,大數(shù)定律是指雖然每個(gè)個(gè)體受偶然因素的影響作用不同而在數(shù)量上幾存有差異,但對總體而言可以相互抵消而呈現(xiàn)出穩(wěn)定的規(guī)律性,因此只有對足夠多數(shù)的個(gè)體進(jìn)行觀察,觀察值的綜合結(jié)果才會(huì)趨向穩(wěn)定,建立在大量觀察法基礎(chǔ)上的數(shù)據(jù)資料才會(huì)給出一般的結(jié)論。統(tǒng)計(jì)學(xué)的各種調(diào)查方法都屬于大量觀察法。
二、統(tǒng)計(jì)分組法
由于所研究現(xiàn)象本身的復(fù)雜性、差異性及多層次性,需要我們對所研究現(xiàn)象進(jìn)行分組或分類研究,以期在同質(zhì)的基礎(chǔ)上探求不同組或類之間的差異性。統(tǒng)計(jì)分組在整個(gè)統(tǒng)計(jì)活動(dòng)過程中都占有重要地位,在統(tǒng)計(jì)調(diào)查階段可通過統(tǒng)計(jì)分組法來搜集不同類的資料,并可使抽樣調(diào)查的樣本代表性得以提高(即分層抽樣方式);在統(tǒng)計(jì)整理階段可以通過統(tǒng)計(jì)分組法使各種數(shù)據(jù)資料得到分門別類的加工處理和儲(chǔ)存,并為編制分布數(shù)列提供基礎(chǔ);在統(tǒng)計(jì)分析階段則可以通過統(tǒng)計(jì)分組法來劃分現(xiàn)象類型、研究總體內(nèi)在結(jié)構(gòu)、比較不同類或組之間的差異(顯著性檢驗(yàn))和分析不同變量之間的相關(guān)關(guān)系。統(tǒng)計(jì)學(xué)中的統(tǒng)計(jì)分組法有傳統(tǒng)分組法、判別分析法和聚類分析法等。
三、綜合指標(biāo)法
統(tǒng)計(jì)研究現(xiàn)象的數(shù)量方面的特征是通過統(tǒng)計(jì)綜合指標(biāo)來反映的。所謂綜合指標(biāo),是指用來從總體上反映所研究現(xiàn)象數(shù)量特征和數(shù)量關(guān)系的范疇及其數(shù)值,常見的有總量指標(biāo)、相對指標(biāo),平均指標(biāo)和標(biāo)志變異指標(biāo)等。綜合指標(biāo)法在統(tǒng)計(jì)學(xué)、尤其是社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)中占有十分重要的地位,是描述統(tǒng)計(jì)學(xué)的核心內(nèi)容。如何最真實(shí)客觀地記錄、描述和反映所研究現(xiàn)象的數(shù)量特征和數(shù)量關(guān)系,是統(tǒng)計(jì)指標(biāo)理論研究的一大課題。
四、統(tǒng)計(jì)模型法
在以統(tǒng)計(jì)指標(biāo)來反映所研究現(xiàn)象的數(shù)量特征的同時(shí),我們還經(jīng)常需要對相關(guān)現(xiàn)象之間的數(shù)量變動(dòng)關(guān)系進(jìn)行定量研究,以了解某一(些)現(xiàn)象數(shù)量變動(dòng)與另一(些)現(xiàn)象數(shù)量變動(dòng)之間的關(guān)系及變動(dòng)的影響程度。在研究這種數(shù)量變動(dòng)關(guān)系時(shí),需要根據(jù)具體的研究對象和一定的假定條件,用合適的數(shù)學(xué)方程來進(jìn)行模擬,這種方法就叫做統(tǒng)計(jì)模型法。
五、統(tǒng)計(jì)推斷法
在統(tǒng)計(jì)認(rèn)識活動(dòng)中,我們所觀察的往往只是所研究現(xiàn)象總體中的一部分單位,掌握的只是具有隨機(jī)性的樣本觀察數(shù)據(jù),而認(rèn)識總體數(shù)量特征是統(tǒng)計(jì)研究的目的,這就需要我們根據(jù)概率論和樣本分布理論,運(yùn)用參數(shù)估計(jì)或假設(shè)檢驗(yàn)的方法,由樣本觀測數(shù)據(jù)來推斷總體數(shù)量特征。這種由樣本來推斷總體的方法就叫統(tǒng)計(jì)推斷法。統(tǒng)計(jì)推斷法已在統(tǒng)計(jì)研究的許多領(lǐng)域得到應(yīng)用,除了最常見的總體指標(biāo)推斷外,統(tǒng)計(jì)模型參數(shù)的估計(jì)和檢驗(yàn)、統(tǒng)計(jì)預(yù)測中原時(shí)間序列的估計(jì)和檢驗(yàn)等,也都屬于統(tǒng)計(jì)推斷的范疇,都存在著誤差和置信度的問題。在實(shí)踐中這是一種有效又經(jīng)濟(jì)的方法,其應(yīng)用范圍很廣泛,發(fā)展很快,統(tǒng)計(jì)推斷法已成為現(xiàn)代統(tǒng)計(jì)學(xué)的基本方法。
1、聚類分析(Cluster Analysis)
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個(gè)類的分析過程。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,所以同一個(gè)簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。聚類分析所使用方法的不同,常常會(huì)得到不同的結(jié)論。不同研究者對于同一組數(shù)據(jù)進(jìn)行聚類分析,所得到的聚類數(shù)未必一致。
2、因子分析(Factor Analysis)
因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù)。因子分析就是從大量的數(shù)據(jù)中尋找內(nèi)在的聯(lián)系,減少?zèng)Q策的困難。
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對角線上的值,采用不同的共同性□2估值。在社會(huì)學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法。
3、相關(guān)分析(Correlation Analysis)
相關(guān)分析(correlation analysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度。相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y分別記一個(gè)人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這就是相關(guān)關(guān)系。
4、對應(yīng)分析(Correspondence Analysis)
對應(yīng)分析(Correspondence analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,通過分析由定性變量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系。可以揭示同一變量的各個(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對應(yīng)關(guān)系。對應(yīng)分析的基本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來。
5、回歸分析
研究一個(gè)隨機(jī)變量Y對另一個(gè)(X)或一組(X1,X2,…,Xk)變量的相依關(guān)系的統(tǒng)計(jì)分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。
6、方差分析(ANOVA/Analysis of Variance)
又稱“變異數(shù)分析”或“F檢驗(yàn)”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類,一是不可控的隨機(jī)因素,另一是研究中施加的對結(jié)果形成影響的可控因素。方差分析是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量。這個(gè) 還需要具體問題具體分析
統(tǒng)計(jì)方法有: 1、計(jì)量資料的統(tǒng)計(jì)方法 分析計(jì)量資料的統(tǒng)計(jì)分析方法可分為參數(shù)檢驗(yàn)法和非參數(shù)檢驗(yàn)法。
參數(shù)檢驗(yàn)法主要為t檢驗(yàn)和 方差分析(ANOVN,即F檢驗(yàn))等,兩組間均數(shù)比較時(shí)常用t檢驗(yàn)和u檢驗(yàn),兩組以上均數(shù)比較時(shí)常用方差分析;非參數(shù)檢驗(yàn)法主要包括秩和檢驗(yàn)等。t檢驗(yàn)可分為單組設(shè)計(jì)資料的t檢驗(yàn)、配對設(shè)計(jì)資料的t檢驗(yàn)和成組設(shè)計(jì)資料的t檢驗(yàn);當(dāng)兩個(gè)小 樣本比較時(shí)要求兩 總體分布為 正態(tài)分布且方差齊性,若不能滿足以上要求,宜用t 檢驗(yàn)或非參數(shù)方法( 秩和檢驗(yàn))。
方差分析可用于兩個(gè)以上 樣本均數(shù)的比較,應(yīng)用該方法時(shí),要求各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,各樣本來自正態(tài)總體且各處理組總體方差齊性。根據(jù)設(shè)計(jì)類型不同,方差分析中又包含了多種不同的方法。
對于 定量資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用t檢驗(yàn)和 單因素方差分析。 2、計(jì)數(shù)資料的統(tǒng)計(jì)方法 計(jì)數(shù)資料的統(tǒng)計(jì)方法主要針對四格表和R*C表利用檢驗(yàn)進(jìn)行分析。
檢驗(yàn)或u檢驗(yàn),若不能滿足 檢驗(yàn):當(dāng)計(jì)數(shù)資料呈配對設(shè)計(jì)時(shí),獲得的四格表為配對四格表,其用到的檢驗(yàn)公式和校正公式可參考書籍。 R*C表可以分為雙向無序,單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌念悾煌惖男辛斜砀鶕?jù)其研究目的,其選擇的方法也不一樣。
3、等級資料的統(tǒng)計(jì)方法 等級資料(有序變量)是對性質(zhì)和類別的等級進(jìn)行分組,再清點(diǎn)每組觀察單位個(gè)數(shù)所得到的資料。在臨床醫(yī)學(xué)資料中,常遇到一些定性指標(biāo),如臨床療效的評價(jià)、疾病的臨床分期、病癥嚴(yán)重程度的臨床分級等,對這些指標(biāo)常采用分成若干個(gè)等級然后分類計(jì)數(shù)的辦法來解決它的量化問題,這樣的資料統(tǒng)計(jì)上稱為等級資料。
統(tǒng)計(jì)方法的選擇: 統(tǒng)計(jì)資料豐富且錯(cuò)綜復(fù)雜,要想做到合理選用統(tǒng)計(jì)分析方法并非易事。對于同一 個(gè)資料,若選擇不同的統(tǒng)計(jì)分析方法處理,有時(shí)其結(jié)論是截然不同的。
正確選擇統(tǒng)計(jì)方法的依據(jù)是: ①根據(jù)研究的目的,明確研究試驗(yàn)設(shè)計(jì)類型、研究因素與水平數(shù); ②確定數(shù)據(jù)特征(是否正態(tài)分布等)和樣本量大小; ③ 正確判斷統(tǒng)計(jì)資料所對應(yīng)的類型(計(jì)量、計(jì)數(shù)和等級資料),同時(shí)應(yīng)根據(jù)統(tǒng)計(jì)方法的適宜條件進(jìn)行正確的統(tǒng)計(jì)量值計(jì)算; 最后,還要根據(jù)專業(yè)知識與資料的實(shí)際情況,結(jié)合統(tǒng)計(jì)學(xué)原則,靈活地選擇統(tǒng)計(jì)分析方法。
數(shù)據(jù)分析落實(shí)到實(shí)處,一般就是圍繞用戶漏斗展開的。也就是人們常說的訪問-激活-留存-交易-推薦。
這核心的5步會(huì)有不同維度的細(xì)分。
獲客:來源、渠道、關(guān)鍵字、著陸頁、地域、設(shè)備、訪問時(shí)間、跳出率、訪問深度、停留時(shí)間、新客量等等;
激活:DAU(日活躍用戶)、MAU(月活躍用戶)
留存:日留存率、周留存率、月留存率
交易:訂單量、訂單金額、LTV
推薦:是否傳播(k>1)
需要獲取以上數(shù)據(jù),可以通過ptengine通過漏斗細(xì)分得到可視化圖表。一般來講,同比(本周和上周)、環(huán)比(本月第一周和上月第一周)、定基比(所有數(shù)據(jù)和當(dāng)年第一周)即可獲得數(shù)據(jù)的變化情況。
以上,其實(shí)不用很專業(yè)也能做好數(shù)據(jù)分析,獲取數(shù)據(jù)并不難,難的是你能洞察數(shù)據(jù)背后的意義。
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時(shí)間:3.375秒