一、描述性統(tǒng)計(jì)
描述性統(tǒng)計(jì)是一類統(tǒng)計(jì)方法的匯總,揭示了數(shù)據(jù)分布特性。它主要包括數(shù)據(jù)的頻數(shù)分析、數(shù)據(jù)的集中趨勢(shì)分析、數(shù)據(jù)離散程度分析、數(shù)據(jù)的分布以及一些基本的統(tǒng)計(jì)圖形。
1、缺失值填充:常用方法有剔除法、均值法、決策樹法。
2、正態(tài)性檢驗(yàn):很多統(tǒng)計(jì)方法都要求數(shù)值服從或近似服從正態(tài)分布,所以在做數(shù)據(jù)分析之前需要進(jìn)行正態(tài)性檢驗(yàn)。常用方法:非參數(shù)檢驗(yàn)的K-量檢驗(yàn)、P-P圖、Q-Q圖、W檢驗(yàn)、動(dòng)差法。
二、回歸分析
回歸分析是應(yīng)用極其廣泛的數(shù)據(jù)分析方法之一。它基于觀測(cè)數(shù)據(jù)建立變量間適當(dāng)?shù)囊蕾囮P(guān)系,以分析數(shù)據(jù)內(nèi)在規(guī)律。
1. 一元線性分析
只有一個(gè)自變量X與因變量Y有關(guān),X與Y都必須是連續(xù)型變量,因變量Y或其殘差必須服從正態(tài)分布。
2. 多元線性回歸分析
使用條件:分析多個(gè)自變量X與因變量Y的關(guān)系,X與Y都必須是連續(xù)型變量,因變量Y或其殘差必須服從正態(tài)分布。
3.Logistic回歸分析
線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,且自變量和因變量呈線性關(guān)系,而Logistic回歸模型對(duì)因變量的分布沒有要求,一般用于因變量是離散時(shí)的情況。
4. 其他回歸方法:非線性回歸、有序回歸、Probit回歸、加權(quán)回歸等。
三、方差分析
使用條件:各樣本須是相互獨(dú)立的隨機(jī)樣本;各樣本來(lái)自正態(tài)分布總體;各總體方差相等。
1. 單因素方差分析:一項(xiàng)試驗(yàn)只有一個(gè)影響因素,或者存在多個(gè)影響因素時(shí),只分析一個(gè)因素與響應(yīng)變量的關(guān)系。
2. 多因素有交互方差分析:一頊實(shí)驗(yàn)有多個(gè)影響因素,分析多個(gè)影響因素與響應(yīng)變量的關(guān)系,同時(shí)考慮多個(gè)影響因素之間的關(guān)系
3. 多因素?zé)o交互方差分析:分析多個(gè)影響因素與響應(yīng)變量的關(guān)系,但是影響因素之間沒有影響關(guān)系或忽略影響關(guān)系
4. 協(xié)方差分祈:傳統(tǒng)的方差分析存在明顯的弊端,無(wú)法控制分析中存在的某些隨機(jī)因素,降低了分析結(jié)果的準(zhǔn)確度。協(xié)方差分析主要是在排除了協(xié)變量的影響后再對(duì)修正后的主效應(yīng)進(jìn)行方差分析,是將線性回歸與方差分析結(jié)合起來(lái)的一種分析方法。
四、假設(shè)檢驗(yàn)
1. 參數(shù)檢驗(yàn)
參數(shù)檢驗(yàn)是在已知總體分布的條件下(一股要求總體服從正態(tài)分布)對(duì)一些主要的參數(shù)(如均值、百分?jǐn)?shù)、方差、相關(guān)系數(shù)等)進(jìn)行的檢驗(yàn) 。
2. 非參數(shù)檢驗(yàn)
非參數(shù)檢驗(yàn)則不考慮總體分布是否已知,常常也不是針對(duì)總體參數(shù),而是針對(duì)總體的某些一般性假設(shè)(如總體分布的位罝是否相同,總體分布是否正態(tài))進(jìn)行檢驗(yàn)。
適用情況:順序類型的數(shù)據(jù)資料,這類數(shù)據(jù)的分布形態(tài)一般是未知的。
1)雖然是連續(xù)數(shù)據(jù),但總體分布形態(tài)未知或者非正態(tài);
2)總體分布雖然正態(tài),數(shù)據(jù)也是連續(xù)類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗(yàn)、秩和檢驗(yàn)、二項(xiàng)檢驗(yàn)、游程檢驗(yàn)、K-量檢驗(yàn)等。
去百度文庫(kù),查看完整內(nèi)容>
內(nèi)容來(lái)自用戶:茍燁濤
統(tǒng)計(jì)中經(jīng)常會(huì)用到各種檢驗(yàn),如何知道何時(shí)用什么檢驗(yàn)?zāi)?,根?jù)結(jié)合自己的工作來(lái)說(shuō)一說(shuō):
t檢驗(yàn)有單樣本t檢驗(yàn),配對(duì)t檢驗(yàn)和兩樣本t檢驗(yàn)。單樣本t檢驗(yàn):是用樣本均數(shù)代表的未知總體均數(shù)和已知總體均數(shù)進(jìn)行比較,來(lái)觀察此組樣本與總體的差異性。配對(duì)t檢驗(yàn):是采用配對(duì)設(shè)計(jì)方法觀察以下幾種情形,1,兩個(gè)同質(zhì)受試對(duì)象分別接受兩種不同的處理;2,同一受試對(duì)象接受兩種不同的處理;3,同一受試對(duì)象處理前后。
u檢驗(yàn):t檢驗(yàn)和就是統(tǒng)計(jì)量為t,u的假設(shè)檢驗(yàn),兩者均是常見的假設(shè)檢驗(yàn)方法。當(dāng)樣本含量n較大時(shí),樣本均數(shù)符合正態(tài)分布,故可用u檢驗(yàn)進(jìn)行分析。當(dāng)樣本含量n小時(shí),若觀察值x符合正態(tài)分布,則用t檢驗(yàn)(因此時(shí)樣本均數(shù)符合t分布),當(dāng)x為未知分布時(shí)應(yīng)采用秩和檢驗(yàn)。F檢驗(yàn)又叫方差齊性檢驗(yàn)。在兩樣本t檢驗(yàn)中要用到F檢驗(yàn)。從兩研究總體中隨機(jī)抽取樣本,要對(duì)這兩個(gè)樣本進(jìn)行比較的時(shí)候,首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用t檢驗(yàn),若不等,可采用t'檢驗(yàn)或變量變換或秩和檢驗(yàn)等方法。其中要判斷兩總體方差是否相等,就可以用F檢驗(yàn)。
簡(jiǎn)單的說(shuō)就是檢驗(yàn)兩個(gè)樣本的方差是否有顯著性差異這是選擇何種T檢驗(yàn)(等方差雙樣本檢驗(yàn),異方差雙樣本檢驗(yàn))的前提條件。用途:用于完全隨機(jī)設(shè)計(jì)的多個(gè)樣本均數(shù)間的比較,其統(tǒng)計(jì)推斷是推斷各樣本所代表的各總體均數(shù)是否相等。完全隨機(jī)設(shè)計(jì)(
奇偶校驗(yàn)”。
內(nèi)存中最小的單位是比特,也稱為“位”,位有只有兩種狀態(tài)分別以1和0來(lái)標(biāo)示,每8個(gè)連續(xù)的比特叫做一個(gè)字節(jié)(byte)。不帶奇偶校驗(yàn)的內(nèi)存每個(gè)字節(jié)只有8位,如果其某一位存儲(chǔ)了錯(cuò)誤的值,就會(huì)導(dǎo)致其存儲(chǔ)的相應(yīng)數(shù)據(jù)發(fā)生變化,進(jìn)而導(dǎo)致應(yīng)用程序發(fā)生錯(cuò)誤。
而奇偶校驗(yàn)就是在每一字節(jié)(8位)之外又增加了一位作為錯(cuò)誤檢測(cè)位。在某字節(jié)中存儲(chǔ)數(shù)據(jù)之后,在其8個(gè)位上存儲(chǔ)的數(shù)據(jù)是固定的,因?yàn)槲恢荒苡袃煞N狀態(tài)1或0,假設(shè)存儲(chǔ)的數(shù)據(jù)用位標(biāo)示為1、1、1、0、0、1、0、1,那么把每個(gè)位相加(1+1+1+0+0+1+0+1=5),結(jié)果是奇數(shù),那么在校驗(yàn)位定義為1,反之為0。
當(dāng)CPU讀取存儲(chǔ)的數(shù)據(jù)時(shí),它會(huì)再次把前8位中存儲(chǔ)的數(shù)據(jù)相加,計(jì)算結(jié)果是否與校驗(yàn)位相一致。從而一定程度上能檢測(cè)出內(nèi)存錯(cuò)誤,奇偶校驗(yàn)只能檢測(cè)出錯(cuò)誤而無(wú)法對(duì)其進(jìn)行修正,同時(shí)雖然雙位同時(shí)發(fā)生錯(cuò)誤的概率相當(dāng)?shù)停媾夹r?yàn)卻無(wú)法檢測(cè)出雙位錯(cuò)誤。
MD5的全稱是Message-Digest Algorithm 5,在90年代初由MIT的計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室和RSA Data Security Inc 發(fā)明,由 MD2/MD3/MD4 發(fā)展而來(lái)的。MD5的實(shí)際應(yīng)用是對(duì)一段Message(字節(jié)串)產(chǎn)生fingerprint(指紋),可以防止被“篡改”。
舉個(gè)例子,天天安全網(wǎng)提供下載的MD5校驗(yàn)值軟件WinMD5.zip,其MD5值是,但你下載該軟件后計(jì)算MD5 發(fā)現(xiàn)其值卻是,那說(shuō)明該ZIP已經(jīng)被他人修改過(guò),那還用不用該軟件那你可自己琢磨著看啦。 MD5廣泛用于加密和解密技術(shù)上,在很多操作系統(tǒng)中,用戶的密碼是以MD5值(或類似的其它算法)的方式保存的,用戶Login的時(shí)候,系統(tǒng)是把用戶輸入的密碼計(jì)算成MD5值,然后再去和系統(tǒng)中保存的MD5值進(jìn)行比較,來(lái)驗(yàn)證該用戶的合法性。
MD5校驗(yàn)值軟件WinMD5.zip漢化版,使用極其簡(jiǎn)單,運(yùn)行該軟件后,把需要計(jì)算MD5值的文件用鼠標(biāo)拖到正在處理的框里邊,下面將直接顯示其MD5值以及所測(cè)試的文件名稱,可以保留多個(gè)文件測(cè)試的MD5值,選定所需要復(fù)制的MD5值,用CTRL+C就可以復(fù)制到其它地方了。 參考資料:CRC算法原理及C語(yǔ)言實(shí)現(xiàn) -來(lái)自(我愛單片機(jī))摘 要 本文從理論上推導(dǎo)出CRC算法實(shí)現(xiàn)原理,給出三種分別適應(yīng)不同計(jì)算機(jī)或微控制器硬件環(huán)境的C語(yǔ)言程序。
讀者更能根據(jù)本算法原理,用不同的語(yǔ)言編寫出獨(dú)特風(fēng)格更加實(shí)用的CRC計(jì)算程序。關(guān)鍵詞 CRC 算法 C語(yǔ)言1 引言循環(huán)冗余碼CRC檢驗(yàn)技術(shù)廣泛應(yīng)用于測(cè)控及通信領(lǐng)域。
CRC計(jì)算可以靠專用的硬件來(lái)實(shí)現(xiàn),但是對(duì)于低成本的微控制器系統(tǒng),在沒有硬件支持下實(shí)現(xiàn)CRC檢驗(yàn),關(guān)鍵的問(wèn)題就是如何通過(guò)軟件來(lái)完成CRC計(jì)算,也就是CRC算法的問(wèn)題。這里將提供三種算法,它們稍有不同,一種適用于程序空間十分苛刻但CRC計(jì)算速度要求不高的微控制器系統(tǒng),另一種適用于程序空間較大且CRC計(jì)算速度要求較高的計(jì)算機(jī)或微控制器系統(tǒng),最后一種是適用于程序空間不太大,且CRC計(jì)算速度又不可以太慢的微控制器系統(tǒng)。
2 CRC簡(jiǎn)介CRC 校驗(yàn)的基本思想是利用線性編碼理論,在發(fā)送端根據(jù)要傳送的k位二進(jìn)制碼序列,以一定的規(guī)則產(chǎn)生一個(gè)校驗(yàn)用的監(jiān)督碼(既CRC碼)r位,并附在信息后邊,構(gòu)成一個(gè)新的二進(jìn)制碼序列數(shù)共(k+r)位,最后發(fā)送出去。在接收端,則根據(jù)信息碼和CRC碼之間所遵循的規(guī)則進(jìn)行檢驗(yàn),以確定傳送中是否出錯(cuò)。
16位的CRC碼產(chǎn)生的規(guī)則是先將要發(fā)送的二進(jìn)制序列數(shù)左移16位(既乘以 )后,再除以一個(gè)多項(xiàng)式,最后所得到的余數(shù)既是CRC碼,如式(2-1)式所示,其中B(X)表示n位的二進(jìn)制序列數(shù),G(X)為多項(xiàng)式,Q(X)為整數(shù),R(X)是余數(shù)(既CRC碼)。(2-1)求CRC 碼所采用模2加減運(yùn)算法則,既是不帶進(jìn)位和借位的按位加減,這種加減運(yùn)算實(shí)際上就是邏輯上的異或運(yùn)算,加法和減法等價(jià),乘法和除法運(yùn)算與普通代數(shù)式的乘除法運(yùn)算是一樣,符合同樣的規(guī)律。
生成CRC碼的多項(xiàng)式如下,其中CRC-16和CRC-CCITT產(chǎn)生16位的CRC碼,而CRC-32則產(chǎn)生的是32位的CRC碼。本文不討論32位的CRC算法,有興趣的朋友可以根據(jù)本文的思路自己去推導(dǎo)計(jì)算方法。
CRC-16:(美國(guó)二進(jìn)制同步系統(tǒng)中采用)CRC-CCITT:(由歐洲CCITT推薦)CRC-32:接收方將接收到的二進(jìn)制序列數(shù)(包括信息碼和CRC碼)除以多項(xiàng)式,如果余數(shù)為0,則說(shuō)明傳輸中無(wú)錯(cuò)誤發(fā)生,否則說(shuō)明傳輸有誤,關(guān)于其原理這里不再多述。用軟件計(jì)算CRC碼時(shí),接收方可以將接收到的信息碼求CRC碼,比較結(jié)果和接收到的CRC碼是否相同。
3 按位計(jì)算CRC對(duì)于一個(gè)二進(jìn)制序列數(shù)可以表示為式(3-1):(3-1)求此二進(jìn)制序列數(shù)的CRC碼時(shí),先乘以 后(既左移16位),再除以多項(xiàng)式G(X),所得的余數(shù)既是所要求的CRC碼。如式(3-2)所示:(3-2)可以設(shè): (3-3)其中 為整數(shù), 為16位二進(jìn)制余數(shù)。
將式(3-3)代入式(3-2)得:(3-4)再設(shè): (3-5)其中 為整數(shù), 為16位二進(jìn)制余數(shù),將式(3-5)代入式(3-4),如上類推,最后得到:(3-6)根據(jù)CRC的定義,很顯然,。
實(shí)現(xiàn)方法:最簡(jiǎn)單的校驗(yàn)就是把原始數(shù)據(jù)和待比較數(shù)據(jù)直接進(jìn)行比較,看是否完全一樣這種方法是最安全最準(zhǔn)確的。同時(shí)也是效率最低的。
應(yīng)用例子:龍珠cpu在線調(diào)試工具bbug.exe。它和龍珠cpu間通訊時(shí),bbug發(fā)送一個(gè)字節(jié)cpu返回收到的字節(jié),bbug確認(rèn)是剛才發(fā)送字節(jié)后才繼續(xù)發(fā)送下一個(gè)字節(jié)的。 實(shí)現(xiàn)方法:在數(shù)據(jù)存儲(chǔ)和傳輸中,字節(jié)中額外增加一個(gè)比特位,用來(lái)檢驗(yàn)錯(cuò)誤。校驗(yàn)位可以通過(guò)數(shù)據(jù)位異或計(jì)算出來(lái)。
應(yīng)用例子:?jiǎn)纹瑱C(jī)串口通訊有一模式就是8位數(shù)據(jù)通訊,另加第9位用于放校驗(yàn)值。
bcc異或校驗(yàn)法(block check character)
實(shí)現(xiàn)方法:很多基于串口的通訊都用這種既簡(jiǎn)單又相當(dāng)準(zhǔn)確的方法。它就是把所有數(shù)據(jù)都和一個(gè)指定的初始值(通常是0)異或一次,最后的結(jié)果就是校驗(yàn)值,通常把它附在通訊數(shù)據(jù)的最后一起發(fā)送出去。接收方收到數(shù)據(jù)后自己也計(jì)算一次異或和校驗(yàn)值,如果和收到的校驗(yàn)值一致就說(shuō)明收到的數(shù)據(jù)是完整的。
校驗(yàn)值計(jì)算的代碼類似于:
unsigned uCRC=0;//校驗(yàn)初始值
for(int i=0;i<DataLenth;i++) uCRC^=Data[i];
適用范圍:適用于大多數(shù)要求不高的數(shù)據(jù)通訊。
應(yīng)用例子:ic卡接口通訊、很多單片機(jī)系統(tǒng)的串口通訊都使用。 (Cyclic Redundancy Check)
實(shí)現(xiàn)方法:這是利用除法及余數(shù)的原理來(lái)進(jìn)行錯(cuò)誤檢測(cè)的.將接收到的碼組進(jìn)行除法運(yùn)算,如果除盡,則說(shuō)明傳輸無(wú)誤;如果未除盡,則表明傳輸出現(xiàn)差錯(cuò)。crc校驗(yàn)具還有自動(dòng)糾錯(cuò)能力。
crc檢驗(yàn)主要有計(jì)算法和查表法兩種方法,網(wǎng)上很多實(shí)現(xiàn)代碼。
適用范圍:CRC-12碼通常用來(lái)傳送6-bit字符串;CRC-16及CRC-CCITT碼則用是來(lái)傳送8-bit字符。CRC-32:硬盤數(shù)據(jù),網(wǎng)絡(luò)傳輸?shù)取?/p>
應(yīng)用例子:rar,以太網(wǎng)卡芯片、MPEG解碼芯片中 實(shí)現(xiàn)方法:主要有md5和des算法。
適用范圍:數(shù)據(jù)比較大或要求比較高的場(chǎng)合。如md5用于大量數(shù)據(jù)、文件校驗(yàn),des用于保
密數(shù)據(jù)的校驗(yàn)(數(shù)字簽名)等等。
應(yīng)用例子:文件校驗(yàn)、銀行系統(tǒng)的交易數(shù)據(jù)
1、聚類分析(Cluster Analysis)
聚類分析指將物理或抽象對(duì)象的集合分組成為由類似的對(duì)象組成的多個(gè)類的分析過(guò)程。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過(guò)程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。聚類分析是一種探索性的分析,在分類的過(guò)程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。聚類分析所使用方法的不同,常常會(huì)得到不同的結(jié)論。不同研究者對(duì)于同一組數(shù)據(jù)進(jìn)行聚類分析,所得到的聚類數(shù)未必一致。
2、因子分析(Factor Analysis)
因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù)。因子分析就是從大量的數(shù)據(jù)中尋找內(nèi)在的聯(lián)系,減少?zèng)Q策的困難。
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對(duì)角線上的值,采用不同的共同性□2估值。在社會(huì)學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法。
3、相關(guān)分析(Correlation Analysis)
相關(guān)分析(correlation analysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度。相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y分別記一個(gè)人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這就是相關(guān)關(guān)系。
4、對(duì)應(yīng)分析(Correspondence Analysis)
對(duì)應(yīng)分析(Correspondence analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,通過(guò)分析由定性變量構(gòu)成的交互匯總表來(lái)揭示變量間的聯(lián)系。可以揭示同一變量的各個(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系。對(duì)應(yīng)分析的基本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來(lái)。
5、回歸分析
研究一個(gè)隨機(jī)變量Y對(duì)另一個(gè)(X)或一組(X1,X2,…,Xk)變量的相依關(guān)系的統(tǒng)計(jì)分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。
6、方差分析(ANOVA/Analysis of Variance)
又稱“變異數(shù)分析”或“F檢驗(yàn)”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類,一是不可控的隨機(jī)因素,另一是研究中施加的對(duì)結(jié)果形成影響的可控因素。方差分析是從觀測(cè)變量的方差入手,研究諸多控制變量中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量。這個(gè) 還需要具體問(wèn)題具體分析
統(tǒng)計(jì)方法有: 1、計(jì)量資料的統(tǒng)計(jì)方法 分析計(jì)量資料的統(tǒng)計(jì)分析方法可分為參數(shù)檢驗(yàn)法和非參數(shù)檢驗(yàn)法。
參數(shù)檢驗(yàn)法主要為t檢驗(yàn)和 方差分析(ANOVN,即F檢驗(yàn))等,兩組間均數(shù)比較時(shí)常用t檢驗(yàn)和u檢驗(yàn),兩組以上均數(shù)比較時(shí)常用方差分析;非參數(shù)檢驗(yàn)法主要包括秩和檢驗(yàn)等。t檢驗(yàn)可分為單組設(shè)計(jì)資料的t檢驗(yàn)、配對(duì)設(shè)計(jì)資料的t檢驗(yàn)和成組設(shè)計(jì)資料的t檢驗(yàn);當(dāng)兩個(gè)小 樣本比較時(shí)要求兩 總體分布為 正態(tài)分布且方差齊性,若不能滿足以上要求,宜用t 檢驗(yàn)或非參數(shù)方法( 秩和檢驗(yàn))。
方差分析可用于兩個(gè)以上 樣本均數(shù)的比較,應(yīng)用該方法時(shí),要求各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,各樣本來(lái)自正態(tài)總體且各處理組總體方差齊性。根據(jù)設(shè)計(jì)類型不同,方差分析中又包含了多種不同的方法。
對(duì)于 定量資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用t檢驗(yàn)和 單因素方差分析。 2、計(jì)數(shù)資料的統(tǒng)計(jì)方法 計(jì)數(shù)資料的統(tǒng)計(jì)方法主要針對(duì)四格表和R*C表利用檢驗(yàn)進(jìn)行分析。
檢驗(yàn)或u檢驗(yàn),若不能滿足 檢驗(yàn):當(dāng)計(jì)數(shù)資料呈配對(duì)設(shè)計(jì)時(shí),獲得的四格表為配對(duì)四格表,其用到的檢驗(yàn)公式和校正公式可參考書籍。 R*C表可以分為雙向無(wú)序,單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌念?,不同類的行列表根?jù)其研究目的,其選擇的方法也不一樣。
3、等級(jí)資料的統(tǒng)計(jì)方法 等級(jí)資料(有序變量)是對(duì)性質(zhì)和類別的等級(jí)進(jìn)行分組,再清點(diǎn)每組觀察單位個(gè)數(shù)所得到的資料。在臨床醫(yī)學(xué)資料中,常遇到一些定性指標(biāo),如臨床療效的評(píng)價(jià)、疾病的臨床分期、病癥嚴(yán)重程度的臨床分級(jí)等,對(duì)這些指標(biāo)常采用分成若干個(gè)等級(jí)然后分類計(jì)數(shù)的辦法來(lái)解決它的量化問(wèn)題,這樣的資料統(tǒng)計(jì)上稱為等級(jí)資料。
統(tǒng)計(jì)方法的選擇: 統(tǒng)計(jì)資料豐富且錯(cuò)綜復(fù)雜,要想做到合理選用統(tǒng)計(jì)分析方法并非易事。對(duì)于同一 個(gè)資料,若選擇不同的統(tǒng)計(jì)分析方法處理,有時(shí)其結(jié)論是截然不同的。
正確選擇統(tǒng)計(jì)方法的依據(jù)是: ①根據(jù)研究的目的,明確研究試驗(yàn)設(shè)計(jì)類型、研究因素與水平數(shù); ②確定數(shù)據(jù)特征(是否正態(tài)分布等)和樣本量大??; ③ 正確判斷統(tǒng)計(jì)資料所對(duì)應(yīng)的類型(計(jì)量、計(jì)數(shù)和等級(jí)資料),同時(shí)應(yīng)根據(jù)統(tǒng)計(jì)方法的適宜條件進(jìn)行正確的統(tǒng)計(jì)量值計(jì)算; 最后,還要根據(jù)專業(yè)知識(shí)與資料的實(shí)際情況,結(jié)合統(tǒng)計(jì)學(xué)原則,靈活地選擇統(tǒng)計(jì)分析方法。
統(tǒng)計(jì)方法是非常的多的。
像我們生活中比較常接觸到的,圖表分析方法,對(duì)于一組數(shù)據(jù),進(jìn)行簡(jiǎn)單的各種分組或者是一些占比方面的分析,或者就是計(jì)算一些極差,或者計(jì)算均值方差等,這些在各個(gè)行業(yè)都是比較常見的。如果學(xué)習(xí)了些統(tǒng)計(jì)方面的知識(shí)的話,能夠接觸到一些專業(yè)的統(tǒng)計(jì)方法。
上面所說(shuō)的那些圖表都是屬于一些描述性統(tǒng)計(jì)方法,還有一些常用的推斷統(tǒng)計(jì)方法,像假設(shè)檢驗(yàn),通過(guò)對(duì)總體進(jìn)行一些前提上面的假設(shè),然后通過(guò)抽取一部分樣本來(lái)對(duì)總體的這種假設(shè)進(jìn)行診斷。再個(gè)常用的就是參數(shù)估計(jì),參數(shù)估計(jì)就是通過(guò)抽取樣本來(lái)對(duì)總體的參數(shù)進(jìn)行預(yù)估,常見的估計(jì)總體的參數(shù)像方差或者是均值,其中點(diǎn)估計(jì)和區(qū)間估計(jì)是參數(shù)估計(jì)的兩個(gè)大方面的內(nèi)容。
統(tǒng)計(jì)量抽樣分布、參數(shù)估計(jì)、假設(shè)檢驗(yàn)這三種方法是在進(jìn)行統(tǒng)計(jì)分析的三個(gè)比較大的方面,其中統(tǒng)計(jì)量的抽樣分布包括的幾大分布在統(tǒng)計(jì)中都是有著舉足輕重的作用的。對(duì)于分類數(shù)據(jù)的一些統(tǒng)計(jì)分析中,統(tǒng)計(jì)中最常見的就是卡方統(tǒng)計(jì)量來(lái)進(jìn)行分析,然后通過(guò)結(jié)果可以來(lái)對(duì)總體進(jìn)行一定的認(rèn)識(shí),可以看出兩個(gè)分類總體是否有一定的相關(guān)性。
在研究一個(gè)分類型自變量和一個(gè)數(shù)值型的自變量的時(shí)候,最常用的是進(jìn)行方差分析這種統(tǒng)計(jì)方法,來(lái)描述一個(gè)總體是否有著顯著性的差異。在對(duì)兩個(gè)自變量都是數(shù)值變量的時(shí)候,最常用的就是進(jìn)行模擬一元回歸方程,通過(guò)一條趨勢(shì)線來(lái)描述這個(gè)總體的情況,而對(duì)應(yīng)的多元回歸趨勢(shì)線就是多個(gè)自變量都是數(shù)值變量,用來(lái)描述多個(gè)自變量的回歸問(wèn)題。
收集方法
1、調(diào)查法
調(diào)查方法一般分為普查和抽樣調(diào)查兩大類。
2、觀察法
主要包括兩個(gè)方面:一是對(duì)人的行為的觀察,二是對(duì)客觀事物的觀察。觀察法應(yīng)用很廣泛,常和詢問(wèn)法、搜集實(shí)物結(jié)合使用,以提高所收集信息的可靠性。
3、實(shí)驗(yàn)方法
實(shí)驗(yàn)方法能通過(guò)實(shí)驗(yàn)過(guò)程獲取其他手段難以獲得的信息或結(jié)論。
實(shí)驗(yàn)方法也有多種形式,如實(shí)驗(yàn)室實(shí)驗(yàn)、現(xiàn)場(chǎng)實(shí)驗(yàn)、計(jì)算機(jī)模擬實(shí)驗(yàn)、計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下人機(jī)結(jié)合實(shí)驗(yàn)等?,F(xiàn)代管理科學(xué)中新興的管理實(shí)驗(yàn),現(xiàn)代經(jīng)濟(jì)學(xué)中正在形成的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)中的經(jīng)濟(jì)實(shí)驗(yàn),實(shí)質(zhì)上就是通過(guò)實(shí)驗(yàn)獲取與管理或經(jīng)濟(jì)相關(guān)的信息。
4、文獻(xiàn)檢索
文獻(xiàn)檢索就是從浩繁的文獻(xiàn)中檢索出所需的信息的過(guò)程。文獻(xiàn)檢索分為手工檢索和計(jì)算機(jī)檢索。
5、網(wǎng)絡(luò)信息收集
網(wǎng)絡(luò)信息是指通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)發(fā)布、傳遞和存儲(chǔ)的各種信息。收集網(wǎng)絡(luò)信息的最終目標(biāo)是給廣大用戶提供網(wǎng)絡(luò)信息資源服務(wù),整個(gè)過(guò)程經(jīng)過(guò)網(wǎng)絡(luò)信息搜索、整合、保存和服務(wù)四個(gè)步驟,
參考資料來(lái)源:搜狗百科-信息收集
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁(yè)面生成時(shí)間:4.942秒