1.計(jì)量資料的統(tǒng)計(jì)方法
分析計(jì)量資料的統(tǒng)計(jì)分析方法可分為參數(shù)檢驗(yàn)法和非參數(shù)檢驗(yàn)法。
參數(shù)檢驗(yàn)法主要為t檢驗(yàn)和方差分析(ANOVN,即F檢驗(yàn))等,兩組間均數(shù)比較時(shí)常用t檢驗(yàn)和u檢驗(yàn),兩組以上均數(shù)比較時(shí)常用方差分析;非參數(shù)檢驗(yàn)法主要包括秩和檢驗(yàn)等。t檢驗(yàn)可分為單組設(shè)計(jì)資料的t檢驗(yàn)、配對(duì)設(shè)計(jì)資料的t檢驗(yàn)和成組設(shè)計(jì)資料的t檢驗(yàn);當(dāng)兩個(gè)小樣本比較時(shí)要求兩總體分布為正態(tài)分布且方差齊性,若不能滿足以上要求,宜用t 檢驗(yàn)或非參數(shù)方法(秩和檢驗(yàn))。方差分析可用于兩個(gè)以上樣本均數(shù)的比較,應(yīng)用該方法時(shí),要求各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,各樣本來(lái)自正態(tài)總體且各處理組總體方差齊性。根據(jù)設(shè)計(jì)類型不同,方差分析中又包含了多種不同的方法。對(duì)于定量資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用t檢驗(yàn)和單因素方差分析。
2.計(jì)數(shù)資料的統(tǒng)計(jì)方法
計(jì)數(shù)資料的統(tǒng)計(jì)方法主要針對(duì)四格表和R*C表利用檢驗(yàn)進(jìn)行分析。 四格表資料:組間比較用
檢驗(yàn)或u檢驗(yàn),若不能滿足 檢驗(yàn):當(dāng)計(jì)數(shù)資料呈配對(duì)設(shè)計(jì)時(shí),獲得的四格表為配對(duì)四格表,其用到的檢驗(yàn)公式和校正公式可參考書(shū)籍。 R*C表可以分為雙向無(wú)序,單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌念?,不同類的行列表根?jù)其研究目的,其選擇的方法也不一樣。
3.等級(jí)資料的統(tǒng)計(jì)方法
等級(jí)資料(有序變量)是對(duì)性質(zhì)和類別的等級(jí)進(jìn)行分組,再清點(diǎn)每組觀察單位個(gè)數(shù)所得到的資料。在臨床醫(yī)學(xué)資料中,常遇到一些定性指標(biāo),如臨床療效的評(píng)價(jià)、疾病的臨床分期、病癥嚴(yán)重程度的臨床分級(jí)等,對(duì)這些指標(biāo)常采用分成若干個(gè)等級(jí)然后分類計(jì)數(shù)的辦法來(lái)解決它的量化問(wèn)題,這樣的資料統(tǒng)計(jì)上稱為等級(jí)資料。
統(tǒng)計(jì)方法是指有關(guān)收集、整理、分析和解釋統(tǒng)計(jì)數(shù)據(jù),并對(duì)其所反映的問(wèn)題作出一定結(jié)論的方法。統(tǒng)計(jì)方法是一種從微觀結(jié)構(gòu)上來(lái)研究物質(zhì)的宏觀性質(zhì)及其規(guī)律的獨(dú)特的方法。
定義1
所謂統(tǒng)計(jì)方法是指用多次測(cè)量值采用一定方法計(jì)算出的標(biāo)準(zhǔn)不確定度。不同于A類的其它方法計(jì)算者稱為B類標(biāo)準(zhǔn)不確定度或稱為標(biāo)準(zhǔn)不確定度的B類計(jì)算法(typeBevaluation)。
定義2
在平均離子模型的基礎(chǔ)上,發(fā)展了一個(gè)計(jì)算離子組態(tài)概率分布的有效方法,稱為統(tǒng)計(jì)方法。
源自: 激光等離子體非平衡X射線發(fā)射譜理論研究《物理學(xué)報(bào)》1995年 裴文兵,常鐵強(qiáng),張鈞
定義3
統(tǒng)計(jì)方法是指在不知道紋理基元或尚未監(jiān)測(cè)出基元的情況下進(jìn)行紋理分析,主要描述紋理基元或局部模式隨機(jī)和空間統(tǒng)計(jì)特征,如灰度共生矩陣法、隨機(jī)場(chǎng)模型法等。
源自: 利用紋理分析方法提取TM圖像信息《遙感學(xué)報(bào)》2004年 姜青香,劉慧平
定義4
分子物理學(xué)就是用統(tǒng)計(jì)方法來(lái)研究的。大量個(gè)別的偶然事件存在著一定的規(guī)律,表現(xiàn)了這些事件的整體的本質(zhì)和必然的聯(lián)系。這種規(guī)律是客觀存在的,統(tǒng)計(jì)的方法則是揭示這種規(guī)律的必要手段。統(tǒng)計(jì)方法只能適合于大量事件,研究的事件越多,得到的統(tǒng)計(jì)結(jié)果也越準(zhǔn)確
1.墓于粗糙集( Rough Set)理論的約簡(jiǎn)方法 粗糙集理論是一種研究不精確、不確定性知識(shí)的數(shù)學(xué)工具。
目前受到了KDD的廣泛重視,利用粗糙集理論對(duì)數(shù)據(jù)進(jìn)行處理是一種十分有效的精簡(jiǎn)數(shù)據(jù)維數(shù)的方法。我們所處理的數(shù)據(jù)一般存在信息的含糊性(Vagueness)問(wèn)題。
含糊性有三種:術(shù)語(yǔ)的模糊性,如高矮;數(shù)據(jù)的不確定性,如噪聲引起的;知識(shí)自身的不確定性,如規(guī)則的前后件間的依賴關(guān)系并不是完全可靠的。在KDD中,對(duì)不確定數(shù)據(jù)和噪聲干擾的處理是粗糙集方法的 2.基于概念樹(shù)的數(shù)據(jù)濃縮方法 在數(shù)據(jù)庫(kù)中,許多屬性都是可以進(jìn)行數(shù)據(jù)歸類,各屬性值和概念依據(jù)抽象程度不同可以構(gòu)成一個(gè)層次結(jié)構(gòu),概念的這種層次結(jié)構(gòu)通常稱為概念樹(shù)。
概念樹(shù)一般由領(lǐng)域?qū)<姨峁鼘⒏鱾€(gè)層次的概念按一般到特殊的順序排列。 3.信息論思想和普化知識(shí)發(fā)現(xiàn) 特征知識(shí)和分類知識(shí)是普化知識(shí)的兩種主要形式,其算法基本上可以分為兩類:數(shù)據(jù)立方方法和面向?qū)傩詺w納方法。
普通的基于面向?qū)傩詺w納方法在歸納屬性的選擇上有一定的盲目性,在歸納過(guò)程中,當(dāng)供選擇的可歸納屬性有多個(gè)時(shí),通常是隨機(jī)選取一個(gè)進(jìn)行歸納。事實(shí)上,不同的屬性歸納次序獲得的結(jié)果知識(shí)可能是不同的,根據(jù)信息論最大墑的概念,應(yīng)該選用一個(gè)信息丟失最小的歸納次序。
4.基于統(tǒng)計(jì)分析的屬性選取方法 我們可以采用統(tǒng)計(jì)分析中的一些算法來(lái)進(jìn)行特征屬性的選取,比如主成分分析、逐步回歸分析、公共因素模型分析等。這些方法的共同特征是,用少量的特征元組去描述高維的原始知識(shí)基。
5.遺傳算法〔GA, Genetic Algo}thrn}) 遺傳算法是一種基于生物進(jìn)化論和分子遺傳學(xué)的全局隨機(jī)搜索算法。遺傳算法的基本思想是:將問(wèn)題的可能解按某種形式進(jìn)行編碼,形成染色體。
隨機(jī)選取N個(gè)染色體構(gòu)成初始種群。再根據(jù)預(yù)定的評(píng)價(jià)函數(shù)對(duì)每個(gè)染色體計(jì)算適應(yīng)值。
選擇適應(yīng)值高的染色體進(jìn)行復(fù)制,通過(guò)遺傳運(yùn)算(選擇、交叉、變異)來(lái)產(chǎn)生一群新的更適應(yīng)環(huán)境的染色體,形成新的種群。這樣一代一代不斷繁殖進(jìn)化,最后收斂到一個(gè)最適合環(huán)境的個(gè)體上,從而求得問(wèn)題的最優(yōu)解。
遺傳算法應(yīng)用的關(guān)鍵是適應(yīng)度函數(shù)的建立和染色體的描述。在實(shí)際應(yīng)用中,通常將它和神經(jīng)網(wǎng)絡(luò)方法綜合使用。
通過(guò)遺傳算法來(lái)搜尋出更重要的變量組合。
統(tǒng)計(jì)數(shù)據(jù)的具體搜集方法有:
訪問(wèn)調(diào)查。訪問(wèn)調(diào)查又稱派員調(diào)查,它是調(diào)查者與被調(diào)查者通過(guò)面對(duì)面地交談從而得到所需資料的調(diào)查方法。訪問(wèn)調(diào)查的方式有標(biāo)準(zhǔn)式訪問(wèn)和非標(biāo)準(zhǔn)式訪問(wèn)兩種。前者是按一個(gè)事先設(shè)計(jì)好的訪問(wèn)結(jié)構(gòu),如固定格式的標(biāo)準(zhǔn)化問(wèn)卷,有順序地依次提問(wèn),并由受訪者做出回答。非標(biāo)準(zhǔn)式訪問(wèn)則事先不做統(tǒng)一的問(wèn)卷或表格,也沒(méi)有統(tǒng)一的提問(wèn)順序,有的只是一個(gè)題目或提綱,由調(diào)查人員和受訪者自由交談,以獲得所需的資料。
郵寄調(diào)查。它是通過(guò)郵寄或宣傳媒體等方式將調(diào)查表或調(diào)查問(wèn)卷送至被調(diào)查者手中,由被調(diào)查者填寫,然后將調(diào)查表寄回或投放到指定收集點(diǎn)的一種調(diào)查方法。
電話調(diào)查。電話調(diào)查是調(diào)查人員利用電話同受訪者進(jìn)行語(yǔ)言交流,從而獲得信息的一種調(diào)查方式。電話調(diào)查具有時(shí)效快、費(fèi)用低等特點(diǎn)。
電腦輔助調(diào)查。它也稱電腦輔助電話調(diào)查系統(tǒng)(computer-assisted telephone interviewing system,cati)。該系統(tǒng)使電話調(diào)查更加便利和快捷,也使調(diào)查的質(zhì)量大大提高了。
座談會(huì)。它也稱為集體訪談法,它是將一組被調(diào)查者集中在調(diào)查現(xiàn)場(chǎng),讓他們對(duì)調(diào)查的主題(如一種產(chǎn)品、一項(xiàng)服務(wù)或其他話題)發(fā)表意見(jiàn),從而獲取調(diào)查資料的方法。
個(gè)別深度訪問(wèn)。它是一種一次只有一名受訪者參加的特殊的定性研究?!吧钤L”是一種無(wú)結(jié)構(gòu)的個(gè)人訪問(wèn),調(diào)查人員運(yùn)用大量的追問(wèn)技巧,盡可能讓受訪者自由發(fā)揮,表達(dá)他的想法和感受。
觀察法。它是指就調(diào)查對(duì)象的行動(dòng)和意識(shí),調(diào)查人員邊觀察邊記錄以收集信息的方法。
實(shí)驗(yàn)法。它是一種特殊的觀察調(diào)查方法,它是在所設(shè)定的特殊實(shí)驗(yàn)場(chǎng)所、特殊狀態(tài)下,對(duì)調(diào)查對(duì)象進(jìn)行實(shí)驗(yàn)以取得所需資料的一種調(diào)查方法。
其中前六種方法屬于詢問(wèn)調(diào)查,后兩種方法屬于觀察與實(shí)驗(yàn)的方法。
統(tǒng)計(jì)整理的內(nèi)容通常包括:
1、根據(jù)研究任務(wù)的要求,選擇應(yīng)整理的指標(biāo),并根據(jù)分析的需要確定具體的分組;
2、對(duì)統(tǒng)計(jì)資料進(jìn)行匯總、計(jì)算;
3、通過(guò)統(tǒng)計(jì)表描述匯總的結(jié)果。在統(tǒng)計(jì)整理中,抓住最基本的、最能說(shuō)明問(wèn)題本質(zhì)特征的統(tǒng)計(jì)分組和統(tǒng)計(jì)指標(biāo)對(duì)統(tǒng)計(jì)資料進(jìn)行加工整理,這是進(jìn)行統(tǒng)計(jì)整理必須遵循的原則。
統(tǒng)計(jì)整理:
統(tǒng)計(jì)整理即“統(tǒng)計(jì)資料整理”,就是根據(jù)研究的目的和任務(wù)的要求,對(duì)統(tǒng)計(jì)調(diào)查所搜集到的原始資料進(jìn)行科學(xué)的加工整理,使之條理化、系統(tǒng)化,把反映總體單位的大量原始資料,轉(zhuǎn)化為反映總體的基本統(tǒng)計(jì)指標(biāo),統(tǒng)計(jì)工作的這一過(guò)程,叫統(tǒng)計(jì)資料的整理。廣義地說(shuō),統(tǒng)計(jì)整理也包括對(duì)次級(jí)資料進(jìn)行的再加工。
描述統(tǒng)計(jì)是指對(duì)采集的數(shù)據(jù)進(jìn)行登記、審核、整理、歸類,在此基礎(chǔ)上進(jìn)一步計(jì)算出各種能反映總體數(shù)量特征的綜合指標(biāo),并用圖表的形式表示經(jīng)過(guò)歸納分析而得到的各種有用的統(tǒng)計(jì)信息。
推斷統(tǒng)計(jì)是在對(duì)樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,利用一定的方法根據(jù)樣本數(shù)據(jù)去估計(jì)或檢驗(yàn)總體的數(shù)量特征。推斷統(tǒng)計(jì)是現(xiàn)代統(tǒng)計(jì)學(xué)的主要內(nèi)容。
回歸分析:確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法 方差分析:用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn),通過(guò)分析研究中不同來(lái)源的變異對(duì)總變異的貢獻(xiàn)大小,從而確定可控因素對(duì)研究結(jié)果影響力的大小。 相關(guān)分析:是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。
相關(guān)分析與回歸分析在實(shí)際應(yīng)用中有密切關(guān)系。然而在回歸分析中,所關(guān)心的是一個(gè)隨機(jī)變量Y對(duì)另一個(gè)(或一組)隨機(jī)變量X的依賴關(guān)系的函數(shù)形式。
而在相關(guān)分析中 ,所討論的變量的地位一樣,分析側(cè)重于隨機(jī)變量之間的種種相關(guān)特征。 判別分析:是按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對(duì)象的大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo),在氣候分類、農(nóng)業(yè)區(qū)劃、土地類型劃分中有著廣泛的應(yīng)用。
聚類分析:通過(guò)數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法,聚類分析在電子商務(wù)中網(wǎng)站建設(shè)數(shù)據(jù)挖掘中也是很重要的一個(gè)方面,通過(guò)分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,可以更好的幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。 因子分析:基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測(cè)的,即不是具體的變量),以較少的幾個(gè)因子反映原資料的大部分信息。
運(yùn)用這種研究技術(shù),可以方便地找出影響消費(fèi)者購(gòu)買、消費(fèi)以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運(yùn)用這種研究技術(shù),還可以為市場(chǎng)細(xì)分做前期分析。 描述統(tǒng)計(jì)是通過(guò)圖表或數(shù)學(xué)方法,對(duì)數(shù)據(jù)資料進(jìn)行整理、分析,并對(duì)數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)行估計(jì)和描述的方法。
描述統(tǒng)計(jì)分為集中趨勢(shì)分析和離中趨勢(shì)分析和相關(guān)分析三大部分。常見(jiàn)統(tǒng)計(jì)分析法:t檢驗(yàn),F(xiàn)檢驗(yàn) 方差分析。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:2.705秒