數(shù)據(jù)處理的基本目的是從大量的、可能是雜亂無章的、難以理解的數(shù)據(jù)中抽取并推導(dǎo)出對于某些特定的人們來說是有價值、有意義的數(shù)據(jù)。
數(shù)據(jù)處理對數(shù)據(jù)(包括數(shù)值的和非數(shù)值的)進(jìn)行分析和加工的技術(shù)過程。包括對各種原始數(shù)據(jù)的分析、整理、計算、編輯等的加工和處理。比數(shù)據(jù)分析含義廣。隨著計算機的日益普及,在計算機應(yīng)用領(lǐng)域中,數(shù)值計算所占比重很小,通過計算機數(shù)據(jù)處理進(jìn)行信息管理已成為主要的應(yīng)用。
如測繪制圖管理、倉庫管理、財會管理、交通運輸管理,技術(shù)情報管理、辦公室自動化等。在地理數(shù)據(jù)方面既有大量自然環(huán)境數(shù)據(jù)(土地、水、氣候、生物等各類資源數(shù)據(jù)),也有大量社會經(jīng)濟數(shù)據(jù)(人口、交通、工農(nóng)業(yè)等),常要求進(jìn)行綜合性數(shù)據(jù)處理。
擴展資料:
數(shù)據(jù)處理的基本方式:
根據(jù)處理設(shè)備的結(jié)構(gòu)方式、工作方式,以及數(shù)據(jù)的時間空間分布方式的不同,數(shù)據(jù)處理有不同的方式。不同的處理方式要求不同的硬件和軟件支持。每種處理方式都有自己的特點,應(yīng)當(dāng)根據(jù)應(yīng)用問題的實際環(huán)境選擇合適的處理方式。
數(shù)據(jù)處理主要有四種分類方式:
1、根據(jù)處理設(shè)備的結(jié)構(gòu)方式區(qū)分,有聯(lián)機處理方式和脫機處理方式。
2、根據(jù)數(shù)據(jù)處理時間的分配方式區(qū)分,有批處理方式、分時處理方式和實時處理方式。
3、根據(jù)數(shù)據(jù)處理空間的分布方式區(qū)分,有集中式處理方式和分布處理方式。
4、根據(jù)計算機中央處理器的工作方式區(qū)分,有單道作業(yè)處理方式、多道作業(yè)處理方式和交互式處理方式。
參考資料來源:百度百科-數(shù)據(jù)處理
一、線路交換
所謂線路交換是通過網(wǎng)絡(luò)中的節(jié)點在兩個站之間建立一條專用的通訊線路。如圖1的電話系統(tǒng),這種線路交換系統(tǒng),在兩個站之間有一個實際的物理連接,這種連接是節(jié)點之間的連接序列。在傳輸任何數(shù)據(jù)之間都必須建立點到點的線路。如站1發(fā)送一個請求到節(jié)點2,請求與站點2建立一個連接,那么站點1到節(jié)點1是一條專用線路。在交換機上分配一個專用的通道連接到節(jié)點2再到站點2的通訊。至此就建立了一條從站點1經(jīng)過節(jié)點2再到站點2的通訊物理通道。這樣就可以將話音從站點1傳送到站點2了,一般來說這種連接是全雙工的,可以在兩個方向傳輸話音(數(shù)據(jù))。
二、報文交換
這種交換方式不需要在兩個站點之間建立一條專用通路,如果一個站想要向站點2發(fā)送一個報文(信息的一個邏輯單位),它把站點2的地址(編碼方式,叫做地址碼)附加在要發(fā)送的報文上。然后把報文通過網(wǎng)絡(luò)從節(jié)點到節(jié)點進(jìn)行發(fā)送,在每個節(jié)點中(如要通過多個節(jié)點才能發(fā)送到站點2)完整地接收整個報文且暫存這個報文,然后再發(fā)送到下一個節(jié)點。在交換網(wǎng)中,每個節(jié)點是一個電子或機電結(jié)合的交換設(shè)備,每個節(jié)點通常是一臺通用的小型計算機。它具有足夠的存儲容量來緩存進(jìn)入的報文。一個報文在每個節(jié)點的延遲時間等于接收報文的所有位所需要的時間,加上等待時間和重傳到下一節(jié)點所需要的排隊延時時間。
報文交換有以下優(yōu)點
1、線路效率較高,這是因為許多報文可以用分時方式共享一條節(jié)點到節(jié)點的通道。
2、不需要同時使用發(fā)送器和接收器來傳輸數(shù)據(jù),網(wǎng)絡(luò)可以在接收器可用之前暫時存儲這個報文。
3、在線路交換網(wǎng)上,當(dāng)通訊量變得很大時,就不能接受某些呼叫。而在報文交換上卻仍然可以接收報文,只是傳送延遲會增加。
4、報文交換系統(tǒng)可以把一個報文發(fā)送到多個目的地。
5、能夠建立報文的優(yōu)先權(quán)。
6、報文交換網(wǎng)可以進(jìn)行速度和代碼的轉(zhuǎn)換,因為每個站都可以用它特有的數(shù)據(jù)傳輸率連接到其他點,所以兩個不同傳輸率的站也可以連接,另外還可以轉(zhuǎn)換傳輸數(shù)據(jù)的格式。
三、分組交換
分組交換方式兼有報文交換和線路交換的優(yōu)點。其形式上非常像報文交換。主要差別在于分組交換網(wǎng)中要限制傳輸?shù)臄?shù)據(jù)單位長度,一般在報文交換系統(tǒng)中可傳送的報文數(shù)據(jù)位數(shù)可做得很長,而在分組交換中,傳送報文的最大長度是有限制的,如超出某一長度,報文必須要分割成較少的單位,然后依次發(fā)送,我們通常稱這些較少的數(shù)據(jù)單位為分組。這就是報文交換與分組交換所不同之處。
變量變換也稱變量代換,是將原數(shù)據(jù)X轉(zhuǎn)換成它的某種函數(shù)值如lgX,X1/2等,其目的是使變換后的數(shù)據(jù)達(dá)到某種要求。例如運用方差分析作多個均數(shù)間的比較時,要求各樣本所來自的總體分布是正態(tài)的,方差是相同的,以及處理的效應(yīng)是可加的。如果樣本所來自的總體偏離這三個條件太遠(yuǎn),方法之一是進(jìn)行變量變換,使之達(dá)到上述要求。又如求曲線回歸方程時,常作變量變換,使之達(dá)到直線化的要求。此外,在計算過程中,常用變量變換達(dá)到簡化運算的要求等等。應(yīng)該指出的是,根據(jù)變換值進(jìn)行統(tǒng)計分析,常用以說明原數(shù)據(jù)的信息,而且常需還原成原數(shù)據(jù)的單位。運用方差分析時,總體的非正態(tài)性、方差的非齊性和效應(yīng)的不可加性這三者常常一起發(fā)生,往往經(jīng)過某種變量變換改正其中之一時,可使其余兩者亦有所改善。
變量變換的常用方法有對數(shù)變換、平方根變換、平方根反正弦變換、概率單位變換、logit變換、反雙曲正切變換、倒數(shù)變換、乘方變換等。方法的選擇要根據(jù)變換的目的和原數(shù)據(jù)的性質(zhì)、分布特征,特別是變換后的效果。當(dāng)變換所得數(shù)值仍未達(dá)到預(yù)期的要求時,應(yīng)具體分析其原因,再按照資料的性質(zhì)用不同的變換方法嘗試,但不要盲目亂試。
科技成果轉(zhuǎn)化主要有五種方式:①自行投資實施轉(zhuǎn)化;②向他 人轉(zhuǎn)讓科技成果;③許可他人使用科技成果;④以科技成果作為合作條件,與他人共同實施轉(zhuǎn)化;⑤以該科技成果作價投資,折算股份或者出資 比例。
其中,第一種方式屬于科技成果持有人自行轉(zhuǎn)化,即高等院校、科研 院所或企業(yè)等主體將其研發(fā)的科技成果應(yīng)用于本單位的生產(chǎn)活動,此方 式的特點是沒有中間環(huán)節(jié),降低了成果轉(zhuǎn)化的交易成本,但僅適合于研發(fā) 生產(chǎn)鏈條較為完善的主體。第二、第三種方式屬于轉(zhuǎn)移式轉(zhuǎn)化,即科技成 果持有人通過許可、轉(zhuǎn)讓的方式將科技成果的使用權(quán)或所有權(quán)轉(zhuǎn)移給技 術(shù)需求方,此方式是髙等院校、科研院所實現(xiàn)科技成果轉(zhuǎn)化的主要方式。
第四、第五種方式屬于合作轉(zhuǎn)化方式,此方式有利于產(chǎn)、學(xué)、研單位以技術(shù) 為紐帶形成利益共享、風(fēng)險共擔(dān)的合作機制。
② 數(shù)據(jù)分析為了挖掘更多的問題,并找到原因;③ 不能為了做數(shù)據(jù)分析而坐數(shù)據(jù)分析。
2、步驟:① 調(diào)查研究:收集、分析、挖掘數(shù)據(jù)② 圖表分析:分析、挖掘的結(jié)果做成圖表3、常用方法: 利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等,它們分別從不同的角度對數(shù)據(jù)進(jìn)行挖掘。 ①分類。
分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別。它可以應(yīng)用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購買趨勢預(yù)測等,如一個汽車零售商將客戶按照對汽車的喜好劃分成不同的類,這樣營銷人員就可以將新型汽車的廣告手冊直接郵寄到有這種喜好的客戶手中,從而大大增加了商業(yè)機會。
②回歸分析。回歸分析方法反映的是事務(wù)數(shù)據(jù)庫中屬性值在時間上的特征,產(chǎn)生一個將數(shù)據(jù)項映射到一個實值預(yù)測變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預(yù)測以及數(shù)據(jù)間的相關(guān)關(guān)系等。
它可以應(yīng)用到市場營銷的各個方面,如客戶尋求、保持和預(yù)防客戶流失活動、產(chǎn)品生命周期分析、銷售趨勢預(yù)測及有針對性的促銷活動等。 ③聚類。
聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購買趨勢預(yù)測、市場的細(xì)分等。
④關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的關(guān)系的規(guī)則,即根據(jù)一個事務(wù)中某些項的出現(xiàn)可導(dǎo)出另一些項在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。
在客戶關(guān)系管理中,通過對企業(yè)的客戶數(shù)據(jù)庫里的大量數(shù)據(jù)進(jìn)行挖掘,可以從大量的記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,找出影響市場營銷效果的關(guān)鍵因素,為產(chǎn)品定位、定價與定制客戶群,客戶尋求、細(xì)分與保持,市場營銷與推銷,營銷風(fēng)險評估和詐騙預(yù)測等決策支持提供參考依據(jù)。 ⑤特征。
特征分析是從數(shù)據(jù)庫中的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達(dá)了該數(shù)據(jù)集的總體特征。如營銷人員通過對客戶流失因素的特征提取,可以得到導(dǎo)致客戶流失的一系列原因和主要特征,利用這些特征可以有效地預(yù)防客戶的流失。
⑥變化和偏差分析。偏差包括很大一類潛在有趣的知識,如分類中的反常實例,模式的例外,觀察結(jié)果對期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。
在企業(yè)危機管理及其預(yù)警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應(yīng)用到各種異常信息的發(fā)現(xiàn)、分析、識別、評價和預(yù)警等方面。
⑦Web頁挖掘。
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:2.990秒