• <input id="zdukh"></input>
  • <b id="zdukh"><bdo id="zdukh"></bdo></b>
      <b id="zdukh"><bdo id="zdukh"></bdo></b>
    1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

      <wbr id="zdukh"><table id="zdukh"></table></wbr>

      1. <input id="zdukh"></input>
        <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
        <sub id="zdukh"></sub>
        公務(wù)員期刊網(wǎng) 精選范文 數(shù)據(jù)分析論文范文

        數(shù)據(jù)分析論文精選(九篇)

        前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)分析論文主題范文,僅供參考,歡迎閱讀并收藏。

        數(shù)據(jù)分析論文

        第1篇:數(shù)據(jù)分析論文范文

        1.1數(shù)據(jù)采集

        數(shù)據(jù)的采集是指利用傳感器、社交網(wǎng)絡(luò)以及移動互聯(lián)網(wǎng)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的海量數(shù)據(jù),這是一切數(shù)據(jù)分析的基礎(chǔ)。數(shù)據(jù)的采集需要解決分布式高速高可靠數(shù)據(jù)的采集、高速數(shù)據(jù)全映像等數(shù)據(jù)收集技術(shù)。還要設(shè)計質(zhì)量評估模型,開發(fā)數(shù)據(jù)質(zhì)量技術(shù)。而數(shù)據(jù)采集一般分為大數(shù)據(jù)智能感知層:主要包括數(shù)據(jù)傳感體系、網(wǎng)絡(luò)通信體系、傳感適配體系、智能識別體系及軟硬件資源接入系統(tǒng),實現(xiàn)對海量數(shù)據(jù)的智能化識別、定位、跟蹤、接入、傳輸、信號轉(zhuǎn)換、監(jiān)控、初步處理和管理等。

        1.2數(shù)據(jù)預(yù)處理

        數(shù)據(jù)采集的過程本身就有會有很多數(shù)據(jù)庫,但如果想達(dá)到有效分析海量數(shù)據(jù)的目的,就必將這些來自前端的數(shù)據(jù)導(dǎo)入到一個集中的大型分布式數(shù)據(jù)庫,或者分布式存儲集群,而且在導(dǎo)入基礎(chǔ)上做一些簡單的辨析、抽取、清洗等操作。

        ①抽取:因為我們通過各種途徑獲取的數(shù)據(jù)可能存在多種結(jié)構(gòu)和類型,而數(shù)據(jù)抽取過程可以有效地將這些復(fù)雜的數(shù)據(jù)轉(zhuǎn)換為單一的結(jié)構(gòu)或者便于處理的類型。以達(dá)到快速分析處理的目的。

        ②清洗:對于海量數(shù)據(jù)而言,數(shù)據(jù)所處的價值層次不一樣,就必然存在由于價值低而導(dǎo)致開發(fā)成本偏大的數(shù)據(jù),還有與數(shù)據(jù)分析毫無關(guān)系的數(shù)據(jù),而另一些數(shù)據(jù)則是完全錯誤的干擾項,所以對數(shù)據(jù)通過過濾“去噪”從而提取出有效數(shù)據(jù)是十分重要的步驟。

        1.3數(shù)據(jù)的存儲與管理

        當(dāng)我們采集數(shù)據(jù)完成后,就需要將其存儲起來統(tǒng)一管理,主要途徑就是建立相應(yīng)的數(shù)據(jù)庫,進行統(tǒng)一管理和調(diào)用。在此基礎(chǔ)上,需要解決大數(shù)據(jù)的可存儲、可表示、可處理、可靠性及有效傳輸?shù)葞讉€關(guān)鍵問題。還需開發(fā)可靠的分布式文件系統(tǒng)(DFS)、能效優(yōu)化的存儲、計算融入存儲、數(shù)據(jù)的去冗余及高效低成本的大數(shù)據(jù)存儲技術(shù);以及分布式非關(guān)系型大數(shù)據(jù)管理與處理技術(shù)、異構(gòu)數(shù)據(jù)的數(shù)據(jù)融合技術(shù)、數(shù)據(jù)組織技術(shù)、研究大數(shù)據(jù)建模技術(shù)、索引、移動、備份、復(fù)制、可視化技術(shù)。

        1.4數(shù)據(jù)的統(tǒng)計分析

        一般情況下,統(tǒng)計與分析主要就是利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進行普通的分析和分類匯總等,以滿足大多數(shù)常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright等,而一些批處理,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求可以使用Hadoop。統(tǒng)計與分析這部分的主要特點和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,其對系統(tǒng)資源,特別是I/O會有極大的占用。

        1.5數(shù)據(jù)分析與挖掘

        所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫中的大量不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,揭示出隱含的、先前未知的并有潛在價值的信息的過程。與前面統(tǒng)計和分析過程不同的是,數(shù)據(jù)挖掘一般不會有預(yù)先設(shè)計好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進行基于各種算法的計算,從而起到預(yù)測(Predict)的效果,從而實現(xiàn)一些高級別數(shù)據(jù)分析的需求。比較典型的算法有用于聚類的K-means、用于統(tǒng)計學(xué)習(xí)的SVM和用于分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰(zhàn)主要是用于挖掘的算法很復(fù)雜,并且計算涉及的數(shù)據(jù)量和計算量都很大,常用數(shù)據(jù)挖掘算法都以單線程為主。

        2數(shù)據(jù)分析的8個層次

        2.1標(biāo)準(zhǔn)化報告(StandardReports)

        標(biāo)準(zhǔn)化報告作為數(shù)據(jù)分析的第一個層次,要求相對較低,主要是借助相應(yīng)的統(tǒng)計工具對數(shù)據(jù)進行歸納總結(jié),得出包含主要參數(shù)指標(biāo)的標(biāo)準(zhǔn)化報告。類似于一個銷售企業(yè)每月或者每季度的財務(wù)報表。

        2.2即席查詢(AdHocReports)

        用戶可以通過自己的需求,靈活地選擇查詢條件,系統(tǒng)就能夠根據(jù)用戶的需求選擇生成相應(yīng)的統(tǒng)計報表。即席查詢與普通應(yīng)用查詢最大的不同是普通的應(yīng)用查詢是定制開發(fā)的,而即席查詢所有的查詢條件都是用戶自己定義的。在面向高層的數(shù)據(jù)分析軟件中,用戶隨意添加想要查詢的指標(biāo)按鈕再加上相應(yīng)的限制條件,就可以立即生成可視化的統(tǒng)計結(jié)果,不僅一目了然,而且沒有任何操作難度。

        2.3多維分析(QueryDrilldown)

        多維分析是指對具有多個維度和指標(biāo)所組成的數(shù)據(jù)模型進行的可視化分析手段的統(tǒng)稱,常用的分析方式包括:下鉆、上卷、切片(切塊)、旋轉(zhuǎn)等各種分析操作。以便剖析數(shù)據(jù),使分析者、決策者能從多個角度多個側(cè)面觀察數(shù)據(jù),從而深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。上卷是在數(shù)據(jù)立方體中執(zhí)行聚集操作,通過在維級別中上升或通過消除某個或某些維來觀察更概括的數(shù)據(jù)。上卷的另外一種情況是通過消除一個或者多個維來觀察更加概括的數(shù)據(jù)。下鉆是在維級別中下降或者通過引入某個或者某些維來更細(xì)致地觀察數(shù)據(jù)。切片是在給定的數(shù)據(jù)立方體一個維上進行的選擇操作,切片的結(jié)果是得到了一個二維的平面數(shù)據(jù)(切塊是在給定的數(shù)據(jù)立方體的兩個或者多個維上進行選擇操作,而切塊的結(jié)果是得到了一個子立方塊)。轉(zhuǎn)軸相對比較簡單,就是改變維的方向。

        2.4儀表盤與模擬分析(Alerts)

        儀表盤用于監(jiān)控一些關(guān)鍵指標(biāo)。模擬分析是由操作者動態(tài)地加以調(diào)節(jié)的控件(如滑動塊、可調(diào)旋鈕、選擇框等),來控制管理決策模型行為某些參數(shù)。當(dāng)操作者通過控制面板對模型中的參數(shù)值或變量值進行調(diào)節(jié)時,圖形中的曲線、柱形組或分析指標(biāo)等要素就會發(fā)生相應(yīng)的運動,而這種運動正好反映了該參數(shù)的變化對模型行為的影響,如果這種變動引起了模型中最優(yōu)解或其他關(guān)鍵數(shù)字的變化,能夠隨時將關(guān)于這種變化的結(jié)論正確地顯示出來。

        2.5統(tǒng)計分析(StatisticallyAnalysis)

        我們知道概率論是數(shù)理統(tǒng)計的基礎(chǔ),數(shù)理統(tǒng)計是在其基礎(chǔ)上研究隨機變量,并應(yīng)用概率論的知識做出合理的估計、推斷與預(yù)測。概率論中討論的各種分布在數(shù)理統(tǒng)計中作為統(tǒng)計模型來分析處理帶有隨機誤差的數(shù)據(jù)。典型的數(shù)理統(tǒng)計方法有參數(shù)估計、假設(shè)檢驗和回歸分析。而統(tǒng)計分析主要是對用戶所關(guān)注的問題進行推斷、預(yù)測和控制的分析方法。具體可以分為以下三方面:

        ①描述統(tǒng)計:主要是集中趨勢、離散程度、分布形狀等,統(tǒng)計圖(方圖、箱線圖、散點圖等);

        ②數(shù)據(jù)的分類匯總;

        ③基礎(chǔ)統(tǒng)計分析:方差分析、時間序列分析、相關(guān)和回歸分析、(主成分)因子分析等統(tǒng)計分析方法。

        2.6預(yù)測(Forecasting)

        在統(tǒng)計分析和數(shù)據(jù)挖掘領(lǐng)域,對未來的預(yù)測已經(jīng)有了很多數(shù)學(xué)模型以及解決具體問題的相關(guān)算法。其核心思想便是從歷史數(shù)據(jù)中找出數(shù)據(jù)的發(fā)展模式,然后以這些模式為支點,就可以對未來進行預(yù)測。

        2.7預(yù)測模型(PredictiveModeling)

        隨著數(shù)據(jù)分析學(xué)家對數(shù)據(jù)挖掘技術(shù)的不斷探索,出現(xiàn)了很多預(yù)測模型以及與之相對應(yīng)的算法,但是很難確定某個模型是最精確的,因為不同的領(lǐng)域,不同的條件,對應(yīng)的預(yù)測模型是不一樣的,所以沒有統(tǒng)一化的最優(yōu)模型,只存在有選擇性的最優(yōu)模型。下面介紹幾種典型的預(yù)測模型。

        ①回歸模型:回歸模型可以分為一元線性回歸模型和多元線性回歸模型。一元線性回歸模型可表示為yt=b0+b1xt+ut,該式表示變量yt和xt之間的真實關(guān)系。其中yt稱作被解釋變量(或相依變量、因變量),xt稱作解釋變量(或獨立變量、自變量),ut稱作隨機誤差項,b0稱作常數(shù)項(截距項),b1稱作回歸系數(shù)。b0+b1xt是非隨機部分,ut是隨機部分。而在很多情況下,回歸模型必包含兩個或更多自變量才能夠適應(yīng)地描述經(jīng)濟現(xiàn)象各相關(guān)量之間的聯(lián)系,這就是多元線性回歸模型需要解決的問題,其一般形式為:Y=a+b1X1+b2X2+…+bmXm,式中X1、X2、…、Xm是這個多元回歸問題的m個自變量,b1、b2、…、bm是回歸方程對應(yīng)于各自變量的系數(shù),又稱偏回歸系數(shù)。

        ②貝葉斯網(wǎng)絡(luò):貝葉斯網(wǎng)絡(luò)是基于概率推理的數(shù)學(xué)模型,而概率推理是通過一些產(chǎn)量的信息來獲取其他概率信息的過程。貝葉斯網(wǎng)絡(luò)會建立一個有向無環(huán)圖和一個概率表集合,有向無環(huán)圖中的每一個節(jié)點便是一個隨機變量,而有向邊表示隨機變量間的條件依賴,條件概率表中的每一個元素對應(yīng)有向無環(huán)圖中唯一的節(jié)點,存儲此節(jié)點對其所有直接前驅(qū)節(jié)點的條件概率。貝葉斯網(wǎng)絡(luò)是為了解決不定性與不完整性問題而提出的,在多個領(lǐng)域中獲得廣泛應(yīng)用。

        ③基于時間序列分析的指數(shù)平滑模型在時間序列分析中指數(shù)平滑模型是最靈活和準(zhǔn)確的方法,在經(jīng)濟領(lǐng)域也被證明是最有效的預(yù)測模型。在不同的時間序列下,指數(shù)平滑模型可以分為簡單指數(shù)平滑法、帶有趨勢調(diào)整的指數(shù)平滑法、帶有阻尼趨勢的指數(shù)平滑法、簡單季節(jié)指數(shù)平滑法、帶有趨勢和季節(jié)調(diào)整的指數(shù)平滑法五種不復(fù)雜度的模型。

        2.8最優(yōu)化

        (Optimization)因為優(yōu)化問題往往可以帶來巨額的收益,通過一系列可行的優(yōu)化,可以使收益得到顯著提高。所謂最優(yōu)化就是從有限或者無限種可行的方案中選取最優(yōu)的方案。如果可以通過簡單的評判,就可以確定最優(yōu)方案那是最好的。但是事實不會那么簡單,所以優(yōu)化技術(shù)已經(jīng)發(fā)展出了一系列的理論來解決實際問題。其常用的優(yōu)化技術(shù)為:

        ①線性規(guī)劃:當(dāng)目標(biāo)函數(shù)與約束函數(shù)都是線性函數(shù)時,就是一個線性規(guī)劃問題。而當(dāng)同時滿足約束函數(shù)和目標(biāo)函數(shù)時,則可以認(rèn)為是最優(yōu)解。

        ②整數(shù)規(guī)劃:要求決策變量取整數(shù)值的數(shù)學(xué)規(guī)劃。

        ③多目標(biāo)規(guī)劃:指衡量一個決策優(yōu)劣的標(biāo)準(zhǔn)不止一個,也就是有多目標(biāo)函數(shù)。

        ④動態(tài)規(guī)劃:將一個復(fù)雜的問題劃分為多個階段,逐段求解,最終求出全局最優(yōu)解。

        3用Excel實現(xiàn)簡單的數(shù)據(jù)分析

        ①對于企業(yè)而言最重要的是利潤,所以管理者必須要從這張表中得到最關(guān)鍵也最容易得到的銷量和銷售額以及與其相關(guān)的一些數(shù)據(jù),通常是用最基本的數(shù)理統(tǒng)計結(jié)果來直觀地反映該企業(yè)在某個期間的盈利情況。

        ②其次,我們必須要做進一步的分析。已經(jīng)對整體的情況有了一定的把握,所以就可以朝著不同的方向去挖掘一些有價值的信息,為企業(yè)高層做決策提供有力的依據(jù)。對產(chǎn)品銷售而言,客戶結(jié)構(gòu)能夠有效地反映客戶的地域分布,企業(yè)可以根據(jù)客戶的來源,在未開辟客戶的地域去尋找新的目標(biāo)客戶群。而銷量結(jié)構(gòu)可以直觀地反映企業(yè)最大銷量來自哪個地區(qū),對銷量較小的地區(qū)可以加大宣傳力度或者增加銷售網(wǎng)點來保持各地區(qū)銷售均衡。還可以及時地調(diào)整銷售方式來擴大市場份額,而對于銷量最小的地區(qū)考慮開辟新的市場。

        統(tǒng)計了各地區(qū)的銷售總額和平均銷售額以及兩者的對比關(guān)系。由此可以得出地區(qū)平均購買力大小,以及各地區(qū)總銷售額大小。借助圖表描述,管理者可以對企業(yè)在某段期間內(nèi)的銷售狀況有一個大概的把握,只有掌握了這些的信息,才能更細(xì)化地去研究具體的影響因素。劃分等級,對于經(jīng)常性大量購買的客戶必須要以最優(yōu)惠的價格和最好的服務(wù)讓其滿意,以形成一個穩(wěn)定的大客戶群。而對于那些少量購買的客戶,也要制定出相應(yīng)合適的方案來留住客戶。所以,分析銷售額的分布情況,可以掌握客戶的購買力度而且還能及時做一些留住大客戶的舉措。

        4用R語言實現(xiàn)數(shù)據(jù)多層次分析

        R語言是一種自由軟件編程語言與操作環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),它是一種用來進行數(shù)據(jù)探索、統(tǒng)計分析和作圖的解釋型語言。它可以提供一些集成的統(tǒng)計工具,但更大量的是它提供各種數(shù)學(xué)計算、統(tǒng)計計算的函數(shù),從而使使用者能靈活機動地進行數(shù)據(jù)分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計計算方法。而在使用R語言進行數(shù)據(jù)分析處理時,當(dāng)我們遇到很大的原始數(shù)據(jù),但用來建模的數(shù)據(jù)較小,則可以先在數(shù)據(jù)庫中進行整理,然后通過R與數(shù)據(jù)庫的接口提取數(shù)據(jù),數(shù)據(jù)庫適合存放和整理比較規(guī)整的數(shù)據(jù),和R中的數(shù)據(jù)框有良好的對應(yīng)關(guān)系,這也是R中絕大多數(shù)統(tǒng)計模型的標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)庫中大部分的運算都不需要消耗很大的內(nèi)存。

        5結(jié)語

        第2篇:數(shù)據(jù)分析論文范文

        蚊蟲基因組序列的揭示為其基因的克隆鑒定和功能分析提供了很好的平臺。由于蚊基因組中高度重復(fù)序列的廣泛存在,給一些基因特別是非編碼序列的分子克隆帶來了困難,而基因組序列的提供給這一問題的解決帶來了福音。利用已獲得的白紋伊蚊基因組序列,我們已順利克隆了其嗅覺結(jié)合蛋白(OBP)和嗅覺受體(OR)基因及其調(diào)控序列,為其嗅覺發(fā)生分子機制的闡明奠定了基礎(chǔ)。Criscione等通過比較斯氏按蚊雌蚊和雄蚊的基因組DNA和RNA樣本的Illumina測序結(jié)果,發(fā)現(xiàn)了一個Y染色體特有的基因GUY1。Hall等則發(fā)明了一種更為有效的染色體熵法,該方法的優(yōu)勢是僅利用高通量測序獲得的基因組和轉(zhuǎn)錄組數(shù)據(jù),而不需要一個固定在染色體上的參考基因組來進行比對。通過比對兩種瘧疾重要傳播媒介斯氏按蚊和岡比亞按蚊的高通量基因組和轉(zhuǎn)錄組數(shù)據(jù),系統(tǒng)性地在斯氏按蚊和岡比亞按蚊中各發(fā)現(xiàn)了3個Y基因。同時通過對鑒定的Y基因進行生物進化分析,結(jié)果表明按蚊的Y染色體進化迅速。隨后,Hall等又使用染色體熵的方法比對了雄性和雌性埃及伊蚊基因組DNA和RNA的Illumina測序數(shù)據(jù),篩選并鑒定了一個新的基因myo-sex。myo-sex基因幾乎只存在于雄蚊的基因組,但是由于基因重組偶爾地能在雌蚊的基因組中發(fā)現(xiàn),具有雄性偏好性,是一個可能具有性別拮抗效應(yīng)的肌球蛋白重鏈基因。蚊蟲基因組數(shù)據(jù)也為蚊蟲性別決定網(wǎng)絡(luò)底部基因dsx的研究提供了依據(jù)。dsx是性別決定網(wǎng)絡(luò)中的調(diào)控核心,主要行使決定體細(xì)胞和生殖細(xì)胞性別的功能,也可調(diào)控中樞神經(jīng)相關(guān)基因fruitless,進而調(diào)節(jié)。岡比亞按蚊基因組數(shù)據(jù)之后,Scali等率先鑒定了岡比亞按蚊dsx的性別特異性轉(zhuǎn)錄本,其橫跨2號染色體85kb的區(qū)域,通過選擇性拼接產(chǎn)生多個外顯子組成的雌性和雄性特異性轉(zhuǎn)錄本。而隨著2014年斯氏按蚊基因組的,有研究者將Scali等報導(dǎo)的Angdsx與剛的斯氏按蚊基因組和轉(zhuǎn)錄組進行序列比對,發(fā)現(xiàn)一致性達(dá)到了97%,而與岡比亞按蚊基因組及轉(zhuǎn)錄組序列一致性僅為85%。Scali等在埃及伊蚊中發(fā)現(xiàn)了兩種雌性特異性的可變剪接方式,這不同于黑腹果蠅和岡比亞按蚊具有的特異性DsxF。

        2蚊蟲的轉(zhuǎn)錄組學(xué)研究

        轉(zhuǎn)錄組學(xué)(transcriptomics)是一個活細(xì)胞所能轉(zhuǎn)錄出來的所有RNA的總和,是研究細(xì)胞表型和功能的一個重要手段。傳統(tǒng)上用于轉(zhuǎn)錄組數(shù)據(jù)獲得和分析的方法主要有基于雜交技術(shù)的芯片技術(shù)包括cDNA芯片和寡聚核苷酸芯片,但目前使用最普遍的是RNA-seq即轉(zhuǎn)錄組測序技術(shù)。基于Illumina高通量測序平臺的轉(zhuǎn)錄組測序技術(shù)能夠在單核苷酸水平對任意物種的整體轉(zhuǎn)錄活動進行檢測,在分析轉(zhuǎn)錄本的結(jié)構(gòu)和表達(dá)水平的同時,還能發(fā)現(xiàn)未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確地識別可變剪切位點以及cSNP(編碼序列單核苷酸多態(tài)性),提供最全面的轉(zhuǎn)錄組信息。相對于傳統(tǒng)的芯片雜交平臺,轉(zhuǎn)錄組測序無需預(yù)先針對已知序列設(shè)計探針,即可對任意物種的整體轉(zhuǎn)錄活動進行檢測,提供更精確的數(shù)字化信號,更高的檢測通量以及更廣泛的檢測范圍,是目前深入研究轉(zhuǎn)錄組復(fù)雜性的強大工具。巨蚊屬是蚊科中三種不吸血的蚊屬之一,其幼蟲階段以同在小型水體中孳生的白紋伊蚊和埃及伊蚊為食,兩性成蚊均不吸血,以植物汁液和花蜜為食。為了探究巨蚊與其它吸血蚊種在搜尋宿主方面的基因水平上有何差異,國外有學(xué)者從巨蚊上分離出觸須、觸角和身體其他部分,分別提取這三部分的RNA,利用RNA-seq技術(shù),將獲得的序列片段從頭組裝,與目前已公布的致倦庫蚊、岡比亞按蚊、埃及伊蚊基因組數(shù)據(jù)進行系統(tǒng)進化樹分析,發(fā)現(xiàn)巨蚊與埃及伊蚊的種屬關(guān)系最近,并且在上述四種蚊種中均發(fā)現(xiàn)了編碼氣味分子受體(odorantreceptor,OR)蛋白和離子轉(zhuǎn)移受體(ionotropicreceptor,IR)蛋白的基因,但值得注意的是,巨蚊受體蛋白的表達(dá)量與豐度上較其它蚊種都有所降低[18]。因為這些受體蛋白被認(rèn)為與吸血昆蟲搜尋宿主氣味分子如CO2有關(guān),所以,巨蚊在長期的生物進化過程中,喪失了原本存在的吸血習(xí)性。蚊唾液腺蛋白與其吸血傳病密切相關(guān)。國外有學(xué)者提取白紋伊蚊雌性成蚊的唾液腺RNA后進行轉(zhuǎn)錄組和蛋白質(zhì)組分析,發(fā)現(xiàn)至少有32個基因在雌性成蚊的唾液腺中表達(dá)程度或者增高或者降低,另外有17個基因表達(dá)在雌性成蚊唾液腺和雄性成蚊中,但不表達(dá)在雌性成蚊的其他組織中。通過分析發(fā)現(xiàn),其中大約三分之一的基因功能表現(xiàn)在吸血、消化糖、免疫應(yīng)答等方面,但是并未發(fā)現(xiàn)其余基因的明確功能,所以非常有可能是長期吸血的過程中進化出的新的功能分子。利用同樣的方法,分析岡比亞按蚊、斯氏按蚊、達(dá)氏按蚊、埃及伊蚊、白紋伊蚊、致倦庫蚊和致死按蚊(Anophelesfunestus)的唾液蛋白相關(guān)的轉(zhuǎn)錄組,可以將這些蛋白歸納為:

        (1)昆蟲唾液腺中普遍存在的唾液蛋白,包括抗原-5蛋白家族、核酸酶、碳水化合物水解酶等;

        (2)在吸血的長角亞目昆蟲(包括白蛉、蚋、蠓等)中豐富表達(dá)的D7蛋白;

        (3)僅在蚊唾液腺中存在的蛋白,包括30000左右的過敏原蛋白家族(allergenfamily)和一些粘蛋白。很多昆蟲都被發(fā)現(xiàn)具有一種獨特的生物學(xué)現(xiàn)象——滯育(diapause)。昆蟲的滯育現(xiàn)象被認(rèn)為是一種休眠的形式,在昆蟲發(fā)育時遇到不適宜的環(huán)境時,就會馬上由體內(nèi)激素調(diào)節(jié)并控制,暫時停止發(fā)育。白紋伊蚊被發(fā)現(xiàn)同樣具有滯育現(xiàn)象,這是它能適應(yīng)環(huán)境氣候變化,實現(xiàn)快速擴張入侵的生物學(xué)基礎(chǔ)之一。白紋伊蚊的雌性成蚊在每日受到較短時間的光照后,產(chǎn)下的卵不會立即孵化,這便是一種滯育的現(xiàn)象。有趣的是,同是伊蚊屬的埃及伊蚊,其雌性成蚊產(chǎn)的卵如果沒有接觸到水,也不會孵化、發(fā)育,這卻被認(rèn)為是一種靜息狀態(tài)(quiescence)。這兩種現(xiàn)象的區(qū)別在于,發(fā)生滯育后,白紋伊蚊的卵即使收到合適的外界環(huán)境的刺激,仍需要經(jīng)過一段時間的恢復(fù)才會孵化,而處于靜息狀態(tài)的埃及伊蚊的卵,只要受到適宜條件的刺激(如接觸到水),就會馬上進入發(fā)育階段。國外有學(xué)者利用RNA-seq技術(shù),對這兩種現(xiàn)象進行分析,發(fā)現(xiàn)這兩種現(xiàn)象在發(fā)育停止的階段,分子水平上是很相近的,不同之處在于滯育現(xiàn)象的早期準(zhǔn)備階段和后期修復(fù)階段,是其所獨有的。關(guān)于滯育現(xiàn)象的早期準(zhǔn)備階段,國外學(xué)者通過RNA-seq技術(shù),比較滯育前階段(pre-diapause)的白紋伊蚊胚胎與同時期非滯育的白紋伊蚊胚胎基因表達(dá)水平上的差異,發(fā)現(xiàn)前者在基因表達(dá)模式上有非常大的改變。目前,已有學(xué)者歸納和總結(jié)出了一套利用RNA-seq技術(shù)研究白紋伊蚊滯育現(xiàn)象的方法,為今后更全面、徹底地認(rèn)識白紋伊蚊以及其他媒介昆蟲的滯育現(xiàn)象提供了堅實的基礎(chǔ)。利用RNA-seq技術(shù),我們對白紋伊蚊不同發(fā)育時期(卵、幼蟲、蛹、雄蚊、雌蚊)和感染登革病毒前后的轉(zhuǎn)錄組進行了分析。對比分析不同發(fā)育階段特別是雌雄蚊的基因表達(dá)譜,我們找到了在胚胎早期對性別分化具有重要作用的候選基因和對雌蚊吸血傳病相關(guān)的性別偏愛基因。對比分析登革病毒感染與否的白紋伊蚊轉(zhuǎn)錄組,我們發(fā)現(xiàn)了可能與蚊媒與病原相互作用有關(guān)的免疫分子(未發(fā)表結(jié)果)。目前,針對這些候選基因的進一步功能分析正在進行之中。另外,對白紋伊蚊抗藥品系和敏感品系的RNA-seq對比分析也在進行中,這對于其抗藥機制的闡明非常重要。

        3蚊蟲的小RNA組學(xué)研究

        小RNA(smallRNAs)主要指長度在18~30nt的一類非編碼RNA(ncRNAs),在真核生物中,具有基因表達(dá)調(diào)控功能的小RNA主要有微小RNA(microRNAs,miRNAs)、內(nèi)源小干擾RNA(endo-siRNAs)和piwi干擾RNA(piRNAs)。piRNA長度集中在26-31nt,目前只在動物的生殖系細(xì)胞及干細(xì)胞中被發(fā)現(xiàn),其主要功能是參與轉(zhuǎn)座子的沉默。miRNAs和endo-siRNAs長度主要集中在20~24nt。miRNAs在動植物和微生物中都普遍存在,據(jù)估計一個物種中約1/3的基因會受到miRNA的調(diào)控,大量的實驗也表明miRNAs參與了諸多生命過程的調(diào)控,例如細(xì)胞周期、細(xì)胞分化、組織器官的發(fā)生、營養(yǎng)代謝、信號途徑以及對外界生物的非生物的環(huán)境的反應(yīng);同時,miRNAs在生產(chǎn)實踐與臨床治療上也具有很大的應(yīng)用前景。以往用于尋找miRNAs等小RNA的方法有實驗克隆法、計算機預(yù)測法。克隆法可以直接用于鑒定新小RNA,是初期發(fā)掘小RNA的常用方法,不足之處是實驗周期較長,對低表達(dá)的小RNA的發(fā)現(xiàn)能力十分有限。計算機預(yù)測法多是針對某一已知的小RNA特征設(shè)計算法,從全基因組或EST數(shù)據(jù)庫中快速發(fā)掘大量潛在的小RNA,一定程度上彌補了克隆法的缺點,然而,預(yù)測的小RNA最終還需要實驗證明,同時計算機預(yù)測法對新類型小RNA的發(fā)掘能力十分有限。隨著第二代高通量測序技術(shù)的問世,小RNA高通量測序(smallRNA-Seq)技術(shù)開始逐漸取代原始的小RNA發(fā)掘法方法,該法具有速度快、成本低、覆蓋度深等多方面的優(yōu)點,對鑒定與發(fā)現(xiàn)生命體內(nèi)的小分子RNA及其功能與機理研究起極大的推動作用。全世界有超過3000種蚊蟲,目前為止僅有岡比亞按蚊、斯氏按蚊、埃及伊蚊、致倦庫蚊以及白紋伊蚊鑒定出miRNA。一些miRNA的文庫和功能分析表明miRNA對蚊蟲的卵巢發(fā)育和吸血后的血液消化具有調(diào)節(jié)作用。病毒感染可以對宿主細(xì)胞miRNA的表達(dá)水平產(chǎn)生深遠(yuǎn)影響,可能與宿主抗病毒機制及病毒入侵后改變細(xì)胞內(nèi)環(huán)境有關(guān),雌蚊中miRNA的表達(dá)模式會隨著病原體的感染而發(fā)生變化。Hussain等對登革病毒(DENV)編碼的miRNA或病毒小RNA(vsRNAs)的進行了功能研究,他們發(fā)現(xiàn)6個vsRNAs能通過作用于病毒基因組RNA莖環(huán)結(jié)構(gòu)中的5''''和3''''的UTR區(qū),顯著增加病毒復(fù)制。中腸屏障是蚊蟲防止病原體入侵而建立的重要屏障,Alexander等的研究發(fā)現(xiàn)miR-1174僅在伊蚊和按蚊的中腸中表達(dá),且雌蚊吸血后其表達(dá)量明顯上調(diào);而當(dāng)miR-1174表達(dá)下調(diào)后,蚊子吸血率明顯降低,壽命明顯縮短。作者認(rèn)為:蚊特異性miRNAs,特別是miR-1174具有重要的生物學(xué)意義,它們可能影響人們今后控制蚊蟲的策略。我們對白紋伊蚊不同發(fā)育時期(卵、幼蟲、蛹、雄蚊、雌蚊、吸血后雌蚊)的小RNA進行了深度測序分析。結(jié)果在白紋伊蚊中篩選出119條已知的miRNA基因,確定了15條novelmiRNA基因,其中11條是伊蚊特異的,并且觀察到許多miRNA呈現(xiàn)期特異表達(dá)的特點。經(jīng)過實驗驗證,miR-286、miR-2492和miR-1891分別在白紋伊蚊的卵、幼蟲和成蟲期特異高效表達(dá),敲低/敲除這些miRNA會對蚊蟲的生長發(fā)育造成顯著影響。這些研究為新型生物殺蟲劑的研發(fā)提供了靶標(biāo)。我們還對感染登革病毒前后白紋伊蚊的細(xì)胞和成蟲的小RNA進行了深度測序分析。結(jié)果在感染登革病毒的白紋伊蚊中找到了10條表達(dá)上調(diào)的miRNA和11條表達(dá)下調(diào)的miRNA。通過對這些差顯表達(dá)miRNA的功能分析,發(fā)現(xiàn)miR-252通過與E蛋白3''''-UTR區(qū)域的結(jié)合,對登革病毒的復(fù)制起到抑制作用;而miR-281則通過與E蛋白5''''-UTR區(qū)域的結(jié)合,對登革病毒的復(fù)制具有促進作用。這些研究為抗登革病毒藥物的設(shè)計和研發(fā)提供了線索。piRNA來源于轉(zhuǎn)座元件、基因間隔區(qū)和一些編碼蛋白質(zhì)基因的3''''UTRs,對維持基因的完整性和穩(wěn)定性有一定作用,但最近的研究證明它在抗病毒免疫中也有較大作用。Schnettler等的研究證明:對蚊蟲細(xì)胞感染蟲媒病毒可以引發(fā)piRNA路徑,而敲除piRNA蛋白質(zhì)會使病毒產(chǎn)生增多。Castellano等確定了多個24-30nt的Piwi相互作用RNAs基因組簇,通過比對到轉(zhuǎn)座元件和蛋白質(zhì)編碼基因的3''''UTRs,發(fā)現(xiàn)許多TEs和一些內(nèi)源性基因的3''''UTR產(chǎn)生大量具有piRNA樣特征的29-nt小RNAs峰。此外,來自岡比亞按蚊和黑腹果蠅TEs的正義和反義piRNAs揭示了piRNA序列偏差的新特征。弗吉尼亞理工大學(xué)的研究人員最近在庫蚊中發(fā)現(xiàn)了一種新型的抗病毒途徑,Morazzani等在無dicer-2和無突變的蚊細(xì)胞中進行的實驗表明,病毒產(chǎn)生的piRNA樣小RNA可以在病毒產(chǎn)生siRNA的過程中調(diào)節(jié)病毒感染的發(fā)生。同時也表明新的piRNA途徑存在于蚊媒的體細(xì)胞中并且可能發(fā)揮著比siRNA途徑更寬泛的的抗病毒作用,顯示出其為強大的免疫系統(tǒng)。因此,理解病毒如何繞開蚊蟲的雙重抗病毒反應(yīng)對于科學(xué)家來說是越來越有趣的挑戰(zhàn)。

        4結(jié)語

        第3篇:數(shù)據(jù)分析論文范文

        關(guān)鍵詞:電子商務(wù)數(shù)據(jù)分析數(shù)據(jù)挖掘信息技術(shù)

        一、市場調(diào)查

        根據(jù)一份市場調(diào)查顯示;賣家本身體現(xiàn)的實力給人與信任可依賴程度越高,用戶越愿意來購買商品。

        在我評論之前,我申明一下,一家之言只代表一個群體的言論,并不能涵蓋每個人的想法與判斷,電子商務(wù)的數(shù)據(jù)報告只能說明趨勢,并不能完全反應(yīng)出每個顧客真實的意圖。賣家信譽-28%。價格-26%。網(wǎng)站的外觀和感覺-16%。網(wǎng)站易用性-15%。商品打折-4%。快遞和交付等原因-3%。出現(xiàn)在搜索引擎上-2%。

        這是一份市場調(diào)查的結(jié)果,數(shù)據(jù)報告對實際商業(yè)產(chǎn)生怎樣的影響,一個關(guān)鍵問題就是篩選問題的分類方式,他是否獨立又相互依存,論點論據(jù)之間重合度越低,數(shù)據(jù)報告能說明的問題越準(zhǔn)確。但在這之前首先是樣本數(shù)據(jù)的獲取與篩選方法,這里就不追溯了。我只是想根據(jù)個人對電子商務(wù)的理解,結(jié)合這份報告說點事,實際上這一組數(shù)據(jù)比較接近我個人對網(wǎng)購的理解,首先我們逐條說明這些影響一個網(wǎng)店的因素:

        二、賣家信譽

        之所以被普遍認(rèn)為是最重要的,是因為我們網(wǎng)購時并不真實的接觸到產(chǎn)品,也并不了解向你推銷商品的人是否值得可信,這都是顧客基本的一個需要認(rèn)知過程,互聯(lián)網(wǎng)上哪里去確認(rèn)?當(dāng)然如果你在一家多賣家的平臺上,往往都會有商家信用,評論等功能,很容易通過別的顧客消費情況增加自己對商家的認(rèn)知。電子商務(wù)為什么要打假信用?這只是順應(yīng)顧客需求,維護健康秩序所必須做的事情。所以作為賣家不要輕易嘗試作假信用,或者你今天逃過一劫,但說不定你明天網(wǎng)店剛做大的時候被強行關(guān)閉了。

        三、價格

        價格是一道屏障,在相互比拼中,有人拼得起,有人拼不起,但如何更好的控制價格,削減顧客成本,不僅為自己贏得更多展示機會,也會贏得更多顧客。價格不會是越低廉越好,最好的平衡體系沒有,只有一個方法,如何在綜合上為自己贏得市場??有人習(xí)慣選一些比如3.99美元的價格,看上去不加拿一分錢顧客潛在心理是這個人沒賺錢,但值得說的是商品定價因產(chǎn)品,因地域時間,顧客等因素制宜,現(xiàn)在的顧客不都是傻子,商品有的是比價機會。也有人選擇款0利潤或者賠本的商品推,但在商品里關(guān)聯(lián)組合商品賣,通過吸引用戶購買自己的組合商品或者別的商品來拉動自己銷售利潤;還有的人也是利用免費贈送或者賠本的方式掛商品,但通過物流利潤來保證自己不虧本的方式拉動店鋪其他產(chǎn)品行銷。

        四、網(wǎng)站的外觀與感覺

        有的人店鋪半年一年都是淘寶默認(rèn)的最爛的那套模板,也不知道為什么淘寶沒更新還是咋的,我沒賣過商品,還不是很了解那個,但我買東西基本不光顧這樣的店鋪,店主對店鋪的打理程度決定了我對店主的看法,因為信用不是絕對可靠的;產(chǎn)品,服務(wù)好不好,全在你的形象與行為上。

        五、網(wǎng)站易用性

        你能忍受自己在一個網(wǎng)站嘩啦了半天結(jié)果沒搞懂應(yīng)該怎么買商品嗎?我一個朋友,按照我的認(rèn)識他也是比較理性,屬于心思敏捷的,他說他在XX網(wǎng)站搞了好久,都不知道怎么買東西,所以以后都沒去過;雖然易用的應(yīng)用都還是不能被所有人接受,但簡單清楚的,沒有歧義的每一步流程總是好的。不過這個雖然用戶關(guān)注的多,但我覺得但凡有點認(rèn)識的,認(rèn)識相應(yīng)語言的人大概都明白很多網(wǎng)購系統(tǒng)的操作流程。這里就不說什么了。

        六、促銷打折

        商品打折也屬于價格范疇,只是這里細(xì)化成了一個活動,活動可以是定期的比如每周二,三,四晚上限量搶購啊;選2款顧客競價啊;前面“價格”里也提到的0價格換信用,換軟文之類的啊;參與商盟聯(lián)合促銷啊;換季狂甩啊之類的。總之參與打折的,有資本經(jīng)歷運作打折的,只要PV高,顧客肯定不會少,除非你的商品含有價格,性能,服務(wù)等水分太大,用什么樣的打折方法,最關(guān)鍵的你是銷售一時還是為了希望吸引到長久的顧客而去設(shè)計。

        七、快遞與交付等原因

        物流過程中雖然有很多不可控因素導(dǎo)致一些商品容易磨損之類的,但物流懼怕承擔(dān)責(zé)任的態(tài)度決定了自己的發(fā)展框架,假設(shè)一下,你的企業(yè)就在你的心胸里;你心胸只有100㎡大小,即使你鼓足了勁你也最多到120㎡,這樣的容量是沒有辦法和猶如大海寬廣心胸的人比較的。我是沒記住你,但有人記住你了,他下次要走物流,肯定不會選你,你損失的不只是一個用戶,而是損失了一個未來。

        八、搜索排名

        我沒有看到他們分析提交的數(shù)據(jù)時基于怎樣的搜索引擎,這個分類其實很不準(zhǔn)確,雖然數(shù)字已經(jīng)很少了,我自己買商品在淘寶,有啊上都用他們站內(nèi)的搜索引擎,如果我常用的幾個排序商品方法篩選數(shù)據(jù)你都沒排列在前三頁,那么即使你離我最近,就住在我隔壁,你服務(wù)態(tài)度最好,商品也不必別人的差;但你離我還是太遠(yuǎn)了,我根本找不到你。

        對我個人來說,像百度,GOOGLE的網(wǎng)頁搜索這樣的綜合搜索出來的商品,對我吸引力太小了,綜合搜索出來的商品并不是他信譽最高,價格最低,服務(wù)最好就顯示在了綜合搜索引擎上,只因為他的頁面更適合搜索引擎邏輯而已。商品真正追求的東西不在文本上,而在商品與服務(wù)內(nèi)在的東西里。當(dāng)然,在同等條件下,不要錯過這樣一個增加PV與交易機會的機會。

        九、總結(jié)

        目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機會。現(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢必會有更好的商業(yè)機會和更光明的前景。

        參考文獻(xiàn):

        [1]韓家煒.Web挖掘研究[J].計算機研究與發(fā)展,2001.

        [2]陳宏.消費者數(shù)據(jù)挖掘系統(tǒng)建立的幾個問題.

        [3]方美琪.電子商務(wù)概論.北京:清華大學(xué)出版社,1999.

        第4篇:數(shù)據(jù)分析論文范文

        近年來,全國大學(xué)生數(shù)學(xué)建模競賽迅速發(fā)展,為國家培養(yǎng)了大批應(yīng)用型人才。但由于各地區(qū)教育水平不同、相關(guān)部門對競賽的重視程度不同,導(dǎo)致各地區(qū)組織學(xué)生參加大學(xué)數(shù)學(xué)建模競賽的規(guī)模不同,在該項賽事中取得的成績差異比較顯著。2013年全國大學(xué)生數(shù)學(xué)建模競賽評選出的獎項有:賽區(qū)優(yōu)秀組織工作獎9個,本科組高教社杯獎1個,專科高教社杯獎1個,本科組MATLAB創(chuàng)新獎1個,專科組MATLAB創(chuàng)新獎1個,本科組IBMSPSS創(chuàng)新獎1個,專科組IBMSPSS創(chuàng)新獎1個,本科組一等獎共273名,本科組二等獎共1292名,專科組一等獎共44名,專科組二等獎共211名[1],但成績相對于參賽區(qū)分布不太均勻。分析各地區(qū)在2013年全國大學(xué)生數(shù)學(xué)建模競賽中取得的成績,明確各地區(qū)數(shù)學(xué)建模發(fā)展?fàn)顩r的差異和特點,將有利于相關(guān)部門從宏觀上了解我國大學(xué)生數(shù)學(xué)建模競賽的整體發(fā)展現(xiàn)狀,分類制定相關(guān)政策[2-3],從而充分發(fā)揮數(shù)學(xué)建模的重要作用。

        1建立綜合評價指標(biāo)體系

        全國大學(xué)生數(shù)學(xué)建模競賽現(xiàn)狀的一個重要方面就是全國大學(xué)生數(shù)學(xué)建模競賽獲獎情況。依據(jù)全國大學(xué)生數(shù)學(xué)建模競賽設(shè)置的獎項,遵循可比性原則,參考文獻(xiàn)[4-5],選取x1-x7共七項評價指標(biāo),具體如下:x1:本科組高教社杯、MATLAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎獲獎情況;x2:本科組一等獎獲獎數(shù);x3:本科組二等獎獲獎數(shù);x4:專科組高教社杯、MATLAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎獲獎情況;x5:專科組一等獎獲獎數(shù);x6:專科組二等獎獲獎數(shù);x7:年度競賽優(yōu)秀組織工作獎獲得情況。說明:鑒于本科組與專科組的高教社杯、MAT-LAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎三類獎項每年只有一個隊獲獎,且基本不可重復(fù)獲得(參見歷年大學(xué)生數(shù)學(xué)建模競賽獲獎名單)故將其合并作為一類。

        2數(shù)據(jù)資料依據(jù)

        2013年全國大學(xué)生數(shù)學(xué)建模競賽獲獎名單,按指標(biāo)對各個賽區(qū)的獲獎情況統(tǒng)計如表1所示。

        3R型聚類分析定性分析

        七項指標(biāo)之間的相關(guān)性。編寫MAT-LAB程序如下:>>clc,clear>>symxy;>>x=xlsread(‘shuju.xls’);%將上表中的數(shù)據(jù)保存到MATLAB中WORK文件夾excel文件shu-ju.xls中,并將其賦于x>>y=corr(x)%輸出七項指標(biāo)間的相關(guān)系數(shù)矩陣(如表2所示)>>d=pdist(y,’correlation’);%計算相關(guān)系數(shù)導(dǎo)出的距離>>z=linkage(d,’average’);%按類平均法聚類>>h=dendrogram(z);%畫聚類圖(如圖1所示)>>T=cluster(z,’maxclust',5);%把變量劃分為5類>>fori=1:5tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有4;第2類的有56;第3類的有7;第4類的有23;第5類的有1。即:若將指標(biāo)分為5類,則指標(biāo)1、4、7各為一類,指標(biāo)2、3為一類,指標(biāo)4、5為一類。

        4Q型聚類分析

        4.1選取5個指標(biāo)的分類從R型聚類分析分出的5類指標(biāo)中各選一個,即選取5個指標(biāo)體系,對33個參賽地區(qū)進行聚類分析。首先對變量數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,采用歐氏距離度量樣本間相似性,選用類平均法計算類間距離。在MATLAB命令窗口輸入下列程序:>>symsxy;>>x=xlsread(’shuju.xls’);%將上表中的數(shù)據(jù)保存到MATLAB中WORK文件夾excel文件shu-ju.xls中,并將其賦于x>>x(:,[3,5])=[];%刪除數(shù)據(jù)矩陣的3,5兩列,即使用變量1,2,4,6,7>>x=zscore(x);%將數(shù)據(jù)標(biāo)準(zhǔn)化>>s=pdist(x);%每一行是一個對象,求對象間的歐式距離>>z=linkage(s,’average’);%按類平均法聚類>>h=dendrogram(z);%畫聚類圖(如圖2所示)>>T=cluster(z,’maxclust’,3);%把樣本點劃分成3類>>fori=1:3;tm=find(T==i);%求i類的對象tm=reshape(tm,1,length(tm));%變成行向量>>fprintf(’第%d類的有%s\n’,i,int2str(tm));%現(xiàn)實分類結(jié)果>>end程序輸出:第1類的有11318第2類的有2345678910111216171920212224252627282930313233第3類的有141523即:第一類:北京,福建,湖南;第三類:江西,山東,四川;第二類:其它地區(qū)。

        4.2選取7個指標(biāo)的分類考慮到指標(biāo)2與指標(biāo)3,指標(biāo)5與指標(biāo)6具有一定的獨立性,若七個指標(biāo)體系全部取用,將33個地區(qū)分為4類,程序輸入如下:>>symsxy;>>x=xlsread(’shuju.xls’);>>s=pdist(x);>>z=linkage(s,’average’);>>h=dendrogram(z);%畫聚類圖(如圖3所示)>>T=cluster(z,’maxclust’,4);>>fori=1:4tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有116第2類的有6710151927第3類的有23489111213141718202223242528第4類的有521262930313233即:第一類:北京,河南;第二類:遼寧,吉林,江蘇,山東,廣東,陜西;第四類:內(nèi)蒙古,海南,,青海,寧夏,新疆,香港,澳門。4.3選取本科層次指標(biāo)的分類只考慮本科層次取得的成績,即選用指標(biāo)1,2,3,對33個參賽地區(qū)進行聚類分析,從而明確掌握其本科階段的差異,則有:輸入程序:>>symsxy;>>x=xlsread(’shuju.xls’);>>x(:,[4,5,6,7])=[];>>x=zscore(x);>>s=pdist(x);>>z=linkage(s,’average’);>>h=dendrogram(z);%畫聚類圖(如圖4所示)>>T=cluster(z,’maxclust’,3);>>fori=1:3;tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有11318第2類的有101115161719222327第3類的有2345678912142021242526282930313233即:第一類:北京,福建,湖南;第二類:江蘇,浙江,山東,河南,湖北,廣東,重慶,四川,陜西;第三類:其它地區(qū)。4.4選取專科層次指標(biāo)的分類只考慮專科層次取得的成績,即選用指標(biāo)4,5,6,對33個參賽地區(qū)進行聚類分析,從而明確掌握其專科階段的差異,則有:輸入程序:>>symsxy;>>x=xlsread(’shuju.xls’);>>x(:,[1:3,7])=[];>>x=zscore(x);>>s=pdist(x);>>z=linkage(s,’average’);%畫聚類圖(如圖5所示)>>h=dendrogram(z);>>T=cluster(z,’maxclust',4);>>fori=1:4;tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有14第2類的有1523第3類的有41927第4類的有1235678910111213161718202122242526282930313233即:第一類:江西;第二類:山東,四川;第三類:山西,廣東,陜西;第四類:其余各地區(qū)。

        5結(jié)束語

        第5篇:數(shù)據(jù)分析論文范文

        [摘要]目前地勘單位的檔案數(shù)據(jù)管理,存在職責(zé)不明、保存不妥的現(xiàn)象,造成了不良后果和嚴(yán)重?fù)p失,因此,加強地勘單位檔案管理工作,提高地勘人員質(zhì)量意識和建立地質(zhì)檔案數(shù)據(jù)管理體系。推動檔案管理工作的規(guī)范化、信息化,標(biāo)準(zhǔn)化。

        地質(zhì)工作信息化建設(shè)是一項復(fù)雜的系統(tǒng)工程,而地勘單位的信息化建設(shè)與基礎(chǔ)數(shù)據(jù)也就是檔案是密不可分。地質(zhì)檔案數(shù)據(jù)是在地質(zhì)勘查活動中直接形成的、有保存價值的文字、圖表及聲像載體材料等,它既是野外勘測過程的真實反映和記錄、地勘經(jīng)濟發(fā)展的重要基礎(chǔ)和依據(jù),也是單位維權(quán)的憑證和依據(jù)。基礎(chǔ)的地質(zhì)數(shù)據(jù)文件具有內(nèi)容的單一性、載體的多樣性、形式的特殊性等特點,隨著社會信息化的飛速發(fā)展,地勘單位數(shù)據(jù)文件的內(nèi)容、形式、載體等屬性也發(fā)生了較大的變化,特別是以地質(zhì)找礦項目為中心所形成的檔案材料具有全面化、精確化、系統(tǒng)化的成套性和現(xiàn)實性、專業(yè)性要求,而一個完整的地質(zhì)項目要經(jīng)過立項、設(shè)計、施工、竣工等階段,要經(jīng)過主管局等上級部門的審批和驗收,因此收集整理符合標(biāo)準(zhǔn)的數(shù)據(jù)文件本身就有很多工作要做,那么如何做好管理工作,更好地為地質(zhì)找礦和社會經(jīng)濟發(fā)展服務(wù)?本文就結(jié)合著地勘單位的資料管理工作實際談幾點粗淺的認(rèn)識。

        1加強領(lǐng)導(dǎo),建立組織,收集數(shù)據(jù)

        抓好基礎(chǔ)數(shù)據(jù)文件工作,首先要從思想上重視檔案管理工作,提高認(rèn)識,從監(jiān)與管兩方面入手,分管檔案工作的領(lǐng)導(dǎo)應(yīng)給予多方面的支持和提供資源保障,用規(guī)范化、信息化、標(biāo)準(zhǔn)化來要求檔案的收集、整理、歸檔、保管和開發(fā)利用工作,建立起“內(nèi)外”有別而又相互統(tǒng)一的檔案管理體系。“內(nèi)”就是要協(xié)調(diào)內(nèi)部各職能部門增強檔案意識,注重收集與及時移交,防止檔案材料的散失;“外”就是要抓住每一個環(huán)節(jié)的檔案收集,積極與主管部門、設(shè)計、施工等單位負(fù)責(zé)人及檔案人員通力協(xié)作,以保證歸檔案卷數(shù)據(jù)的完整、準(zhǔn)確、系統(tǒng)。建立健全檔案管理組織,不僅是行政管理的重要組成部分,而且是必須做好的一項基礎(chǔ)性工作,因此,要明確有關(guān)人員與部門的職責(zé),用制度管人,用制度辦事,將數(shù)據(jù)文件工作作為硬任務(wù)列入地勘項目指標(biāo)條款,在單位規(guī)章制度體系中將地勘單位檔案工作以法律文書的形式規(guī)定下來,鼓勵和支持檔案管理人員深入現(xiàn)場收集檔案資料,作為檔案人員應(yīng)有針對性地列出所需收集的資料名目,自始至終參與到項目管理中去,保質(zhì)保量地獲取第一手資料。另外,還要與外購、有關(guān)單位進行交換、復(fù)制索取以及標(biāo)準(zhǔn)化的網(wǎng)絡(luò)收集等。形成完整有效的地質(zhì)數(shù)據(jù)文件。

        2建立制度,編制方案,完善規(guī)則

        長期以來,地勘工作執(zhí)行和延續(xù)計劃經(jīng)濟的管理體制,缺少市場經(jīng)濟體制中的競爭意識和對原始數(shù)據(jù)質(zhì)量問題的關(guān)注意識。只有調(diào)動全員的積極性,以完善科學(xué)的管理制度做指導(dǎo),按標(biāo)準(zhǔn)建立質(zhì)量管理體系,使一切工作有章可循,才能從根本上解決原始地質(zhì)數(shù)據(jù)的完整性和質(zhì)量問題。制度要健全,執(zhí)行要堅決。按照檔案管理的法律法規(guī)及相關(guān)規(guī)定的有關(guān)規(guī)定與標(biāo)準(zhǔn),對已經(jīng)收集的文字、圖紙、圖片、聲像等資料,應(yīng)根據(jù)數(shù)據(jù)文件形成的規(guī)律和特點,在便于保管和利用的前提下,進行科學(xué)分類整理,設(shè)置相應(yīng)的歸檔類目,按原始地質(zhì)立卷歸檔規(guī)則如:范圍、規(guī)范性引用檔、術(shù)語與定義、歸檔范圍與分類、編號與編目、立卷歸檔要求等,還包括地質(zhì)項目的設(shè)計檔案、設(shè)施工檔案和竣工檔案等。應(yīng)根據(jù)本單位的實際情況和具體要求,制定本單位的數(shù)據(jù)文件管理實施細(xì)則,細(xì)則應(yīng)主要明確本單位數(shù)據(jù)文件的范圍,歸檔的基本要求和基本內(nèi)容,數(shù)據(jù)文件的移交與整理、保存與借閱的要求等。

        數(shù)據(jù)要齊全,內(nèi)容要完整。要達(dá)到此目標(biāo)要求,應(yīng)該重視抓好資料的收集工作,堅持地質(zhì)項目建檔工作按照檔案管理規(guī)范要求與項目施工、竣工驗收同步,堅持檔案部門與基層單位相結(jié)合,編制分類方案,正確區(qū)分和把握依據(jù)檔、設(shè)計檔、項目管理檔、施工竣工驗收及檔等的分類工作,齊抓共管,進一步做好基礎(chǔ)檔案歸檔工作。

        管理要及時,立卷要規(guī)范。為確保數(shù)據(jù)文件齊全、完整、系統(tǒng),就要把數(shù)據(jù)文件工作與項目計劃、檢查、總結(jié)、驗收各個環(huán)節(jié)的工作相聯(lián)系,同步進行,立卷做到格式統(tǒng)一、字跡工整、圖像清晰,同時根據(jù)內(nèi)容、價值、數(shù)量和載體形式進行系統(tǒng)整理,按項目組卷,使檔案數(shù)據(jù)做到文件齊全、分類準(zhǔn)確、體系鮮明、方便管理,方便利用,保持其整體功能。并將立卷好的檔案按規(guī)定移交有關(guān)檔案管理部門,嚴(yán)格交接手續(xù),認(rèn)真核查案卷質(zhì)量并確保檔案的完整。。

        3加強培訓(xùn)依法制檔

        目前,地勘單位的數(shù)據(jù)文件管理工作遠(yuǎn)不能跟上飛速發(fā)展的地勘形勢的要求。一個單位數(shù)據(jù)文件管理的好壞,不僅與本單位的檔案規(guī)章制度健全與否、主管檔案的領(lǐng)導(dǎo)的思想觀念、檔案管理人員水平的高低息息相關(guān),更與檔案數(shù)據(jù)的組織者對檔案數(shù)據(jù)的重視程度有著極大的關(guān)系。數(shù)據(jù)文件作為科技檔案的重要組成部分,它服務(wù)于今天,有利于未來,為歷史查找、產(chǎn)權(quán)查證、經(jīng)濟糾紛以及科學(xué)研究提供素材,針對某些領(lǐng)導(dǎo)和技術(shù)人員檔案意識薄弱、檔案管理人員素質(zhì)差的現(xiàn)狀,一是要結(jié)合地勘單位的特點,加強對數(shù)據(jù)文件管理人員的培訓(xùn),應(yīng)該組織其學(xué)習(xí)、貫徹《中華人民共和國檔案法》。《中華人民共和國檔案法》明文規(guī)定,一個國家機關(guān)、武裝力量、政黨、社會團體、企業(yè)事業(yè)單位和公民都有保護檔案的義務(wù)。但目前地勘單位的數(shù)據(jù)文件管理缺乏有力的檔案執(zhí)法機制是一個比較突出的問題。在檔案未形成時,就有檔案資料散落在工程技術(shù)人員及合同管理人員或是一些領(lǐng)導(dǎo)者個人手中的現(xiàn)象,根據(jù)現(xiàn)存在情況,應(yīng)檔案法宣傳列入全年工作計劃和責(zé)任目標(biāo)考核內(nèi)容,并認(rèn)真制訂宣傳計劃,采取多種形式、通過不同媒體進行宣傳,不斷強化監(jiān)督指導(dǎo)功能,特別是主管部門和業(yè)務(wù)指導(dǎo)部門,既要做好執(zhí)法檢查和業(yè)務(wù)指導(dǎo),又要做到定期或不定期抽查,做到點面結(jié)合、跟蹤督辦。結(jié)合正在實施的保密協(xié)議簽定工作形成有法必依、執(zhí)法必嚴(yán)的局面,推動檔案工作向規(guī)范化、標(biāo)準(zhǔn)化的方向發(fā)展。認(rèn)真學(xué)習(xí)檔案管理的有關(guān)法律法規(guī)及辦法,強化崗前培訓(xùn)。從目前看,許多檔案部門缺乏現(xiàn)代高科技人才,其中檔案、信息處理復(fù)合型人才就更加奇缺,大部分檔案人員現(xiàn)代技術(shù)水準(zhǔn)偏低,甚至有現(xiàn)代文盲現(xiàn)象。盡管引進了現(xiàn)代化設(shè)備,仍不能充分發(fā)揮作用,就難以實現(xiàn)檔案信息化了。因此,信息化建設(shè)人才需要深厚的檔案學(xué)基礎(chǔ)理論,熟悉檔案工作的規(guī)律,從而創(chuàng)新科學(xué)先進的管理方法,因此必須通過各種不同形式的培訓(xùn),提高檔案人員業(yè)務(wù)能力和管理水平,自覺增強責(zé)任意識,把檔案提升一個新臺階。

        4檔案信息電子化紙質(zhì)檔案數(shù)字化

        資料檔案信息化建設(shè)是一項長期復(fù)雜的系統(tǒng)工程,行業(yè)不同,信息化管理模式也不同。面對信息化帶來的挑戰(zhàn)與機遇,地勘單位與其它企業(yè)一樣面臨市場化和國際化競爭的挑戰(zhàn)。為提高地勘單位的整體素質(zhì),推動地勘單位的改革與發(fā)展,充分利用好信息化這個武器,走出一條適合自己的信息化建設(shè)之路。所謂檔案信息電子化,就是以館藏檔案數(shù)據(jù)紙質(zhì)或機讀形式的為主要物質(zhì)對象,用微機對檔案進行收集、篩選、加工,使之轉(zhuǎn)化為微機軟件形式的二次文件信息電子文文件數(shù)據(jù)供利用的過程。把地質(zhì)資料數(shù)據(jù)文件歸檔電子化,充分利用計算機、掃描儀把紙質(zhì)檔案數(shù)字化,建立全文數(shù)據(jù)庫,以便于存儲查找和利用,既是地質(zhì)工作現(xiàn)實要求,也是檔案管理必然取向。因此地勘單位必須快速更新觀念,迅速實現(xiàn)檔案工作網(wǎng)絡(luò)化,為地質(zhì)找礦工作服務(wù),推動其它各項工作的現(xiàn)代化進程。

        參考文獻(xiàn):

        第6篇:數(shù)據(jù)分析論文范文

        關(guān)鍵詞:USB;數(shù)據(jù)采集;EZ-USBFX2;GPIF

        1引言

        現(xiàn)代工業(yè)生產(chǎn)和科學(xué)研究對數(shù)據(jù)采集的要求日益提高。目前比較通用的是在PC或工控機內(nèi)安裝數(shù)據(jù)采集卡(如A/D卡及422、485卡)。但這些數(shù)據(jù)采集設(shè)備存在以下缺陷:安裝麻煩、價格昂貴、受計算機插槽數(shù)量、地址、中斷資源的限制,可擴展性差,同時在一些電磁干擾性強的測試現(xiàn)場,可能無法專門對其作電磁屏蔽,從而導(dǎo)致采集的數(shù)據(jù)失真。

        傳統(tǒng)的外設(shè)與主機的通訊接口一般是基于PCI總線、ISA總線或者是RS-232C串行總線。PCI總線雖然具有較高的傳輸速度(132Mbps),并支持“即插即用”功能,但其缺點是插拔麻煩,且擴展槽有限(一般為5~6個),ISA總線顯然存在同樣的問題。RS-232C串行總線雖然連結(jié)簡單,但其傳輸速度慢(56kbps),且主機的串口數(shù)目也有限。

        通用串行總線(UniversalSerialBus,簡稱USB)是1995年康柏、微軟、IBM、DEC等公司為了解決傳統(tǒng)總線的不足,而推出的一種新型串行通信標(biāo)準(zhǔn)。該總線接口具有安裝方便、高帶寬、易擴展等優(yōu)點,已經(jīng)逐漸成為現(xiàn)代數(shù)據(jù)傳輸?shù)陌l(fā)展趨勢。基于USB的數(shù)據(jù)采集系統(tǒng)充分利用USB總線的上述優(yōu)點,有效地解決了傳統(tǒng)數(shù)據(jù)采集系統(tǒng)的缺陷。USB的規(guī)范能針對不同的性能價格比要求提供不同的選擇,以滿足不同的系統(tǒng)和部件及相應(yīng)不同的功能,從而給使用帶來極大方便。

        2系統(tǒng)介紹

        2.1數(shù)據(jù)采集系統(tǒng)的結(jié)構(gòu)與功能

        常見的數(shù)據(jù)采集系統(tǒng)的硬件總體結(jié)構(gòu)如圖1所示。其中數(shù)據(jù)采集接口卡是硬件部分的核心,它包括A/D轉(zhuǎn)換器、微控制器、USB通信接口等。

        在高速數(shù)據(jù)采集系統(tǒng)中由于現(xiàn)場輸入信號是高頻模擬信號,因而信號的變化范圍都比較大如果采用單一的增益放大那么放大以后的信號幅值有可能超過A/D轉(zhuǎn)換的量程所以必須根據(jù)信號的變化相應(yīng)地調(diào)整放大器的增益。在自動化程度較高的系統(tǒng)中希望能夠在程序中用軟件控制放大器的增益AD8321正是這樣一種具有增益可編程功能的芯片。AD8321是美國AD公司生產(chǎn)的一種增益可編程線性驅(qū)動器。它具有頻帶寬、噪聲低、增益可編程且易于與單片機進行串行通信等優(yōu)點,十分適合在數(shù)據(jù)采集系統(tǒng)中做前置放大。

        經(jīng)過調(diào)理后的信號可送入模/數(shù)變換器(ADC)進行A/D變換。筆者選用的ADC是TLC5540,它是一種高速8位模擬數(shù)字轉(zhuǎn)換器,能以高達(dá)每秒40M的采樣速率進行轉(zhuǎn)換,由于采用半閃速結(jié)構(gòu)和CMOS工藝制造,因此功耗和成本很低。其75MHz(典型值)的模擬輸入帶寬使該器件成為欠采樣應(yīng)用的良好選擇。該器件帶有內(nèi)部電阻,可用于從5V電源產(chǎn)生2V滿度的基準(zhǔn)電壓,以減少外部元件數(shù)。數(shù)字輸出置于高阻方式。它僅需要5V電源工作,可由USB總線供電。

        由于數(shù)據(jù)采集接口卡是硬件部分的核心,因此應(yīng)選擇能適用USB協(xié)議的合適芯片。EZ-USBFX2是一種USB2.0集成微控制器。它的內(nèi)部集成了USB2.0收發(fā)器、串行接口引擎(SIE)、增強的8051微控制器和一個可編程的串行接口。其主要特性如下:

        帶有加強的8051內(nèi)核性能,可達(dá)到標(biāo)準(zhǔn)8051的5~10倍,且與標(biāo)準(zhǔn)8051的指令完全兼容;

        集成度高,芯片內(nèi)部集成有微處理器、RAM、SIE(串行接口引擎)等多個功能模塊,從而減少了多個芯片接口部分需要時序配合的麻煩;

        采用軟配置,在外設(shè)未通過USB接口接到PC機之前,外設(shè)上的固件存儲在PC上;而一旦外設(shè)連接到PC機上,PC則先詢問外設(shè)是“誰”(即讀設(shè)備描述符),然后將該外設(shè)的固件下載到芯片的RAM中,這個過程叫做再枚舉。這樣,在開發(fā)過程中,當(dāng)固件需要修改時,可以先在PC機上修改好,然后再下載到芯片中;

        具有易用的軟件開發(fā)工具,該芯片開發(fā)系統(tǒng)的驅(qū)動程序和固件的開發(fā)和調(diào)試相互獨立,可加快開發(fā)的速度。

        圖2USB接口示意圖

        2.2方案選擇

        FX2有三種可用的接口模式:端口、GPIF主控和從FIFO。

        在“端口”模式下,所有I/O引腳都可作為8051的通用I/O口。

        在“從FIFO”模式下,外部邏輯或外部處理器直接與FX2端點FIFO相連。在這種模式下,GPIF不被激活,因為外部邏輯可直接控制FIFO。這種模式下,外部主控端既可以是異步方式,也可以是同步方式,并可以為FX2接口提供自己的獨立時鐘。

        “GPIF主控”接口模式使用PORTB和PORTD構(gòu)成通向四個FX2端點FIFO(EP2EP4EP6和EP8)的16位數(shù)據(jù)接口。GPIF作為內(nèi)部的主控制器與FIFO直接相連,并產(chǎn)生用戶可編程的控制信號與外部接口進行通信。同時,GPIF還可以通過RDY引腳采樣外部信號并等待外部事件。由于GPIF的運行速度比FIFO快得多,因此其時序信號具有很好的編程分辨率。另外,GPIF既可以使用內(nèi)部時鐘,也可以使用外部時鐘。故此,筆者選擇了GPIF模式。

        高速數(shù)據(jù)采集卡的設(shè)計存在兩大難點:一是模擬信號的A/D高速轉(zhuǎn)換;二是變換后數(shù)據(jù)的高速存儲及提取。對于第一個問題,由于制造ADC的技術(shù)不斷進步,這個問題已經(jīng)得到解決。而對于第二個問題,一般的數(shù)據(jù)采集系統(tǒng)是將A/D轉(zhuǎn)換后的數(shù)據(jù)先存儲在外部數(shù)據(jù)存儲器中,然后再對其進行處理。對于高速數(shù)據(jù)采集而言,這種方式將嚴(yán)重影響采集速度,且存儲值也會受到很大限制。而改進方案是將A/D轉(zhuǎn)換后的數(shù)據(jù)直接送至計算機內(nèi)存,這樣,采集速度將大大提高,而且可存儲大量數(shù)據(jù),以便于下一步的處理。

        為了解決同步問題,可以由CPLD產(chǎn)生同步時鐘信號提供給ADC和FX2。在本數(shù)據(jù)采集系統(tǒng)的設(shè)計中,CPLD同時還可用于產(chǎn)生不同的控制信號,以便對采樣進行實時控制。CPLD是復(fù)雜可編程邏輯器件,它包括可編程邏輯宏單元、可編程I/O單元和可編程內(nèi)部連線。由于CPLD的內(nèi)部資源豐富,因而可廣泛應(yīng)用在數(shù)據(jù)采集、自動控制、通訊等各個領(lǐng)域。在本系統(tǒng)的設(shè)計中,筆者選用的CPLD是Lattice公司的ispLSI1016。圖2所示是其整個USB接口卡的硬件電路圖。

        3系統(tǒng)軟件設(shè)計

        該系統(tǒng)軟件主要包括USB設(shè)備驅(qū)動程序、設(shè)備固件和應(yīng)用程序。

        3.1設(shè)備固件(Firmware)設(shè)計

        設(shè)備固件是設(shè)備運行的核心,可采用匯編語言或C語言設(shè)計。其主要功能是控制CY7C68013接收并處理USB驅(qū)動程序的請求(如請求設(shè)備描述符、請求或設(shè)置設(shè)備狀態(tài),請求或設(shè)置設(shè)備接口等USB2.0標(biāo)準(zhǔn)請求)、控制芯片CY7C68013接收應(yīng)用程序的控制指令、控制A/D模塊的數(shù)據(jù)采集、通過CY7C68013緩存數(shù)據(jù)并實時上傳至PC等。

        即使外部邏輯或內(nèi)置的普通可編程接口(GPIF)在沒有CPU的任何干涉下能夠通過四個大的端點FIFO來處理高速寬帶數(shù)據(jù),固件還是有如下固定的工作:

        配置端點;

        通過控制端點零來響應(yīng)主機請求;

        控制和監(jiān)測GPIF的活動;

        利用USART處理所有的特殊請求任務(wù),如計時器、中斷、I/O引腳等。

        3.2USB設(shè)備驅(qū)動程序開發(fā)

        USB系統(tǒng)驅(qū)動程序采用分層結(jié)構(gòu)模型分別為較高級的USB設(shè)備驅(qū)動程序和較低級的USB函數(shù)層。其中USB函數(shù)層由兩部分組成:較高級的通用串行總線驅(qū)動程序模塊(USBD)和較低級的主控制器驅(qū)動程序模塊(HCD)。

        在上述USB分層模塊中,USB函數(shù)層(USBD及HCD)由Windows提供,負(fù)責(zé)管理USB設(shè)備驅(qū)動程序和USB控制器之間的通信;加載及卸載USB驅(qū)動程序;與USB設(shè)備通用端點(endpoint)建立通信并執(zhí)行設(shè)備配置、數(shù)據(jù)與USB協(xié)議框架和打包格式的雙向轉(zhuǎn)換任務(wù)。目前Windows提供有多種USB設(shè)備驅(qū)動程序,但并不針對實時數(shù)據(jù)采集設(shè)備,因此需采用DDK開發(fā)工具來設(shè)計專用的USB設(shè)備驅(qū)動程序。該設(shè)備驅(qū)動程序應(yīng)由初始化模塊、即插即用管理模塊、電源管理模塊以及I/O功能等四個模塊來實現(xiàn)。

        初始化模塊可提供一個DriverEntry入口點以執(zhí)行大量的初始化函數(shù)。

        即插即用管理模塊用來實現(xiàn)USB設(shè)備的熱插拔及動態(tài)配置。當(dāng)硬件檢測到USB設(shè)備接入時,Windows查找相應(yīng)的驅(qū)動程序,并調(diào)用它的DriverEn-try例程,同時告訴它添加了一個設(shè)備;然后,驅(qū)動程序為USB設(shè)備建立一個FDO(功能設(shè)備對象)。在此處理過程中,驅(qū)動程序收到一個IRPMNSTARTDE-VICE的IRP,在它之中包括有設(shè)備的資源信息。至此,設(shè)備被正確配置,驅(qū)動程序開始與硬件進行對話。當(dāng)然,在設(shè)備運行過程中,如果設(shè)備狀態(tài)發(fā)生變化(拔除、暫停等),PnP管理器也同樣發(fā)出相應(yīng)的IRP,以便由驅(qū)動程序進行相應(yīng)的處理。

        電源管理模塊負(fù)責(zé)設(shè)備的掛起與喚醒。

        I/O功能實現(xiàn)模塊可完成I/O請求的大部分工作。當(dāng)應(yīng)用程序提出I/O請求時,它將調(diào)用Win32API函數(shù)DeviceIoControl向設(shè)備發(fā)出命令,然后由I/O管理器構(gòu)造一個IRP并設(shè)置其MajorFunction.域為IRPMJDEVICECONTROL。在USB設(shè)備驅(qū)動程序收到該IRP后它將取出其中的控制碼并利用一個開關(guān)語句查找對應(yīng)的程序入口。

        3.3應(yīng)用程序設(shè)計

        應(yīng)用程序設(shè)計由兩個部分組成:動態(tài)鏈接庫和應(yīng)用程序。動態(tài)鏈接庫負(fù)責(zé)與內(nèi)核態(tài)的USB功能驅(qū)動程序通信并接收應(yīng)用程序的各種操作請求,而應(yīng)用程序則負(fù)責(zé)對所采集的數(shù)據(jù)進行實時顯示、分析和存盤。

        動態(tài)鏈接庫的工作原理如下:當(dāng)它收到應(yīng)用程序開始采樣的請求后,首先創(chuàng)建兩個線程:采樣線程和顯示存盤線程。采樣線程負(fù)責(zé)將采樣數(shù)據(jù)寫到應(yīng)用程序提交的內(nèi)存;而顯示存盤線程則負(fù)責(zé)給應(yīng)用程序發(fā)送顯示和存盤消息。當(dāng)應(yīng)用程序接收到此消息后,便從它提交的內(nèi)存中讀取數(shù)據(jù)并顯示和存盤。要注意的是:采樣線程和顯示存盤線程在讀寫應(yīng)用程序提交內(nèi)存時要保持同步。

        PC機或工控機應(yīng)用程序是數(shù)據(jù)實時采集系統(tǒng)的中心可采用Labview編程。它是當(dāng)今國際上唯一的編譯型圖形化編程語言,其特點如下:

        (1)能完成對固體表面速度的實時測量;

        (2)主介面與多重窗口結(jié)合可完成數(shù)據(jù)連續(xù)采集、實時統(tǒng)計分析、系統(tǒng)參數(shù)設(shè)置、信號波形顯示、被測參數(shù)輸出等綜合系統(tǒng)功能。

        (3)能充分利用Labview開發(fā)平臺和WINDOWS視窗所提供的良好操作環(huán)境集曲線、圖形、數(shù)據(jù)于一體可準(zhǔn)確描述過程參數(shù)的變化。

        圖3所示是用高速數(shù)據(jù)采集系統(tǒng)采集通過Lab-view顯示的一個波形實例,其輸入信號是一個頻率為5MHz的正弦波。

        第7篇:數(shù)據(jù)分析論文范文

        移動數(shù)據(jù)業(yè)務(wù)是指向移動設(shè)備傳送非話音的信息,涵蓋從尋呼信息到移動電話上的Web接入,再到e-mail發(fā)送等所有方面。美國移動數(shù)據(jù)產(chǎn)業(yè)的增和非常明顯,不僅四家全美主導(dǎo)型移動電話運營者——SprintPCS、AT&T無線、Verizon無線和Nextel在2000年夏季先后推出了移動Internet接入業(yè)務(wù),到2000年底,它們的用戶總數(shù)已接近250萬;而且還有另3家區(qū)域性運營者——VoiceStream、ALLTEL和Cingular無線公司同時進軍移動Internet市場。

        2000年,尋呼/信息運營者繼續(xù)推銷基于Web的高級、雙向業(yè)務(wù);PDA制造商開始提供其它手持設(shè)備,連接無線Internet,并擴張Internet的內(nèi)容和服務(wù);Metricom等公司開始經(jīng)由Modem設(shè)備提供無線Internet業(yè)務(wù),其中有些市場的Internet接入速率已達(dá)128kbit/s。

        從總體看,雖然移動數(shù)據(jù)業(yè)務(wù)在美國已相當(dāng)流行,但在其它國家,用戶數(shù)更多。如截至到2001年3月底,日本NTTDoCoMo的I-mode移動Internet業(yè)務(wù)的用戶數(shù)已達(dá)2170萬,普及率15%,占DoCoMo的3600萬移動電話總用戶數(shù)的60%。與2000年3月I-mode的580萬用戶數(shù)相比,增長了245%,在歐洲,SMS已非常盛行。2000年12月,英國和德國的移動電話用戶分別發(fā)送了7.56億條和18億條SMS億條、5億條的近3倍和4倍。在芬蘭,90%的移動電話用戶使用SMS,每月發(fā)送的信息平均超過7500萬條。

        二、美國主要移動數(shù)據(jù)業(yè)務(wù)的發(fā)展?fàn)顩r

        無疑,WAP、移動商務(wù)以及定位業(yè)務(wù)等對未來無線數(shù)據(jù)業(yè)的發(fā)展將越來越重要,但至今它在美國乃至全球仍處于萌芽期。美國目前開展的移動數(shù)據(jù)業(yè)務(wù)主要分為四大類:第一類是由尋呼信息運營者使用尋呼和窄帶PCS頻率提供的傳統(tǒng)單向?qū)ず艉透呒墏餍艠I(yè)務(wù);第二類是由移動電話運營者使用蜂窩、寬帶PCS和SMR頻率提供的移動數(shù)據(jù)業(yè)務(wù),包括無線Web、e-mail和SMS;第三類是應(yīng)用移動Internet連接,在手持PDA(個人數(shù)字助理)設(shè)備上通過對高級信息設(shè)備或移動電話內(nèi)置或外加無線Modem提供的數(shù)據(jù)業(yè)務(wù);第四類是由專用數(shù)據(jù)網(wǎng)絡(luò)運營者提供的移動數(shù)據(jù)業(yè)務(wù)。

        1、尋呼/信息業(yè)務(wù)

        2000年,尋呼信息業(yè)務(wù)市場競爭依然激烈,用戶數(shù)和收益趨于下降,分別從1999年的4580萬美元和52.5億美元下降到了4530萬美元和51億美元,降幅分別為1%和3%。不過,高級信息業(yè)務(wù)的用戶數(shù)從70萬增長到了120萬,上漲了70%之多,相應(yīng)的收益提高了46%,達(dá)2.57億美元(1999是1.76億美元)。

        Arch和Metrocall是尋呼/信息業(yè)的最大運營者,兩者占有45%的用戶市場份額。其它主要運營商包括SkyTel、Weblink和VerizonMessaging。Orbcomm和Motient提供衛(wèi)星信息、尋呼、e-mail和其它移動數(shù)據(jù)業(yè)務(wù),尤其是Or5bcomm利用低軌衛(wèi)星提供雙向監(jiān)測、跟蹤和衛(wèi)星信息,僅在2001年2月就發(fā)送了87.2萬條信息。2001年5月,Orbcomm被LLC收購。

        在新業(yè)務(wù)開發(fā)上,美國尋呼/信息業(yè)務(wù)公司在2000年采取了諸多舉措,大約有30萬傳統(tǒng)的單向?qū)ず粲脩粝蚋呒壭畔I(yè)務(wù)轉(zhuǎn)移。此外,像Metrocall公司為鼓勵高校使用高級信息業(yè)務(wù),還推出了校園連接(CampusLink)計劃,允許高校使用無線裝置告知學(xué)生即將發(fā)生的事情,包括定位、課程安排變動及其它有關(guān)的校園定位事件。

        2、移動電話運營者提供的數(shù)據(jù)業(yè)務(wù)

        美國移動電話運營者繼續(xù)發(fā)展移動數(shù)據(jù)業(yè)務(wù),主要在移動電話上開展web接入、SMS和e-mail。

        (1)無線Web

        目前,美國有7家運營商使用現(xiàn)有網(wǎng)絡(luò)經(jīng)由移動電話手機提供基于文本的、速率從9.6到19.2kbit/s的web業(yè)務(wù),用戶通過沖浪web網(wǎng)站查閱新聞、股市信息、交通報告、天氣預(yù)報、電影海報、購物,以及其它的基于文本的信息。一些移動Internet用戶還從事網(wǎng)上交易,如使用移動電話交易股票或購買電影票等。

        到2000年底,美國超過250萬人,或2.3%的移動用戶使用無線web業(yè)務(wù)。SprintPCS是最大運營者,擁有其中的100多萬。Verizon無線和AT&T無線緊隨其后,分別擁有75萬和45.9萬,SprintPCS聲稱,80%由它提供的手機能夠上網(wǎng),其大約10%的用戶正在使用web業(yè)務(wù)。

        對于無線web,不同的運營者一般采取不同的資費方案。SprintPCS、Verizon無線及其它一些公司實行結(jié)合實際下時間內(nèi)的套餐資費,每月6-14美元不等,超過給定的使用時間(如100分鐘),將按分鐘另行計費。AT&T無線和Nextel公司在2000年第二季度引入移動web業(yè)務(wù)后,對基本無線web接入實行免費,但對增值移動Internet業(yè)務(wù),如e-mail等推行包月制資費。據(jù)AT&T分析,其大約15%-20%的用戶使用增值業(yè)務(wù)。Cingular無線和ALLTEL公司實行對新用戶有限時間內(nèi)的免費方案。

        (2)SMS

        SMS是指應(yīng)用手機發(fā)送和接收文本信息,長度可以為120-256個字節(jié)。移動用戶使用SMS,可以獲得大范圍信息,包括股票價格、體育比賽比分、新聞標(biāo)題和天氣預(yù)報等。從全球來看,SMS越來越流行,發(fā)送信息已從1999年30億條增長到了2000年150億條。

        2000年,美國引入雙向SMS,VoiceStream是第一家運營者。接著,Verizon無線和AT&T無線公司步其后塵。進入2001年后,TeleCorp也加入其中。VoiceStream目前還提供與SMS類似但名為e-notes業(yè)務(wù),允許VoiceStream用戶向其它VoiceStream用戶發(fā)送字節(jié)較少的e-mail信息。

        不同運營者對SMS也實行了不同的資費標(biāo)準(zhǔn)。Verizon無線推出兩種套餐資費:一是每月2.99美元可發(fā)送和接收100條信息;二是每月7.99美元可發(fā)送600條信息,超出的每條發(fā)送為0.10美元,接收一律為0.20美元。AT&T無線則實行允許用戶每月免費接收250條信息,超出的接收以及發(fā)送按0.10美元計費,或者用戶每月支付4.99美元接收和發(fā)送500條,超出的再按0.10美元收取。

        3、手持設(shè)備

        許多手持PDA設(shè)備通過內(nèi)置或外加無線Modem,或者通過附加移動電話到PDA中向用戶提供無線連接Internet。與基于web的移動電話一樣,這些設(shè)備向用戶提供接入e-mail和web內(nèi)容。手持設(shè)備一般具有更大的屏幕,比移動電話的功能也強,但不能內(nèi)置話音組件。目前,美國主要有三類手持設(shè)備連接無線Internet:一是使用PalmOS操作系統(tǒng)包括Palm設(shè)備和Handspring瀏覽器設(shè)備;二是由RIM公司制造的運行RIMBlackBerry業(yè)務(wù)的設(shè)備;三是運行微軟公司PocketPC或WindowsCE操作系統(tǒng)的設(shè)備。2001年1月,Palm宣稱占有所有手持零售設(shè)備61%的市場份額。

        (1)PalmOS設(shè)備

        美國有兩家手持設(shè)備制造商運行PalmOS操作系統(tǒng),它們是Palm和Handspring。Palm目前利用不同的手持模式提供三種接入無線Internet的方式:第一是PalmVIIx,是PalmVII的升級版,裝有內(nèi)置無線Modem,用戶可用之接入Palm公司的包括web限幅(clipping)應(yīng)用,允許用戶瀏覽580個經(jīng)限幅的web網(wǎng)站,以及移動e-mail接入到帳戶。業(yè)務(wù)連接Cingular交互公司的數(shù)據(jù)網(wǎng),可以在全美260個城市使用,且不收漫游費。

        Palm公司的其它PDA包括Palmm105、PalmIII和PalmV系列的用戶,能夠通過依附移動電話或無線Modem連接Internet,但不能接收Palm公司的業(yè)務(wù)。不過,通過移動電話連接Internet的Palm用戶可以到達(dá)450多個限幅web網(wǎng)站,并可以利用Palm公司的MultiMai軟件和一個HotmailEarthlink或Yahoo的帳戶發(fā)送、接收e-mail信息。如果使用GSM手機,還可以通過SMS發(fā)送和接收文本信息。PalmIII和PalmV系列的用戶也可以通過在手持設(shè)備中外加諸如由9kbit/Minstrel公司制造的無線Modem卡連接Internet。無線Modem卡用戶可以接收移動接入web內(nèi)容和e-mail信息,還可以接入公司內(nèi)聯(lián)網(wǎng)和數(shù)據(jù)庫,速率大概是19.2kbit/s。

        (2)RIM設(shè)備和BlackBerry業(yè)務(wù)

        目前RIM制造和銷售四種手持設(shè)備——RIM957、RIM867、RIM950和RIM850,它們都能使用內(nèi)置無線Modem連接無線Internet。從體積來看,RIM950和RIM850與雙向高級信息設(shè)備差不多,而RIM857和RIM957與前述的手持PDA類似。這四種設(shè)備都擁有PDA創(chuàng)立(organizer)軟件和全QWERTY鍵區(qū)。RIM公司通過Motient的DataTAC網(wǎng)絡(luò)為RIM850和RIM857提供移動Internet接入業(yè)務(wù),而RIM950和RIM957運行在Cingular交互公司的Mobitex網(wǎng)絡(luò)中。

        此外,所有的RIM設(shè)備都包括RIM的BlackBerrye-mail業(yè)務(wù),允許用戶接收、編輯、發(fā)送、歸檔和過濾信息。RIM提供兩種版本的Blackberry,分別針對商業(yè)用戶和個人用戶,可以從不同的轉(zhuǎn)售商獲取。

        (3)PocketPC設(shè)備

        PocketPC是WindowsCE的升級版,包含微軟桌面軟件應(yīng)用(如Word、Excel、Outlook和InternetExplorer)的PDA版。現(xiàn)有HP、Casio和Compaq三家公司制造運行PocketPC和連接無線Internet的手持設(shè)備,這些設(shè)備如HPJomada、CasioE-125和CompaqiPAQ沒有內(nèi)置無線Modems,接入Internet需要外加無線Modem。其中,HPJomada使用Minstrel540無線Modem、CasioE-125需要NextcellPocketSpidermodem,CompaqiPAQ則需要一張PC卡擴展槽和Sierra的無線Aircard300。

        4、專用數(shù)據(jù)網(wǎng)

        美國有許多運營者通過專用數(shù)據(jù)網(wǎng)提供移動數(shù)據(jù)業(yè)務(wù),這些網(wǎng)絡(luò)最初服務(wù)于垂直市場,如資產(chǎn)跟蹤和外勤服務(wù),現(xiàn)在已走向水平市場,包括信息和Internet接入。美國目前有三家主導(dǎo)型專用數(shù)據(jù)網(wǎng)運營者,它們分別是Motient、Cingular交互公司和Metricom。

        (1)Motient

        Motient使用800MHz、SMR頻段向許多用戶提供移動數(shù)據(jù)業(yè)務(wù),包括向移動專業(yè)人才提供信息、遙測數(shù)據(jù)、運輸和外勤服務(wù)。2000年4月、RIM宣布使用Motient的DataTAC網(wǎng)絡(luò)提供無線Internet連接到它的RIM850和RIM857BlackBerry用戶,并與Motient聯(lián)合提供e-mail業(yè)務(wù),名為“BlackBerrybyMotient”。Palm也使用Motient的設(shè)備接收和發(fā)送Yahoo郵件和及時信息,以及接入Yahoo郵件和及時信息,以及接入Yahoo的內(nèi)容和服務(wù)。截至到2000年底,Motient擁有4.5萬eLink用戶,比1999年底的3萬增長了50%。

        (2)Cingular交互公司

        Cingular交互公司是Cingular無線的下屬商業(yè)單元,提供一系列的移動數(shù)據(jù)業(yè)務(wù),如高級信息等,并與Motient類似,在900MHz頻段通過其Mobitex網(wǎng)絡(luò)為RIM950、RIM957BlackBerry和PalmVII手持設(shè)備提供無線Internet連接。在2000年,Cingular交互公司還與RIMBlackBerry聯(lián)合提供名為MyBizInteractive的信息和e-mail業(yè)務(wù)。此外,F(xiàn)idelity和AOL也使用Cingular交互公司的網(wǎng)絡(luò)提供業(yè)務(wù)到無線設(shè)備。2000年期間,Cingular交互公司平均每個季度增長9萬用戶,到2000年底,用戶數(shù)達(dá)57萬。1999年底時,用戶數(shù)僅有20萬。

        (3)Matricom公司

        Metricom使用900MHz頻段、經(jīng)許可的2.3GHz無線通信業(yè)務(wù)(WCS)頻段,以及未被許可的2.4GHz頻段提供移動數(shù)據(jù)業(yè)務(wù),主要是經(jīng)由外加的無線Modem提供移動接入Internet和企業(yè)網(wǎng),最高速率已達(dá)到128Kbit/s。另有許多公司,如WorldCom、SkyTel和UUNet等轉(zhuǎn)售Metricom的業(yè)務(wù)。到2000年底,Metricom擁有3.4萬用戶(1999年底為2.97萬),其中128Kbit/s業(yè)務(wù)用戶數(shù)為1.22萬。

        三、美國3G的進展

        第三代或3G一般是指高級移動業(yè)務(wù),超越CDMA、TDMA、GSM、和iDEN等第二代技術(shù)的下一代技術(shù)為此提供了可能。而提供更高速移動數(shù)據(jù)業(yè)務(wù)的2.5G技術(shù)可能會被作為從2G向3G的過渡技術(shù)。

        從2000年至今,美國許我移動電話運營者宣布考慮建設(shè)2.5G和3網(wǎng)絡(luò),從事相關(guān)試驗,并與設(shè)備制造商簽訂合作協(xié)議。然而,諸多分析家和業(yè)者深信,在現(xiàn)有技術(shù)和經(jīng)濟障礙下,廣泛建設(shè)3G網(wǎng)絡(luò),以及應(yīng)用其它高級技術(shù)還需假以時日。其它國家也如此,由于不同的硬件和軟件問題,它們建設(shè)2.5G和3G網(wǎng)絡(luò)也是從2001年第一季度才開始的。

        在美國,運營者已被允許選擇不同的技術(shù)來發(fā)展話音和高級移動數(shù)據(jù)業(yè)務(wù)。目前使用CDMA2G技術(shù)的兩家最大移動電話運營商Verizon無線公司和SprintPCS在2001年早期宣稱,它們將在2001年發(fā)展cdma20001X,并以此作為3G技術(shù)在第一階段的應(yīng)用。與現(xiàn)行CDMA網(wǎng)絡(luò)相比,CDMA20001X有望加倍話音網(wǎng)絡(luò)的容量,并提高數(shù)據(jù)傳輸速率到144kbit/s。根據(jù)計劃,這兩家公司將分別在2002年和2003年進一步提高網(wǎng)絡(luò)數(shù)據(jù)速率到2.4Mbit/s。此外,Nextel也宣布將在其iDEN網(wǎng)絡(luò)發(fā)展CDMA2000技術(shù)。

        美國主要的GSM和TDMA運營商,包括AT&T無線、VoiceStream和Cingular無線正在考慮向3G演變的不同途徑。這三家運營商均計劃在2001年發(fā)展GPRS技術(shù),提高數(shù)據(jù)傳輸速率到25-14kbit/s。在引入GPRS之后,這三家公司都有望走向使用介于GPRS和WCDMA之間的EDGE過渡技術(shù)。EDGE和WCDMA可以提高網(wǎng)絡(luò)速率分別達(dá)384kbit/s和2Mbit/s。Cingular無線公司已明確表示,它將從2002年到2003年期間在其全部市場建設(shè)EDGE和WCDMA演化。此外,在從NTTDoCoMo獲得大量投資后,AT&T無線公司明確,將從2002年早期提供I-mode,首先覆蓋西雅圖,一二年后再走向全美。

        第8篇:數(shù)據(jù)分析論文范文

        【關(guān)鍵詞】關(guān)聯(lián)數(shù)據(jù);定量分析;語義網(wǎng)

        Abstract:The paper focused on Linked Data which has been published by 1990- 2010 in China for the analysis of data,then used quantitative analysis method to carry on the statistical analysis,analyzed the situation of Linked Data from time distribution,author distribution,periodicals distribution,Scientific research fund distribution and the subject distribution.At the same time,this paper summarized the shortcoming and development trend of Linked Data research.

        Key words:Linked Data;quantitative analysis;Semantic Web

        關(guān)聯(lián)數(shù)據(jù)的概念為WWW(World Wide Web)的發(fā)明者,被譽為互聯(lián)網(wǎng)之父的Tim Berners-Lee于2006年在《關(guān)聯(lián)數(shù)據(jù)筆記》中首次提出,在該文中他分析了Web的發(fā)展與演變,提出了發(fā)展數(shù)據(jù)網(wǎng)絡(luò)的思想,而數(shù)據(jù)網(wǎng)絡(luò)的核心和關(guān)鍵則是關(guān)聯(lián)數(shù)據(jù)。2009 年在TED大會上,他提出關(guān)聯(lián)數(shù)據(jù)就是一箱箱數(shù)據(jù),當(dāng)通過開放標(biāo)準(zhǔn)關(guān)聯(lián)在一起時,從中可以萌發(fā)出很多新事物和新應(yīng)用[1]。

        關(guān)聯(lián)數(shù)據(jù)簡單的說就是一些RDF格式的數(shù)據(jù),也是用三元組(主體,謂詞,客體)來表示資源。所以研究關(guān)聯(lián)數(shù)據(jù),知道數(shù)據(jù)的RDF(Resource Description Framework)格式是必不可少的。關(guān)聯(lián)數(shù)據(jù)和RDF數(shù)據(jù)最主要的區(qū)別在于關(guān)聯(lián)數(shù)據(jù)是要到網(wǎng)上,并供人搜索的,所以描述資源的三元組的不再是統(tǒng)一資源標(biāo)志符(URI),而是URI和.

        [2]白海燕.基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的信息組織深度序化研究[2010-09-26]..

        [3]Boutin G.Tying Web 3.0,the semantic Web and linked data together[2010-09-26].http:///archives/understanding_the_new_web_era_web_30_linked_data_s.php.

        [4]趙華等.UG在我國的研究、應(yīng)用現(xiàn)狀及進展[J].現(xiàn)代情報,2008(10):137-141.

        [5]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2010,05:1-7.

        [6]吳玥,李占羽.基于關(guān)聯(lián)數(shù)據(jù)開放政府?dāng)?shù)據(jù)[J].電腦知識與技術(shù),2010,31:8688-8691.

        [7]趙梓彤,謝海先.關(guān)聯(lián)數(shù)據(jù)在網(wǎng)絡(luò)信息管理中的應(yīng)用[J].圖書館學(xué)研究,2011,12:47-50.

        [8]張寧.基于關(guān)聯(lián)數(shù)據(jù)的農(nóng)業(yè)信息空間數(shù)據(jù)組織研究[J].農(nóng)機化研究,2012,04:249-252.

        [9]洪娜,錢慶,方安,范煒,李亞子,王軍輝.生物醫(yī)學(xué)關(guān)聯(lián)數(shù)據(jù)研究進展與比較分析[J].圖書情報工作,2012,06:123-129.

        [10]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報,2011,02:5-12.

        [11]D2R Server-Publishing Relational Databases on the Semantic Web[EB/OL][2010-12-28].http://www4.Wiwiss.fu-berlin.de/bizer/d2r-server/.

        [12]:Overview[EB/OL].[2010-09-12].http:///.

        [13]Open Link Software[EB/OL][2010-09-11].http://.

        [14]Coetzee P,Heath T,Motta E.SparqPlug:Generating linked data from legacy Html,Sparql and the DOM.[2010-09-26].http:///ldow2008/papers/05-coetzee-heath-sparqplug.pdf.

        [15]Cygan關(guān)聯(lián)數(shù)據(jù)k B.Pubby-a linked data frontend for Sparql endpoints.2010-09-26].http://www4.wiwiss.fu-berlin.de/pubby/.

        [16]Talis platform.[2010-09-26].http:///platform/.

        [17]沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報技術(shù),2010,11:1-9.

        [18]徐華.關(guān)聯(lián)數(shù)據(jù)在國外圖書館中的應(yīng)用及其借鑒意義[J].圖書館學(xué)研究,2011,16:87-89.

        [19]紐約時報以關(guān)聯(lián)數(shù)據(jù)形式新聞目錄[J].中國傳媒科技,2009,06:11.

        第9篇:數(shù)據(jù)分析論文范文

        關(guān)鍵詞:DSPUSBFPGACPLDFirmware驅(qū)動程序

        隨著DSP芯片功能越來越強,速度越來越快,性價比的不斷提高以及開發(fā)工具的日趨完善,廣泛用于通信、雷達(dá)、聲納、遙感、生物醫(yī)學(xué)、機器人、控制、精密機械、語音和圖像處理等領(lǐng)域。作為計算機接口之一的USB(UniversalSerialBus)口具有勢插拔、速度快(包括低、中、高模式)和外設(shè)容量大(理論上可掛接127個設(shè)備)的特性,使其成為PC機的設(shè)備擴展中應(yīng)用日益廣泛的接口標(biāo)準(zhǔn)。本文設(shè)計并實現(xiàn)了基于DSP的USB口數(shù)據(jù)采集分析系統(tǒng),該系統(tǒng)的DSP負(fù)責(zé)數(shù)據(jù)的采集和運算處理,處理結(jié)果通過USB口送計算機顯示分析,其結(jié)構(gòu)如圖1所示。

        該結(jié)構(gòu)圖中,CPLD和FPGA實現(xiàn)模塊接口,包括串并轉(zhuǎn)換、8位和32位數(shù)據(jù)總線間的轉(zhuǎn)換、SRAM等功能。采樣結(jié)果經(jīng)過CPLD送至DSP運算處理(FFT變換、相關(guān)分析、功率譜分析等)后,由FPGA和USB接口送至主控計算機存儲和顯示。計算機應(yīng)用程序易于實現(xiàn)豐富的圖形界面,具有良好的人機接口。

        1模數(shù)模塊

        本系統(tǒng)主要用于振動信號和噪聲分析,要求采樣精度高,采樣頻率不超過100kHz。根據(jù)要求選用CRYSTAL公司的CS5396。該芯片原本用于立體聲采樣,基于∑-Δ結(jié)構(gòu),采樣精度高,24位分辨率,120dB的動態(tài)范圍;采樣頻率32kHz、44.1kHz、48kHz、96kHz可選;內(nèi)部集成采樣保持器、模擬低通濾波器、數(shù)字濾波器,同時還具有時采樣功能;兩路同時采樣,串行輸出,串行數(shù)據(jù)由CPLD轉(zhuǎn)換成24位并行數(shù)據(jù);由于該芯片量程是4V,差分輸入,所以模擬部分只需再加上簡單量程放大電路即可。這樣模擬電路十分簡單,抗干擾能力強、精度高。

        2DSP處理器

        選擇DSP處理器時主要考慮其運算速度、總線寬度和性價比。本系統(tǒng)采樣結(jié)構(gòu)24位,最好選用32位DSP;系統(tǒng)要進行實時信號分析、模態(tài)分析等,要求有較高運算速度,所以選用TI公司的32位浮點DSP——TMS320VC33。該芯片采用哈佛結(jié)構(gòu),6級流水線操作,指令執(zhí)行周期7ns,外設(shè)包括一個DMA控制器和一個緩沖串口。

        N點復(fù)數(shù)FFT變換約做2N×Log2N次實數(shù)乘法運算和3N×Log2N實時加法運算。TMS320VC33的乘法、加法都是單周期指令,取N=1024,不計內(nèi)存訪問和其它時間,則一次FFT所需時間為:10×5120×17ns約0.9ms。而按96KSPS的采樣頻率計算,1024點的采樣時間約10ms,可見該DSP速度足以滿足要求。

        該DSP啟動模式可選,上電后執(zhí)行駐留在低地址空間的BOOTLOADER;然后根據(jù)4個中斷輸入信號的狀態(tài)判斷啟動模式,可以從RAM、ROM或串行口啟動。本系統(tǒng)選擇串行口方式。這樣,DSP程序可以直接從PC下載送至DSP接口,做到在系統(tǒng)調(diào)試,具有極大的靈活性。

        3USB接口

        USB協(xié)議的實現(xiàn)基于網(wǎng)絡(luò)的思想,是一種共享式的總線,在總線上數(shù)據(jù)以包(Packet)的形式發(fā)送。USB的數(shù)據(jù)傳送有4種模式:塊傳輸(BulkTransfers)、中斷傳輸(InterruptTransfers)、同步傳輸(IsochronousTransfers)、控制傳輸(ControlTransfers)。當(dāng)需要快速傳輸大批量的準(zhǔn)確數(shù)據(jù)時,一般采用塊傳輸模式;當(dāng)傳輸實時性較強的數(shù)據(jù)時,采用中斷傳輸模式。

        當(dāng)USB設(shè)備插入計算機時,計算機和USB設(shè)備之間產(chǎn)生一個枚舉過程。計算機檢測到有設(shè)備插入,自動發(fā)出查詢請求;USB設(shè)備回應(yīng)這個請求,送出設(shè)備的VerdorID和ProductID;計算機根據(jù)這兩個ID裝載相應(yīng)的設(shè)備驅(qū)動程序,完成枚舉過程。

        由于USB協(xié)議非常復(fù)雜,開發(fā)者不可能在底層基礎(chǔ)上進行開發(fā)。目前,市場上對USB協(xié)議進行封裝的接口芯片,如:NationalSemiconductor公司的USBN9602、Plilips公司的PDIUSBD12等。本系統(tǒng)選用CYPRESS公司的帶單片機內(nèi)核的EZ-USB系列的AN2131QC.該芯片遵從USB1.0規(guī)范(12Mbps),將8051單片機內(nèi)核、智能USB接口引擎、USB收發(fā)模塊、存儲器、串行口等集成一起,從而減少芯片接口時序。其內(nèi)部結(jié)構(gòu)如圖2(虛線內(nèi)是芯片部分)。

        EZ-USB的8051代碼(Firmware)可以固化在ROM內(nèi);更好的方案是通過USB口從主機下載到內(nèi)部RAM,這樣,易于修改、調(diào)試和更新。之所以能下載代碼是因為芯片一上電完全在硬件上自動完成枚舉過程,不需要Firmware。完成枚舉后便可作為一個USB設(shè)備(叫做缺省USB設(shè)備)與計算機通訊,此時即可進行Firmware下載。下載完后,8051內(nèi)核脫離RESET狀態(tài)開始執(zhí)行代碼。可以通過Firmware對USB設(shè)備重新配置,這個重新配置過程叫做再枚舉。

        在EZ-USB中,缺省USB設(shè)備的接口中包括14個Endpoints,如表1所示。

        表1缺省USB端點(Endpoint)

        EndpointTypeAlternateSetting

        012

        MaxPacketSize(bytes)

        0CTL06464

        1ININT01664

        2INBULK06464

        2OUTBULK06464

        4INBULK06464

        4OUTBULK06464

        6INBULK06464

        6OUTBULK06464

        8INISO016256

        8OUTISO01616

        9INISO01616

        9OUTISO01616

        10INISO01616

        10OUTISO01616

        計算機與USB設(shè)備的數(shù)據(jù)通信主要包括兩個方面:一是讀取采樣數(shù)據(jù);二是給USB設(shè)備發(fā)送控制命令。發(fā)送控制命令先發(fā)送一個命令包(消息),然后根據(jù)情況發(fā)送后續(xù)數(shù)據(jù)或從設(shè)備讀取響應(yīng)數(shù)據(jù)。因此,根據(jù)EZ-USB芯片的功能,直接使用缺省配置中的6個Endpoint。

        EndpoitOUT2BULK:用來發(fā)送控制命令包。

        EndpointIN2BULK:接收從USB設(shè)備發(fā)來的DSP消息。

        EndpointIN4BULK:用來從USB設(shè)備讀取數(shù)據(jù),如讀取采樣數(shù)據(jù)、配置參數(shù)等。

        EndpointOUT4BULK:用來向USB設(shè)備發(fā)送數(shù)據(jù),如下載8051程序、下載FPGA程序等。

        EndpointOUT6BULK:作輔助判斷用,當(dāng)PC傳送完大量數(shù)據(jù)至USB設(shè)備時,向該端口寫任意數(shù)據(jù)以起到通知USB設(shè)備的作用。

        EndpointIN1INT:用來從USB設(shè)備讀取響應(yīng)信號,如下載FPGA程序是否成功的標(biāo)志等。

        在缺省配置基礎(chǔ)上可以編寫適合需要的代碼,如果對8051編程經(jīng)驗豐富的話,完全可以在不需要調(diào)試工具的情況下編寫Firmware。

        本系統(tǒng)Firmware結(jié)構(gòu)建立在對消息隊列不斷服務(wù)基礎(chǔ)上,即構(gòu)建一個消息隊列,當(dāng)接收到任何一方(DSP或計算機)的消息時,將其放入消息隊列。消息的接收是通過中斷服務(wù)程序來實現(xiàn)的。當(dāng)處理完一個消息時,從消息隊列取出下一個消息進行處理。這種軟件結(jié)構(gòu)非常簡單,思路清晰,對調(diào)試十分有利。

        USB設(shè)備驅(qū)動程序基于WDM。WDM型驅(qū)動程序是內(nèi)核程序,與標(biāo)準(zhǔn)的Win32用戶態(tài)程序不同。采用了分層處理的方法。通過它,用戶不需要直接與硬件打它道(在USB驅(qū)動程序中尤為明顯),只需通過下層驅(qū)動程序提供的接口號訪問硬件。因此,USB設(shè)備驅(qū)動程序不必具體對硬件編程,所有的USB命令、讀寫操作通過總線驅(qū)動程序轉(zhuǎn)給USB設(shè)備。但是,USB設(shè)備驅(qū)動程序必須定義與外部設(shè)備的通訊接口和通訊的數(shù)據(jù)格式,也必須定義與應(yīng)用程序的接口。

        本系統(tǒng)的驅(qū)動程序是在CompuwareNumegaDriver-Works的基礎(chǔ)上采用面向?qū)ο笳Z言C++開發(fā)的。Driver-Works可以很快構(gòu)造出驅(qū)動程序的框架。主要構(gòu)造了兩個類:ClassUSBDAC和classUSBDACDevice。ClassUSBDAC繼承了classKdriver,負(fù)責(zé)裝載驅(qū)動程序和創(chuàng)建功能設(shè)備對象時要做的一些操作。ClassUSBDACDevice繼承了classKpnpDevice,是驅(qū)動程序的主要部分,負(fù)責(zé)設(shè)備啟動、停止的操作以及與設(shè)備的數(shù)據(jù)通訊。API函數(shù)調(diào)用和CreateFile()、ReadFile()、WriteFile()、DeviceIO-Control()、CloseFile()等的實現(xiàn)也在classUSBDACDevice中完成。

        ClassUSBDAC的定義如下:

        classUSBDAC:publicKdriver

        {

        SAFE_DESTRUCTORS

        public:

        /*DriverEntry(),在系統(tǒng)引導(dǎo)或I/O管理器裝入驅(qū)動程序時,調(diào)用這個例程。執(zhí)行大量的初始化函數(shù),包括建立到其它驅(qū)動程序的指針、查找和定位由驅(qū)動程序使用的任何硬件資源等,不過,這部分工作大多由基類Kdriver完成。*/

        virtualNTSTATUS

        DriverEntry(PUNICODE_STRINGRegistryPath);

        /*AddDevice(),創(chuàng)建一個Device對象。調(diào)用其構(gòu)造函數(shù)對設(shè)備初始化,創(chuàng)建設(shè)備的名稱等。*/

        virtualNTSTATUS

        AddDevice(PDEVICE_OBJECTPdo);

        Intm_Unit;

        };

        ClassUSBDACDevice的定義如下:

        ClassUSBDACDevice:publicKpnpDevice

        {

        //Constructors

        public:

        SAFE_DESTRUCTORS

        USBDACDevice(PDEVICE_OBJECTPdo,ULONGUnit);

        ~USBDACDevice();

        //MemberFunctions

        public:

        //添加自己的成員函數(shù)

        NTSTATUSUSBDAC_GetACK(int&);

        NTSTATUSUSBDAC_StartADConversion(void);

        NTSTATUSUSBDAC_StopADConversion(void);

        NTSTATUSUSBDAC_DownloadFPGA(KIrp);

        NTSTATUSUSBDAC_Download8051(KIrp);

        NTSTATUSUSBDAC_SetChannelParameter(PUCHAR,ULONG,int);

        };

        4FPGA

        无码人妻一二三区久久免费_亚洲一区二区国产?变态?另类_国产精品一区免视频播放_日韩乱码人妻无码中文视频
      2. <input id="zdukh"></input>
      3. <b id="zdukh"><bdo id="zdukh"></bdo></b>
          <b id="zdukh"><bdo id="zdukh"></bdo></b>
        1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

          <wbr id="zdukh"><table id="zdukh"></table></wbr>

          1. <input id="zdukh"></input>
            <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
            <sub id="zdukh"></sub>
            亚洲欧美日韩在线观看视 | 天天看在线视频国产 | 亚洲中文字幕永码永久在线 | 香港三日木三级少妇三级99 | 亚洲国产GⅤ精品一区二区 日本中文字幕久久 | 亚洲AⅤ鲁丝一区二区三区 日韩欧美综合一区二区 |