• <input id="zdukh"></input>
  • <b id="zdukh"><bdo id="zdukh"></bdo></b>
      <b id="zdukh"><bdo id="zdukh"></bdo></b>
    1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

      <wbr id="zdukh"><table id="zdukh"></table></wbr>

      1. <input id="zdukh"></input>
        <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
        <sub id="zdukh"></sub>
        公務員期刊網 精選范文 統計學的參數范文

        統計學的參數精選(九篇)

        前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的統計學的參數主題范文,僅供參考,歡迎閱讀并收藏。

        統計學的參數

        第1篇:統計學的參數范文

        在數學教學中滲透游戲教學,可以使學生在身心愉快的狀態下學習數學,有益于智力殘疾兒童智力的開發,充分挖掘智力殘疾兒童的潛能,補償智力殘疾兒童的身心缺陷。

        一 巧設游戲,誘發興趣

        學習興趣是學習動機的重要心理成分,它是學生主動探究知識的助力器。讓學生在學習過程中帶著愉快的情感色彩去學習,其學習的效果最佳。托爾斯泰曾指出:“成功的教學所需要的不是強制,而是激發學生的興趣。”教學實踐證明:濃厚的學習興趣可以讓智力殘疾問題的大腦處于最活躍的狀態,能最有效地激發學生的學習動機,調動其學習的積極性,促使其自主地投入到學習活動中,從而有效地獲取知識,而游戲則是智力殘疾兒童最喜歡的一種活動。又由于智力殘疾兒童的注意力極其不穩定,易被其他事物所吸引,他們集中注意力的時間大約只有10分鐘左右,教師在教學中要善于變換教學方式,采用新的教學方法來吸引兒童的注意,并積極地、有意識地培養他們注意自己不感興趣的東西,發展他們的有意注意,以提高數學教學的課堂效率。

        1.課前游戲,吸引注意,激發興趣

        剛上課時由于學生課間活動剛剛結束,他們心理還處于活動的興奮狀態,無法馬上集中進入學習狀態,所以在新課前安排一個小游戲,便能夠及時地吸引學生的注意力,激發智力殘疾兒童的學習興趣。

        2.新課游戲,降低難度,培養興趣

        在講授新課時,由于單純的算理講解顯得枯燥無味,智力殘疾兒童也較難理解,而他們的注意力又具有極其不穩定的特點,所以容易走神,不愛學習。教學中筆者常把這些新知識編成游戲的形式來進行教學,在游戲中滲透新知識,使學生在輕松、愉快的情境中掌握新知識,降低了學習的難度,培養了智力殘疾兒童學習數學的興趣,提高了智力殘疾兒童學習數學的積極性。如在教學“兩步混合運算式題”時,講解其算理時,筆者就安排了“排隊上車”的游戲,在上車的人群中有年邁的老奶奶、兩個抱孩子的阿姨和幾個小學生。讓他們先根據平時乘車的經驗排隊上車,其余同學看看他們上車時是不是個文明的乘客,再進行討論和評價,學生討論得出上車的順序應該是:先讓老奶奶上車,再讓兩個抱小孩的阿姨先后上車,最后是幾個小學生按順序先后上車,那他們就得按到的先后順序排隊上車。這時教師進而把式題中的小括號比成“老奶奶”;把乘法和除法比成“抱孩子的阿姨”;把加法和減法比成“小學生”。這樣兩步混合運算式題的運算順序,學生就能較輕松地掌握了,增強了學習的自信心,培養了學習數學的興趣。

        3.課后游戲,鞏固新知,提高興趣

        在鞏固練習時適當安排游戲,可以放松一下學生的大腦,活躍課堂氣氛,讓學生在游戲中鞏固所學的新知識,提高學生的學習興趣。如教學“時、分、秒”時,在鞏固練習時筆者就安排了一個“找朋友”的小游戲,筆者在硬紙板上分別畫了幾個鐘面,再用幾張卡片分別寫出鐘面上所表示的時間,分別發給兩組學生,其中一組學生拿“鐘面”,另一組學生拿著表示相應鐘面時間的卡片,接下來讓全班同學一起唱《找朋友》的歌,這兩組同學就迅速地找到與自己對應的同學,與其手拉手,再分別說出自己所持有“鐘面”的時間是……找對朋友的同學,教師給予表揚、獎勵,找不到朋友的,大家幫忙找。

        在數學教學中穿插游戲活動,能充分引起學生的有意注意,提高學生學習數學的興趣,激發學生的好奇心、求知欲。使學生在寬松、愉快的環境下學習知識、鞏固知識。

        二 利用游戲教學實施情感缺陷補償

        情感在一個人認識世界和改造世界的活動中起著很重要的作用,它是人生的一種調味劑,智力殘疾兒童也不例外,但由于他們的情感存在著缺陷,他們的身心發展將受到嚴重的阻礙,所以在教學過程中補償智力殘疾兒童的情感缺陷具有很重要的意義。而游戲教學是補償智力殘疾兒童情感缺陷的重要途徑。在教學新知識時,通過游戲的形式進行教學,減少學生掌握抽象知識的困難,學生也能在較輕松的氛圍中了解和掌握新知識,獲得成功的體驗,增強學習的自信心,使學生獲得良好的情感體驗,從而達到情感缺陷的補償作用。

        三 利用游戲教學創造性地使用教材

        隨著新課程的改革與實施,我們的全日制培智教材有的內容已無法適應教育教學發展的需要,與智力殘疾兒童的生活實際脫軌,如“珠算加法”“角和分的認識”等,由于智力殘疾兒童缺少生活的經驗,學習這些內容就有一定的困難。如教學“角、分的認識”時由于目前市面上已不用“分”的錢幣單位了,所以在教學時筆者把這方面內容改為“元、角的認識”,并安排了“購物”的游戲讓學生在游戲中進一步認識了以“元”和“角”為單位的人民幣。

        根據智力殘疾兒童的發展特點,結合他們的生活實際,在數學教學滲透游戲教學,創造性地使用教材,貼近孩子的生活實際,為學生更好地適應社會生活打下了堅實的基礎。

        四 利用游戲教學增強社會適應能力,回歸主流

        第2篇:統計學的參數范文

        關鍵詞:通用技術;參與性;有效教學

        隨著科學技術的飛速發展,技術已經成為人類生活中無處不用的客觀事物,并且也成為影響社會進步的重要因素。因此,技術教育就成為青少年培養基本素養的教育,通用技術課程就成為開發青少年潛能、促進青少年思維發展的基礎課程。但是,作為一門新的學科,通用技術的教學無論在教學資源的開發,還是在教學方法、手段上都存在著一定的問題。本文中筆者提出了一些在通用技術課堂中提高學生參與性、提高教學效果的教學策略。

        一、將教師引導與學生探究學習相結合,創設良好的學習環境

        在教學中,學生是學習的主體,為了激發其開發自身思維的能力,教師不應該單純地進行知識的灌輸,而應該在教師教導的基礎上給予學生更多的思考和操作的空間。

        首先,教師應該創設輕松、活潑的課堂環境,給予學生更多的肯定與鼓勵,激發學生的學習熱情。其次,教師要能根據教學內容有效地設置問題,讓學生直接參與和經歷,調動學生積極地思考和解決問題。如在學習《設計中的人機關系》這一節時教師就可以提出:“觀察一下教室,說出哪些物品構成了人機關系”的問題,學生通過對親身經驗的討論和回答,就能準確地掌握“機”和“人機關系”的含義。再次,教師要在事先精心地做好教學設計的基礎上,給予學生足夠的時間來分析和探索,如在學習《設計中的人機關系》中,教師完全可以利用已有的教學設施,通過層層遞進的提問方式,讓學生相互討論、自我探究,掌握學習要點。教師可以提問一些“人體哪些部位與椅子構成人機關系”“大概多高的椅子坐起來最舒適”“學校里面有哪些設計不合理”等問題,讓學生對整個知識點進行系統的討論和理解。因為課堂中問題的設置,使得學生參與課堂的興趣加大,自主探究的能力也得到了開發,同時師生之間和生生之間的互動更為有效,從而達到最好的學習

        效果。

        二、將教材知識與生活實際相結合,激發學生的學習興趣

        在通用技術這種立足實踐、高度綜合、注重創造、科學與人文融合的課程教學中,假若教師純粹地宣讀課本、陳列知識點,則不易引起學生的學習興趣。所以,教師應該有意識地將學生的學習陣地從書本中轉移到生活中,加強教材知識和生活實際的結合。例如,直接將一些生活中常見的、生動有趣的事件引入課堂,然后再根據教學內容進行適當的深入和拓展,這樣教學內容由淺入

        深、教學內容形象生動,就會使學生學起來感覺輕松,學習興趣自然得到提升,也能自主地、積極地參與到課堂之中,在實踐操作之中理解課本知識、學習技術。

        在學習《發現與明確問題》這一章時,為了明確在日常生活中發現“問題”在技術探究中的重要性,教師可以從大家熟知的牛頓和蘋果的故事引入,并且趁熱打鐵拿出自己事先做好的取碗器,來展示如何在較深且口徑小的容器中取出盛有食物的碗。因為學生在生活中也可能遇到在用高壓鍋等燉菜時,因為太燙又怕打翻食物,而無法取出碗的狀況。所以,這一設計無疑會引起學生對生活中“發現問題”的興趣。

        這種寓生活知識講授課本內容的教學,能使學生感受到通用技術課程并不是枯燥無味的,其所學的內容能夠解決實際問題。這種貼近生活的教學直觀、生動,能夠有效地提高學生的課堂參與性。

        三、將通用技術與信息技術相結合,實行多樣化的教學模式

        信息技術和通用技術的教學整合對學生的學習以及教師的授課都有極大的幫助,信息技術是通用技術教學的重要工具,利用多媒體教學技術、計算機技術、網絡技術等能將通用技術的課堂變得更加多樣化,增加其吸引力和趣味性。信息技術能將文字、影像、圖片資料等集于一體,這使得通用技術課程的教學內容能從抽象變得具體,降低技能學習的難度。同時,聲情并茂、形式多樣的教學方法也能有效地激發學生的學習興趣,促其積極地進行探索學習。

        通用技術課程是立足于學生的“做中學”和“學中做”的課程,同時也是一門強調各學科、各方面知識的聯系和綜合運用的課程。所以,在課堂中提高學生的參與性,能促進通用技術的有

        第3篇:統計學的參數范文

        1.醫學統計學標準化試題庫建立的必要性

        近年來選修醫學統計學的學生逐漸增多,考試的客觀性、公正性顯得尤為重要。當前,不同的學校采取的考試方式不盡相同:有的學校建立了“整卷庫”,以整套試卷為單位進行存儲,考試時隨機抽取一套試卷對考生施測,這種方式固化了試卷結構,不能根據實際需求靈活調整;有的學校簡單地將試題按章節存放在一起,試題未經測試與合理的分析,未按能力層次及學科要求進行劃分,考試時按章節選出一部分試題組卷,費時又費力;還有的學校指定每位代課老師出一定數量的題目,最后把所有老師提交的題目匯總、組合成卷,由于代課老師往往根據課堂上強調的授課重點出題,因此不能全面考察學生的真實水平。可見,醫學統計學考試制度存在諸多問題,要想通過考試客觀、準確地評價每個考生的真實能力,充分發揮考試對教學的反饋作用,實現科學化、標準化、規范化、公正化的考試,建立高質量的醫學統計學標準化試題庫〔1〕勢在必行。所謂試題庫〔2〕(itembank),并不是試題的簡單堆集,而是以一定的教育測量理論為基礎,通過相應的數學模型對試題進行多項性能指標分析后,選出符合要求的優秀題目,按次序集中儲存的一種形式,并能按要求調出所需試題,最終按規定的條件組合成卷〔3-5〕。醫學統計學標準化試題庫以合格、優秀的試題為基本單位,能克服現有考試制度的弊端。因此,建議建立醫學統計學標準化試題庫。

        2.理論依據———項目反應理論(itemresponsetheory,IRT)

        建設醫學統計學標準化試題庫的中心環節就是命題、選題。選題時必須根據一定的評價指標對試題進行評估,優秀的、符合要求的試題方可進入試題庫。教育測量是以一定的理論為基礎,目前用于試題評價的理論主要有經典測量理論(classicaltesttheory,CTT)和項目反應理論(itemresponsetheory,IRT)〔6,7〕。CTT存在很多無法克服的技術問題,如具有試題依賴性和樣本依賴性、被試的能力分數與試題難度未建立在同一量尺上、忽略了每位被試的反應組型等等〔8-11〕。于是,近代在CTT基礎上發展起來了一種新的測量理論,即IRT,又稱潛在特質理論(latenttraittheory)或項目特征曲線理論〔12〕(itemcharacteristiccurvetheory)。IRT以幾項基本假設(如單維性假設、局部獨立性假設〔13,14〕等)為前提,試圖通過建立恰當的數理統計模型來反映被試特質水平、試題參數與該被試在試題上的反應表現之間的關系。相對于CTT,IRT的優勢主要有:(1)具有試題獨立性和樣本獨立性,即扣除測量誤差的影響后,被試能力參數的估計值不會隨試題的不同而不同,試題參數的估計值也不會隨被試的不同而不同。(2)每位被試具有相應的測量誤差。(3)考慮了每位被試的反應組型。(4)引入了信息函數的概念,其可代替CTT中信度的概念〔15〕。IRT克服了CTT的不足,已逐漸成為試題評價的主流理論。許多大型的考試如美國的研究生入學考試GRE及著名考試TOFEL等試題評價均采用了IRT〔16〕。本文也將應用IRT,闡述醫學統計學標準化試題庫建設的基本思路。

        資料與方法

        1.資料

        從中山大學公共衛生學院資料庫中搜集2008年至2011年期間的醫學統計學考試試卷,共5116份。試題題型主要是單項選擇題、簡答題和計算分析題。這些試題面向7個不同專業的考生,包括臨床專業、預防專業、藥學專業、法醫專業、口腔專業、康復專業以及護理專業。此外,這些考生來自于不同層次,包括本科生、碩士生。

        2.方法

        IRT強調的核心是數學模型的建立和對模型中各個參數的估計〔13〕,通過對模型中各個參數適當估計和選取,解決在現實中CTT遇到的大部分問題。IRT假定學生對測試項目的反應不僅受到特定“能力”的影響,還受到許多隨機因素的影響,其將被試的能力看作是一個潛在的不可觀測的變量,同時將難度、區分度、猜測度等參數看作是項目的固有屬性,獨立于被試樣本,并將被試在某項目上的反映情況與該被試的特質水平聯結起來,與表示試題特性的參數一起,共同建立起數理統計學概率模型〔17,18〕。不同形式的數據應采用不同的模型進行擬合。本研究擬應用IRT,從以下幾個方面進行分析。

        (1)考生反應組型的整理

        采用EpiData3.1軟件包,根據搜集到的試題輸入每位受試者的反應組型(responsepattern),即:考生在一組測驗試題上的作答情形。數據處理如下:對于單項選擇題,假定某考生對試題i的反應為ui,其中答對用ui=1來表示,答錯用ui=0來表示(屬于二元化計分);對于簡答題,每一道簡答題滿分為h=6分,我們將其分為以下四個等級:h=0分、0<h≤2分、2<h≤4分、4<h≤6分,分別用0,1,2,3來表示(屬多元計分);對于計算分析題,每一道計算分析題滿分為k=12分,我們將其分為以下四個等級:k=0分、0<k≤4分、4<k≤8分、8<k≤12分,分別用0,1,2,3來表示(屬多元計分)。

        (2)模型選擇

        ①單維三參數logistic模型(3parameterlogisticmodel,3PLM)對于單項選擇題,其反應數據為二元化計分形式,項目反應理論中可采用的數學模型有logistic模型和正態卵形模型,其中應用最廣的是前者〔9〕。logistic模型根據參數數目的不同,可分為單參數模型、雙參數模型和三參數模型〔19〕。在理論和實踐中,三參數模型得到了充分的驗證,相對成熟、可靠,并且可以提供更多的試題信息,能更好地對參數進行估計〔20〕。因此,本文對單項選擇題的數據采用單維三參數logistic模型〔21-22〕進行處理,其表達式如下:Pi(θ)=ci+(1-ci)eDai(θ-bi)1+eDai(θ-bi)(1)其中θ表示考生能力估計值;ai表示第i題的區分度系數;bi表示第i題的難度系數;ci表示第i題的猜測度系數;D表示標化因子,一般取D=1.702〔19〕;Pi(θ)表示能力為θ的人答對此題目的概率。②等級反應模型對于簡答題和計算分析題,將原始分數進行轉化后,反應數據變換為多元計分形式,此時,可采用項目反應理論中的等級反應模型〔23-25〕(gradedresponsemodel,GRM)。GRM假設每一個反應類別各自對應一條特征曲線,如果對某試題i而言,被試的反應可以劃分為g+1類,其得分可以表示如下:Xi=0,1,……,g,那么被試在該試題上恰好得某一等級g分的概率可表示如下:Pi,k(θ)=P*i,k(θ)-P*i,k+1(θ)(2)公式(2)中,Pi,k(θ)表示對于試題i而言,能力值為θ的被試恰好得k分的概率;P*i,k(θ)表示對于試題i而言,能力值為θ的被試得k分以及k分以上的概率,P*i,k+1(θ)表示對于試題i而言,能力值為θ的被試得k+1分以及k+1分以上的概率。其中P*i,k(θ)按雙參數logistic模型可以寫為:P*i,k=11+e-Dai(θ-bi,k)(3)公式(3)中,θ、ai、D的含義與公式(1)相同,bi,k表示第i題第k個等級的難度系數。

        (3)試題參數估計

        應用MULTILOG軟件,采用最大邊緣似然估計〔26,27〕(marginalmaximumlikelihoodestimate,MMLE)法來估計IRT模型中的參數。以L(ui|θ)表示能力為θ的某考生對題目i的反應ui(答對:ui=1;答錯:ui=0)的概率,用對數似然函數表示為:L(u1,u1,…,un|θ)=∏ni=1PuiiQ1-uii(4)其中n為題目數,Puii表示考生答對第i題的概率,Q1-uii表示考生答錯第i題的概率。當各參數的偏導數為0時函數取得最大值,分別求得每一個試題相應參數值,即:試題區分度系數ai,難度系數bi,猜測度系數ci。

        (4)試題篩選入庫

        在篩選試題以決定哪些試題可以入庫時,不能僅以試題參數作為能否進入試題庫的唯一標準,需同時考慮估計出的各試題參數以及任課教師的專業意見,篩選符合一定標準的試題進入試題庫。試題難度過大或過小,會使分數呈偏態分布,從而使考試的信度系數值降低,因此,選取難度系數位于[-4.0,4.0]范圍內的試題進入試題庫。區分度越大的題目,表明對學業水平不同的考生的鑒別力或區分能力越強。通常,教學過程完畢后進行的考試,是以考察考生對知識掌握情況為目的的,因此,區分度不應過大。我們選取區分度位于[0,3]范圍內的試題進入試題庫。此外,試題的猜測度也不應太大,猜測度系數過大的試題對于考察學生對知識的掌握意義不大〔28〕,我們將猜測度小于0.25的試題選入試題庫。根據試題參數篩選出試題后,再由5~7位任課教師,獨立地逐一對初步篩選的試題進行審核,以判斷試題文字表述是否恰當、是否會引起歧義、是否符合醫學統計學邏輯、是否具有考試價值、是否具有內容典型性、是否具有編寫格式統一性,是否重復等,經全部任課教師認可的試題方能最終進入試題庫。除了將試題及試題參數錄入數據庫外,各個試題庫還應包括試題編號、試題類型、所考知識點、認知層次、參考答案、選中標識等。醫學統計學標準化試題庫建立的流程圖見圖1。結果該研究的預期結果是成功建立醫學統計學標準化試題庫,該試題庫以單個試題為基本單位,每道試題都有編號、題型、難度、區分度、猜測度、知識點、認知層次、參考答案以及選中標識這9個屬性,且試題庫中的試題參數都建立在同一量尺上。試題庫中的所有試題均符合大綱要求,且試題知識覆蓋面廣,每一章節均有一定數目的試題。該試題庫可用于期末考試,也可用于階段性小測驗,可供臨床、口腔、康復、護理、預防醫學等專業使用,可根據不同專業的不同要求(如預防專業的學生應該掌握醫學統計學知識,考試時理應選取難度較大的試題進行測驗;而康復專業的學生理解醫學統計學知識即可,那么考試時應選取中等難度或低難度的試題進行測驗)選取試題,進而實現自動化組卷或者計算機自適應考試,從而使各種考試得以方便、快速、順利地進行。結論與討論采用項目反應理論建立的醫學統計學標準化試題庫可以滿足各種目的的考試要求。不僅大大節省了時間、節約了人力,還使考試更加客觀、公正,具有重大的實際意義。

        在建設醫學統計學標準化試題庫的過程中,以下幾個問題值得引起我們的注意:

        1.必須明確醫學統計學的教學大綱,并結合本校的實際情況列出考核知識點,然后將搜集到的試題歸類于相應的知識點。以知識點而非章節作為試題的屬性,更便于我們有針對性的命題、將試題進行分類以及對試題進行搜索。

        2.在考生人數和試題庫試題題量方面,當然是考生人數越多,試題參數估計的穩健性越好;選入試題庫的題量越大、試題知識覆蓋面越廣越好。但是在實際中,由于考生人數以及符合大綱要求的試題題量有限,可以先根據現有的資源創建試題庫,然后不斷地修正試題參數,不斷地為試題庫注入新的“血液”,使試題庫不斷的發展完善。為了增加試題庫題量,我們還可以借鑒兄弟院校的試題,或者組織經驗豐富的專家或教師命制新的試題。

        3.每一道試題須包括以下9個屬性:編號、題型、難度、區分度、猜測度、知識點、認知層次、參考答案以及選中標識,以便于對試題進行分類、存儲、檢索、維護與管理。

        4.醫學統計學試題往往帶有各種數學符號、表格甚至圖形,這就提醒我們在錄入試題前,應選擇合適的軟件平臺,以保證所有的試題均能完整無誤地輸入或輸出試題庫,以確保各種工作的順利進行。

        第4篇:統計學的參數范文

        自從Paelinck提出“空間經濟計量學”這個術語,Cliff和Ord(1973,1981)對空間自回歸模型的開拓性工作,發展出廣泛的模型、參數估計和檢驗技術,使得經濟計量學建模中綜合空間因素變得更加有效。

        Anselin(1988)對空間經濟計量學進行了系統的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經濟計量學的定義是:“在區域科學模型的統計分析中,研究由空間引起的各種特性的一系列方法。”Anselin所提到的區域科學模型,指明確將區域、位置及空間交互影響綜合在模型中,并且它們的估計及確定也是基于參照地理的(即:截面的或時-空的)數據,數據可能來自于空間上的點,也可能是來自于某個區域,前者對應于經緯坐標,后者對應于區域之間的相對位置。

        國外近幾年空間經濟計量學得以迅速發展,如Anselin和Florax(1995)指出的,主要得益于以下幾點:

        (1)人們對于空間及空間交互影響的作用的重新認識。對空間的重新關注并不局限于經濟學,在其它社會科學中也得以反映。

        (2)與地理對應的社會經濟大型數據庫的逐步實用性。在美國以及歐洲,官方統計部門提供的以區域和地區為統計單元的大型數據庫很容易得到,并且價格低廉。這些數據可以進行空前數量的截面或時空觀測分析,這時,空間(或時空)自相關可能成為標準而非一種特殊情況。

        (3)地理信息系統(GIS)和空間數據分析軟件,以高效和低成本的計算技術處理空間觀測的發展。GIS的使用,允許地理數據的有效存儲、快速恢復及交互可視化,為空間分析技術的藝術化提供了巨大的機會。至少目前線性模型中,缺少針對空間數據和空間經濟計量學的軟件的情況已經大為改觀。目前已有一些專門的空間統計分析軟件,并且SAS、S-PLUS等著名統計軟件中,都已經包括用于空間統計分析的模塊。

        (二)空間經濟計量學與相關學科的關系

        空間統計學是研究空間問題的另一門學科,它是應用數學的一個快速發展的分支。它起源于20世紀50年代早期,用以幫助采礦業進行礦藏量的計算。最早的工作是采礦工程師D.G.Krige和統計學家H.S.Sichel在南非進行的。70年代隨著計算機的普及以及運算速度的大幅提高,空間統計分析技術逐漸擴展到地球科學的其它領域。目前已經普遍存在于需要處理時間上或空間上相關的數據的科技領域中。

        空間經濟計量學與空間統計學的區分不太容易。Haining和Anselin的觀點認為空間統計學的研究大多由數據驅動,而空間經濟計量學由模型驅動,即從特定的理論或模型出發,重點放在問題的估計、解釋和檢驗上。空間統計學的主流是研究生態學和地質學中的物質現象,空間經濟計量學主要研究與區域及城市經濟有關的模型。有一種觀點認為二者的區分應基于作者將其工作對應于空間經濟計量學還是空間統計學,這種區分辦法可能較為簡單。

        地質統計學(Geostatistics)發展于20世紀60年代,主要用于研究地質學現象的空間結構和進行空間估值。例如,在探礦過程中,通常是在空間上布點進行鉆探,然后對采樣得到的樣品進行分析,估計礦藏的分布和儲量。由于礦藏不開采的話,在時間上結構幾乎是不變的,因此地質統計學研究的問題主要是空間相關。空間經濟計量學所研究的問題不僅存在空間相關,往往所研究的問題在時間上也存在相關。

        在區域經濟學的理論中,人們建立了各種理論以及關系式來描述人類在空間上的行為,如研究城鎮問題的“引力模型”等。但在利用模型進行定量研究問題的時候,需要將理論或關系式用數學模型來進行刻劃,利用統計方法對模型進行估計、檢驗,并進行評價,這些正好是屬于經濟計量學研究的范疇。應該說,空間經濟計量學主要研究區域經濟問題,依據的是區域經濟學理論,但它還需要綜合數學,以及空間統計學等學科,因此它不等同于區域經濟學,而是一門交叉學科。

        二、研究的問題

        空間經濟計量學主要研究存在空間效應的問題。空間效應主要包括空間相關和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。

        (一)空間相關

        空間相關指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關,即

        附圖

        存在空間相關的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調查過程中,數據的采集與空間中的單位有關,如數據是按省、市、縣等統計的,但設定的空間單位與研究問題不一致,存在測量誤差。

        空間相關不僅意味著空間上的觀測缺乏獨立性,并且意味著潛在于這種空間相關中的空間結構,也就是說空間相關的強度及模式由絕對位置和相對位置(布局,距離)決定。

        對于空間相關,空間自回歸通常是其核心內容,空間自回歸模型的一般形式為:

        附圖

        在這個模型中,β解釋變量X(n×k矩陣)的參數向量(k×1),ρ是空間滯后相關變量的參數,λ是殘差空間自回歸(空間AR)結構中的參數。

        W[,1]和W[,2]為n×n矩陣,是標準化或未標準化的空間加權矩陣,分別對應于因變量以及擾動項中的空間自回歸過程,這兩個矩陣可以不同,這意味著兩個過程由不同的空間結構生成。

        這個模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。

        對這個模型,普通最小二乘估計不僅是有偏的,而且是不一致的,參數的估計通常采用極大似然估計,近幾年,有學者嘗試采用貝葉斯估計對參數進行估計。

        (二)空間差異性

        空間差異性指空間上的區域缺乏均一性,如存在中心區和郊區、先進和后進地區等。例如,我國沿海地區和中西部地區經濟存在較大差別。

        對于空間差異性,只要將空間單元的特性考慮進去,大多可以用經典經濟計量學方法解決。但當空間差異性與空間相關共同存在時,經典經濟計量學方法不再適用,而且這時問題可能變得非常復雜,因為這時要區分空間差異性與空間相關可能非常困難。

        研究空間差異性的模型主要有:

        E.Casetti提出的空間擴展模型(1972)和回歸參數漂移分析方法(簡稱DARP)模型(1982)。這時,空間差異性表現為模型參數隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴展參數)。

        y=Xβ+ε

        附圖

        模型(3)為以經緯坐標(Z[,x],Z[,y])作為擴展參數的空間擴展模型。同樣可以以到中心區域的距離作為擴展參數設計模型。

        將模型(3)的第二個式子右邊加入隨機擾動項,則為DARP模型。E.Casetti(1992)進一步提出了貝葉斯空間擴展模型。

        D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加權回歸模型(簡稱GWR模型)。

        附圖

        (三)時空數據空間模型

        在模型中考慮時間維增加了描述的復雜性,但綜合時間空間的模型在實際工作中非常有用。在經典的經濟計量學模型中,這是綜合截面和時間序列數據的情形。如果數據不存在空間相關,則可以采用PanelData模型。Anselin(1988)將似不相關(SUR)模型擴展到空間的情形,提出空間SUR模型。

        三、應用前景及需要進一步研究的問題

        (一)在中國的應用前景

        在我國,地質統計學是較早應用空間統計學的領域,在20世紀80年代中國科學院就有人研究并應用Krige模型。空間統計學除了在地質學的研究中發揮作用,近十年來,周國法、徐汝梅等學者研究生態學中的空間相互作用,并于1998年出版了《生物地理統計學》。20世紀80年代以來,我國利用衛星遙感技術,對土地、森林、農業、礦產、能源、作物估產、災患檢測等進行應用,開始了我國空間統計學在經濟領域應用中統計調查的工作,為了將空間遙感調查技術逐步納入到我國統計的常規性工作中,1998年10月,國家統計局成立了空間統計研究室,并與中國科學院地理所合作,組成了“空間信息多重采樣設計的空間統計學應用研究”課題組,運用遙感技術和空間分析對我國農業耕地、森林、草地等資源以及城鎮動態變化進行調查,該項目獲得國家統計局2000年課題研究一等獎。

        在我國地質統計學、生物地理統計學及利用遙感技術進行的各種調查,都屬于空間統計學的范疇。地質統計學、生物地理統計學主要研究空間相關及空間估值,在生物地理統計學的研究中還包括物種的空間擴散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型。空間動態采樣的研究,與地質礦產調查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計算等問題的研究,根據其研究的問題和方法,也可以將其歸入統計學的抽樣調查分支之中。

        隨著我國按地區進行統計的統計基礎資料不斷積累,尤其是遙感技術應用到統計調查中來,都將使得按時間和空間排列的數據資料極為豐富,對數據進行空間甚至時空分析成為可能,人們將逐漸從時間的角度轉向普遍從時空的角度來考慮問題。

        從經濟分析的角度看,空間經濟計量學在我國以下幾個方面將有很大的應用前景。

        由于區域之間存在相關性,或者存在差異性,因此一項政策對每個區域的影響是不同的,通過運用空間經濟計量學方法對各區域進行研究之后,找到政策在各區域上作用的關系,對于政府決策、正確制訂政策具有很大的參考價值。

        由于區域之間存在先進地區和后進地區,通過空間經濟計量學方法可以對先進地區與后進地區之間的相互關系進行研究。

        按區域編制投入產出表時,空間的概念將發揮作用。

        對房地產的價值進行評估時,在考慮外界影響因素的基礎上,充分考慮地區之間的相互關系,將對正確評估房地產的價值有很大幫助。

        對環境污染進行研究時,運用空間經濟計量學方法對污染的傳播方式進行研究,有助于人們對環境污染進行控制。

        在交通領域的研究,可以利用空間經濟計量學方法對人員、貨物在空間上的流動方式進行研究,同時對通道上的不同區段進行研究。

        在對某種疾病(如流感)在空間上的傳播過程進行研究之后,對于疾病的預防控制將有很大的幫助。

        建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關性。而空間抽樣在空間上的布點方式也可以用作商業網點的布局研究。

        總之,只要問題涉及到空間的概念,空間經濟計量學就將發揮其作用。對空間經濟計量學的深入研究及應用,將促使人們面對問題的時候,從空間或時空的角度思考問題。

        (二)需要進一步研究的問題

        目前的研究中,系統內的空間單元受到系統內其它位置單元的影響,但邊界處的單元還受到系統外與之相鄰的單元的影響,如何將這個影響考慮在模型中值得研究。

        在具體問題中,距離的概念需要加以認真對待,單用地理上的距離有時并不合適,例如國與國之間的經濟聯系在今天并不是距離遠近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時,如何將貿易、人員、資金的流動充分考慮到空間加權矩陣中去,尚值得研究。

        貝葉斯方法在統計學各個分支的應用越來越廣,空間貝葉斯模型也是目前空間經濟計量學研究的熱點之一。

        可變單元的問題。當數據匯總的級別變化,可能整個模型的描述都發生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個統一的模式對系統進行描述尚待進一步研究。

        時空數據的綜合分析,參數估計的漸近性質,模型的各種檢驗方法等,還有待進一步的研究。

        第5篇:統計學的參數范文

        關鍵詞:統計學;地質工程;應用分析

        地質統計學是20世紀六七十年展起來的一門新興的數學地質學科的分支,是隨著采礦業的發展而興起的一門交叉學科。地質統計學是以區域化變量理論為基礎,以變異函數為主要工具,研究那些在空間分布上既有隨機性又有結構性,或空間相關和依賴性的自然現象的科學。國內外地質統計學的理論、方法及應用均達到了成熟的階段,并形成了具有較好應用價值的軟件。具有代表性的有:法國巴黎高等礦院地質統計學研究中心研制的ISATIS;美國斯坦福大學應用地球科學系C.v.Deutsch和A.G.Journel共同編寫的GSIJB程序包,等等;北京科技大學地質系也編寫出地質統計學方法研究程序集。

        近年來,克里金技術在石油勘探開發中的應用日益廣泛深入,效果也越來越明顯。主要應用包括:儲層預測,即估計地層的埋深、層厚、孔隙度、滲透率和含油飽和度等地質和地球物理參數的空間分布,這些變量在空間既存在一定的空間分布規律(結構性),又存在局部的變異性(隨機性),這些變量都屬于區域化變量,因此可以用地質統計學方法對這些變量進行研究繪制各種地質圖件;利用地質統計學的變差函數研究儲層的非均質性及各向異性;數據整合,即整合地震、測井、鉆井和露頭等各種信息并進行建模。除此以外,隨機模擬方法和油藏數值模擬相結合,可以預測油藏的動態特征,為制定和調整開發方案并提高采收率提供依據。

        一、地質統計學研究方法的基本理論

        (一)基本原理

        當一個變量呈現為空間分布時,就稱之為區域化變量。這種變量常常反映某種空間現象的特征,用區域化變量來描述的現象稱之為區域化現象。區域化變量,亦稱區域化隨機變量,G.Matheron(1963)將它定義為以空間點x的三個直角坐標為自變量的隨機場。區域化變量具有兩個最顯著,而且也是最重要的特征,即隨機性和結構性。區域化隨機變量之間的差異,可以用空間協方差來表示(見圖1)。

        (二)變差函數

        一維變差函數的定義:假設空間點x只在一維x軸上變化,把區域化變量Z(x)在x,x+h兩點處的數值之差的方差之半定義為區域化變量Z(x)在x方向上的變差函數,記為:

        r表示變差函數;E表示數學期望;Var表示方差。也就是說變差函數依賴于x和h兩個自變量。在本征假設條件下,變差函數僅依賴于分割它們的距離h和方向a。而與所考慮的點x在待估域內的位置無關,因此變差函數更明確定義為:變差函數是在任一方向a,相距h的兩個區域化變量Z(x)和Z(x+h)的增量的方差之半。

        變差函數是一個距離的函數,描述不同位置變量的相似性,r值越大,相關越差。通常情況下,r值隨著距離矢量h的增大而增大,直到h到達一定值時,r達到極大值,而后保持這個常數值不變。

        (三)克里金方法

        當隨機變量X的數學期望對整個區域都為已知時,采用的克里金方法就是簡單克里金方法。在進行簡單克里金估計時,我們假設整個區域的均值是已知的。然而儲層物性的均值是隨著局部區域的不同而變化的,上述假設在絕大部分的情況下是不成立的,普通克里金解決了這一問題。當隨機變量X(u)的數學期望是一個和u無關的常數,但這個常數未知時,導出的克里金方法就是普通克里金方法。

        (四)協克里金

        1.協克里金方法的原理及其公式。協克里金方法要求主變量與二級變量之間具有良好的相關性。以整合兩個變量為例,協克里金估計的主變量和二級變量的線性組合形式如下:

        公式中,是位置的估計值,是在位置上的主變量采樣值;是對應于該采樣點的加權系數。

        協克里金有其不足之處,需要建立兩個變差函數(主變量、二級變量的變差函數)和一個互變差函數(主變量與二級變量之間的互變差函數)。不僅運算的數據量顯著增大了,而且擬合這些變差函數比較困難。在協克里金的計算過程中,相關性較好的數據對相關性較差的數據存在屏蔽效應。由于這些原因,這種完全協克里金在實際應用方面受到限制。于是,人們發展了配置協克里金,這種方法保留了協克里金的優點,又不用同時建立三個變差函數。

        2.協克里金算法中幾個關鍵的步驟。在使用協克里金方法時,要求兩組數據之間具有良好的相關性。圖1是工區井點處單位厚度旅行時差與孔隙度的交匯圖,計算單位厚度旅行時差與孔隙度的相關系數為0.880655,具有良好的相關系數。

        相關函數的計算與擬合。由于實際數據測量點個數的不足,我們需要對相關函數進行計算并擬合,繪制出完整的相關函數圖形,通過變差函數計算方法和線性規劃擬合方法,計算擬合相關函數。

        選擇合適的搜索半徑。協克里金方法至少使用兩種數據,一般叫做硬數據和軟數據,通過實際資料處理,認為這兩種數據不宜用相同的搜索半徑。對于硬數據,應采用與硬數據的變程相當的搜索半徑,原則是盡可能地應用精確的硬數據;對于軟數據,搜索半徑不宜過大,因為軟數據本身不夠精確,會把自身的偏差帶到估計值中。

        處理加權系數。最后一步是處理加權系數,由于負的加權系數會導致奇異的估計值,因此需要采用線性規劃方法處理加權系數。

        二、地質統計學方法的應用

        (一)儲層預測

        對儲層參數進行科學有效的預測,一直是石油地質學的熱點和難點。最初采用傳統的數理統計方法,但這種純數學的方法不考慮儲層參數之間的空間連續性和相關性,不帶任何地質意義,對儲層參數預測具有很大的局限性。而地質統計學方法以區域化變量理論為基礎,充分考慮了地質參數空間變化的趨勢、方向性及2樣點參數的相互依賴性,利用克里金方法的插值和外推功能,求出比較符合地質規律的地質統計模型和方法,來表征各種儲層參數的變化規律,然后用這種規律,對參數(如孔隙度和滲透率等)的空間展布進行比較合理而有效的預測。

        (二)儲層的非均質性及各向異性研究

        儲層非均質性研究是油藏描述的重要內容,其參數的空間分布不僅具有隨機性,而且具有結構性。從地質統計學關于變差函數的基本理論出發,在綜合分析的基礎上,構造了一種定量表征儲層平面非均質性的數學模型,計算結果所反映的各類儲層的平面非均質特征符合沉積的基本規律,說明這一表征模型用于儲層平面非均質性定量評價中是可行的。

        (三)不確定性描述

        靜態、動態的確定性模型,很難反映油藏的復雜變化,只有通過不確定性描述,從地質統計觀點概括和綜合地質模型,才能真實地反映復雜的油藏模型。近幾年來,地質統計學越來越廣泛地用于儲層表征,諸如估計孔隙度的空間分布,模擬滲透率的數值連續性,定量估計油藏模型的不確定性,取樣設計,流動模擬過程中的敏感性分析和風險分析,等等。它的最大優點就在于能夠方便地綜合應用各種資料,如地質、地震、測井、生產等各方面的信息,這對巖心取樣十分稀疏的油藏的準確描述是關鍵的。而且不確定性描述能為油藏工程師提供多個可選擇的開發方案,有利于綜合分析,獲得合理的開發決策。

        參考文獻:

        [1]何琰,殷軍.儲層非均質性描述的地質統計學方法[J].西南石油學院學報,2001,23(3).

        [2]李黎,王永剛.地質統計學應用綜述[J].勘探地球物理進展,2006,(6).

        [3]王自高,何偉,高才坤,盧杰.工程勘察新技術應用與發展思路[J].水力發電,2006,(11).

        [4]GUNTER,HOLDER.StatisticsinPreclinicalPharmaceuticalResearchandDevelopment[J].JournaloftheAmericanStatisticalAssociation,2000,95(449).

        第6篇:統計學的參數范文

        [關鍵詞]巖土參數 變異性 評價分析

        [中圖分類號] P58 [文獻碼] B [文章編號] 1000-405X(2015)-7-437-1

        隨著建筑、交通等建設規模的擴大,建筑物對地基的承載能力、沉降幅度的要求越來越高了。要滿足這種高精度的巖土工程設計要求,取得建筑區域的巖土參數,并通過研究巖土參數,更加科學反映建設區域的巖土特質,在施工前對建筑工程帶來必要的數據參考,從而保證工程建設的安全性和可靠性。

        在工程建設中, 人們認識到同一點不同深度及同一地區的不同點處的巖土參數具有一定的差異, 對巖土參數的空間變異性有一定的認識。但是為了便于原始數據的統計分析而將巖土介質視為均質各向同性地層。卻忽略了巖土參數的空間變異性, 而將這種“差異”僅僅作為試驗過程中的純隨機誤差。在巖土工程領域的可靠性設計中, 若將參數樣本統計值直接作為巖土參數的空間統計值, 將對可靠度計算精度產生直接影響。

        因此, 巖土參數的空間變異性分析和相關距離的計算一直受到重視。巖土最重要的特征是具有復雜的變異性也即地域特征,導致其參數值有顯著不確定性。巖土參數是巖土工程設計時需要考慮的基本要素,同時巖土參數的空間變異性已經被人們所認識,并逐步引入巖土工程的實際分析之中。

        本文通過巖土空間參數的變異性來源及其評價分析的闡述,說明巖土參數在巖土工程中的作用。

        1巖土參數空間變異性的來源與特征

        巖土參數所具有的不確定性除了來自巖土勘察導致的誤差外,巖土參數本身也有了隨機變量的特性。我們知道,長期地質變遷形成的巖土,其性質極為復雜。巖土因為其非均質和各向異性的特點,使得它具備有空間的變異性,這種空間變異性與建筑勘察時對巖土取樣過程中的失真和量測誤差,是導致巖土參數變異性的主要因素。

        巖土變異性的來源總結起來可以歸入以下幾類:首先是巖土其本身的變異或者是模型變異,也來自于為試驗誤差或者是統計誤差。而在大樣本條件下,并舍棄明顯不合理試驗值后,可以忽略模型和統計部分引起的變異。根據區域化變量理論,可將展布于一定空間范圍內,相互之間具有一定相關性的隨機變量視為區域化變量。這恰好反映出巖土參數的空間相關性和隨機性。

        因此,巖土工程的設計計算中涉及的抗剪強度指標、壓縮模量(系數)、孔隙比、容重和滲透系數等都可以看作區域化變量進行統計分析。

        2巖土參數變異性的評價分析

        巖土參數空間變異性分析,是根據取樣并測定的數據資料,分析巖土參數的空間變化特征、參數自身及各參數之間的空間相互關系,以及將分析得到的結果應用于實際的工程中,并對未測點參數進行最優化估值,還可分析預測狀態變量的空間分布。

        在實際工程設計中,許多巖土參數可以看作是區域化變量。比如土的孔隙度相對密度塑性指數、滲透系數、壓縮模量、抗剪( 壓) 強度以及某一特定持力土層的厚度等。它們的依隨空間位置點而變化, 并且具有兩個基本屬性,即結構性與隨機性。由于區域化變量具有上述特殊性質,如果用經典概率統計方法來研究、描述這類性質的變化是非常不容易的,因為它無法道道巖土參數的空間結構方面的信息。

        而通過區域化變量理論中的一個簡單工具一一變異函數, 就可以很好的描述區域化變量的上述特性,并對區域化的變異性也能反映。

        目前多數巖土工程可靠性分析計算中,巖土參數的變異性是按概率統計中的隨機變量變異性來評估的,它采用樣本的均方差與樣本均值的比值(一般叫做變異系數)來表示,這很容易忽略巖土參數變異性中很重要的特點,即結構性。而我們采用的區域化變量理論中的變異函數來描述巖土參數空間變異性就彌補這一缺點。從而將這類變量的變異性分析的任務得以實現。同時,利用地質統計學方法可以得到的巖土參數空間結構信息,定量的描述巖土參數的空間變異性,更全面的分析巖土參數的空間變化,以及通過巖土工程勘探網的合理布局,從而得到定量的有關巖土參數空間的最優化值。而經典的統計方法使用的標準差,變異系數特征值的離散隨機變量等參數,這些值的特征通常能用來總結某個范圍內的巖土參數值給定的離散的規模以及總體集中度,卻不可能反映巖土參數的空間局部作用域和特征值的一個特定的方向。所以,地質統計學方法可以彌補傳統統計方法忽視巖土參數變異性的缺點,從而對巖土參數的空間變異性進行更現實的分析和評價。

        3結論

        巖土參數的不確定性根源是巖土參數的空間變異性和量測系統變異性所導致的。巖土參數的變異性特征確定了巖土參數的空間分布的結構性和隨機性的雙重特征,因此我們就用巖土參數的區域化變量理論對巖土參數的空間變異性做出客觀的評估。變異函數及其參數的使用,使得我們能夠對巖石結構特征進行定量描述,從定量的角度揭示巖土屬性空間變異規律,在區域化變量空間結構分析基礎上構建出的有別于傳統統計方法的方向綜合變異指標,然后充分利用經典統計學所丟失的信息,就可以對巖土參數的空間變異性得出可靠的定量評價。地質統計學是巖土工程研究巖土的空間變異性及數學地質領域有效的工具,有很廣闊的應用前景,這體現其在儲量計算、勘探等領域探索,以及采礦設計和采礦地質等方面都顯示了強大的生命力,已經成為描述和考察各種自然資源工程學科。地質統計學研究巖土參數幾個空間變異性,可以更全面的揭示巖土參數的空間分布特征,從而更為準確評估建筑工地的巖土特征,為工程施工前的做可靠的參照依據。

        參考文獻

        [1]朱小林:巖上工程參數的評價(巖上工程系列講座第五講) [J].工程勘察,1989年5 期.

        [2]戴維著,孫惠文,劉承柞譯.礦產儲量的地質統計學評價( 數學地質進展2)[J].地質出版社,北京,1989年.

        [3]王俊庸.地質統計學及共在煤炭資源開發中的應用[J].煤炭工業出版社, 1990

        第7篇:統計學的參數范文

        統計學研究的對象是數據,數據科學顧名思義也是以數據為研究對象,這產生一種直觀的錯覺,似乎數據科學與統計學之間存在某種與生俱來的淵源關系。Wu(1998)直言不諱,數據科學就是統計學的重命名,相應地,數據科學家替代了統計學家這個稱謂。若此,那是什么促成了這種名義上的替代?顯然僅僅因為數據量大本身并不足以促成“統計學”向“數據科學”的轉變,數據挖掘、機器學習這些概念似乎就已經足夠了。問題的關鍵在于,二者所指的“數據”并非同一概念,數據②本身是一個很寬泛的概念,只要是對客觀事物記錄下來的、可以鑒別的符號都可以稱之為數據,包括數字、文字、音頻、視頻等等。統計學研究的數據雖然類型豐富,如類別數據、有序數據等定性數據,定距數據、定比數據等定量數據,但這些都是結構化數據;數據科學所謂的數據則更為寬泛,不僅包括這些傳統的結構型數據,而且還包括文本、圖像、視頻、音頻、網絡日志等非結構型和半結構型數據,即,大數據。大數據(以半/非結構型數據為主)使基于關系型數據庫的傳統分析工具很難發揮作用,或者說傳統的數據庫和統計分析方法很難在可容忍的時間范圍內完成存儲、管理和分析等一系列數據處理過程,為了有效地處理這類數據,需要一種新的范式———數據科學。真正意義上的現代統計學是從處理小數據、不完美的實驗等這類現實問題發展起來的,而數據科學是因為處理大數據這類現實問題而興起的。因此數據科學的研究對象是大數據,而統計學以結構型數據為研究對象。退一步,單從數量級來講,也已發生了質變。對于結構化的大規模數據,傳統的方法只是理論上的(可行性)或不經濟的(有效性),實踐中還需要借助數據挖掘、機器學習、并行處理技術等現代計算技術才能實現。

        二、數據科學的統計學內涵

        (一)理論基礎

        數據科學中的數據處理和分析方法是在不同學科領域中分別發展起來的,譬如,統計學、統計學習或稱統計機器學習、數據挖掘、應用數學、數據密集型計算、密集計算方法等。在量化分析的浪潮下甚至出現了“metric+模式”,如計量經濟學、文獻計量學、網絡計量學、生物統計學等。因此,有學者將數據科學定義為計算機科學技術、數學與統計學知識、專業應用知識三者的交集,這意味著數據科學是一門新興的交叉學科。但是這種沒有側重的疊加似乎只是羅列了數據科學所涉及到的學科知識,并沒有進行實質性的分析,就好似任何現實活動都可以拆解為不同的細分學科,這是必然的。根據Naur(1960,1974)的觀點,數據科學或稱數據學是計算機科學的一個替代性稱謂。但是這種字面上的轉換,并沒有作為一個獨立的學科而形成。Cleveland(2001)首次將數據科學作為一個獨立的學科提出時,將數據科學表述為統計學加上它在計算技術方面的擴展。這種觀點表明,數據科學的理論基礎是統計學,數據科學可以看作是統計學在研究范圍(對象)和分析方法上不斷擴展的結果。一如統計學最初只是作為征兵、征稅等行政管理的附屬活動,而現在包括了范圍更廣泛的理論和方法。從研究范圍的擴展來看,是從最初的結構型大規模數據(登記數據),到結構型的小規模數據(抽樣數據)、結構型的大規模數據(微觀數據),再擴展到現在的非(半)結構型的大規模數據(大數據)和關系數據等類型更為豐富的數據。從分析方法的擴展來看,是從參數方法到非參數方法,從基于模型到基于算法,一方面傳統的統計模型需要向更一般的數據概念延伸;另一方面,算法(計算機實現)成為必要的“可行性分析”,而且在很多方面算法模型的優勢越來越突出。注意到,數據分析有驗證性的數據分析和探索性的數據分析兩個基本取向,但不論是哪一種取向,都有一個基本的前提假設,就是觀測數據是由背后的一個(隨機)模型生成,因此數據分析的基本問題就是找出這個(隨機)模型。Tukey(1980,2000)明確提到,EDA和CDA并不是替代關系,兩者皆必不可少,強調EDA是因為它被低估了。數據導向是計算機時代統計學發展的方向,這一觀點已被越來越多的統計學家所認同。但是數據導向仍然有基于模型與基于算法兩種聲音,其中,前文提到的EDA和CDA都屬于基于模型的方法,它們都假定數據背后存在某種生成機制;而算法模型則認為復雜的現實世界無法用數學公式來刻畫,即,不設置具體的數學模型,同時對數據也不做相應的限制性假定。算法模型自20世紀80年代中期以來隨著計算機技術的迅猛發展而得到快速成長,然而很大程度上是在統計學這個領域之外“悄然”進行的,比如人工神經網絡、支持向量機、決策樹、隨機森林等機器學習和數據挖掘方法。若響應變量記為y,預測變量記為x,擾動項和參數分別記為ε和β,則基于模型的基本形式是:y=f(x,β,ε),其目的是要研究清楚y與x之間的關系并對y做出預測,其中,f是一個有顯式表達的函數形式(若f先驗假定,則對應CDA;若f是探索得到的,則對應EDA),比如線性回歸、Logistic回歸、Cox回歸等。可見,傳統建模的基本觀點是,不僅要得到正確的模型———可解釋性強,而且要得到準確的模型———外推預測能力強。而對于現實中復雜的、高維的、非線性的數據集,更切合實際的做法是直接去尋找一個恰當的預測規則(算法模型),不過代價是可解釋性較弱,但是算法模型的計算效率和可擴展性更強。基于算法的基本形式類似于非參數方法y=f(x,ε),但是比非參數方法的要求更低yx,因為非參數方法很多時候要求f或其一階導數是平滑的,而這里直接跳過了函數機制的探討,尋找的只是一個預測規則(后續的檢驗也是基于預測構造的)。在很多應用場合,算法模型得到的是針對具體問題的解(譬如某些參數是被當作一個確定的值通過優化算法得到的),并不是統計意義上的推斷解。

        (二)技術維度

        數據科學是基于數據的決策,數據分析的本質既不是數學,也不是軟件程序,而是對數據的“閱讀”和“理解”。技術只是輔助數據理解的工具,一個毫無統計學知識的人應用統計軟件也可以得到統計結果,但無論其過程還是結果都是可疑的,對統計結果的解釋也無法令人信服。“從計算機科學自身來看,這些應用領域提供的主要研究對象就是數據。雖然計算機科學一貫重視數據的研究,但數據在其中的地位將會得到更進一步的加強”。不可否認,統計分析逐漸向計算機科學技術靠近的趨勢是明顯的。這一方面是因為,數據量快速膨脹,數據來源、類型和結構越來越復雜,迫切需要開發更高效率的存儲和分析工具,可以很好地適應數據量的快速膨脹;另一方面,計算機科學技術的迅猛發展為新方法的實現提供了重要的支撐。對于大數據而言,大數據分析丟不掉計算機科學這個屬性的一個重要原因還不單純是因為需要統計軟件來協助基本的統計分析和計算,而是大數據并不能像早先在關系型數據庫中的數據那樣可以直接用于統計分析。事實上,面對越來越龐雜的數據,核心的統計方法并沒有實質性的改變,改變的只是實現它的算法。因此,從某種程度上來講,大數據考驗的并不是統計學的方法論,而是計算機科學技術和算法的適應性。譬如大數據的存儲、管理以及分析架構,這些都是技術上的應對,是如何實現統計分析的輔助工具,核心的數據分析邏輯并沒有實質性的改變。因此,就目前而言,大數據分析的關鍵是計算機技術如何更新升級來適應這種變革,以便可以像從前一樣滿足統計分析的需要。

        (三)應用維度

        在商業應用領域,數據科學被定義為,將數據轉化為有價值的商業信息①的完整過程。數據科學家要同時具備數據分析技術和商業敏感性等綜合技能。換句話說,數據科學家不僅要了解數據的來源、類型和存儲調用方式,而且還要知曉如何選擇相應的分析方法,同時對分析結果也能做出切合實際的解釋②。這實際上提出了兩個層面的要求:①長期目標是數據科學家從一開始就應該熟悉整個數據分析流程,而不是數據庫、統計學、機器學習、經濟學、商業分析等片段化碎片化的知識。②短期目標實際上是一個“二級定義”,即,鼓勵已經在專業領域內有所成就的統計學家、程序員、商業分析師相互學習。在提及數據科學的相關文獻中,對應用領域有更多的傾向;數據科學與統計學、數學等其他學科的區別恰在于其更傾向于實際應用。甚至有觀點認為,數據科學是為應對大數據現象而專門設定的一個“職業”。其中,商業敏感性是數據科學家區別于一般統計人員的基本素質。對數據的簡單收集和報告不是數據科學的要義,數據科學強調對數據多角度的理解,以及如何就大數據提出相關的問題(很多重要的問題,我們非但不知道答案而且不知道問題何在以及如何發問)。同時數據科學家要有良好的表達能力,能將數據中所發現的事實清楚地表達給相關部門以便實現有效協作。從商業應用和服務社會的角度來看,強調應用這個維度無可厚非,因為此處是數據產生的土壤,符合數據科學數據導向的理念,數據分析的目的很大程度上也是為了增進商業理解,而且包括數據科學家、首席信息官這些提法也都肇始于實務部門。不過,早在20世紀90年代中期,已故圖靈獎得主格雷(JimGray)就已經意識到,數據庫技術的下一個“大數據”挑戰將會來自科學領域而非商業領域(科學研究領域成為產生大數據的重要土壤)。2008年9月4日刊出的《自然》以“bigdata”作為專題(封面)探討了環境科學、生物醫藥、互聯網技術等領域所面臨的大數據挑戰。2011年2月11日,《科學》攜其子刊《科學-信號傳導》、《科學-轉譯醫學》、《科學-職業》專門就日益增長的科學研究數據進行了廣泛的討論。格雷還進一步提出科學研究的“第四范式”是數據(數據密集型科學),不同于實驗、理論、和計算這三種范式,在該范式下,需要“將計算用于數據,而非將數據用于計算”。這種觀點實際上是將數據從計算科學中單獨區別開來了。

        三、數據科學范式對統計分析過程的直接影響

        以前所謂的大規模數據都是封閉于一個機構內的(數據孤島),而大數據注重的是數據集間的關聯關系,也可以說大數據讓孤立的數據形成了新的聯系,是一種整體的、系統的觀念。從這個層面來說,將大數據稱為“大融合數據”或許更為恰當。事實上,孤立的大數據,其價值十分有限,大數據的革新恰在于它與傳統數據的結合、線上和線下數據的結合,當放到更大的環境中所產生的“1+1>2”的價值。譬如消費行為記錄與企業生產數據結合,移動通訊基站定位數據用于優化城市交通設計,微博和社交網絡數據用于購物推薦,搜索數據用于流感預測、利用社交媒體數據監測食品價等等。特別是數據集之間建立的均衡關系,一方面無形中增強了對數據質量的監督和約束;另一方面,為過去難以統計的指標和變量提供了另辟蹊徑的思路。從統計學的角度來看,數據科學(大數據)對統計分析過程的各個環節(數據收集、整理、分析、評價、等)都提出了挑戰,其中,集中表現在數據收集和數據分析這兩個方面。

        (一)數據收集方面

        在統計學被作為一個獨立的學科分離出來之前(1900年前),統計學家們就已經開始處理大規模數據了,但是這個時期主要是全國范圍的普查登記造冊,至多是一些簡單的匯總和比較。之后(1920-1960年)的焦點逐漸縮聚在小規模數據(樣本),大部分經典的統計方法(統計推斷)以及現代意義上的統計調查(抽樣調查)正是在這個時期產生。隨后的45年里,統計方法因廣泛的應用而得到快速發展。變革再次來自于統計分析的初始環節———數據收集方式的轉變:傳統的統計調查方法通常是經過設計的、系統收集的,而大數據是零散實錄的、有機的,這些數據通常是用戶使用電子數碼產品的副產品或用戶自行產生的內容,比如社交媒體數據、搜索記錄、網絡日志等數據流等,而且數據隨時都在增加(數據集是動態的)。與以往大規模數據不同的是,數據來源和類型更加豐富,數據庫間的關聯性也得到了前所未有的重視(大數據的組織形式是數據網絡),問題也變得更加復雜。隨著移動電話和網絡的逐漸滲透,固定電話不再是識別住戶的有效工具變量,相應的無回答率也在增加(移動電話的拒訪率一般高于固定電話),同時統計調查的成本在增加,人口的流動性在增加,隱私意識以及法律對隱私的保護日益趨緊,涉及個人信息的數據從常規調查中越來越難以取得(從各國的經驗來看,拒訪率或無回答率的趨勢是增加的),對時效性的要求也越來越高。因此,官方統計的數據來源已經無法局限于傳統的統計調查,迫切需要整合部門行政記錄數據、商業記錄數據、個人行為記錄數據等多渠道數據源,與部門和搜索引擎服務商展開更廣泛的合作。

        (二)數據分析方面

        現代統計分析方法的核心是抽樣推斷(參數估計和假設檢驗),然而數據收集方式的改變直接淡化了樣本的意義。比如基于瀏覽和偏好數據構建的推薦算法,誠然改進算法可以改善推薦效果,但是增加數據同樣可以達到相同的目的,甚至效果更好。即所謂的“大量的數據勝于好的算法”這與統計學的關鍵定律(大數定律和中心極限定理)是一致的。同樣,在大數據分析中,可以用數量來產生質量,而不再需要用樣本來推斷總體。事實上,在某些場合(比如社會網絡數據),抽樣本身是困難的。數據導向的、基于算法的數據分析方法成為計算機時代統計學發展無法回避的一個重要趨勢。算法模型不僅對數據分布結構有更少的限制性假定,而且在計算效率上有很大的優勢。特別是一些積極的開源軟件的支撐,以及天生與計算機的相容性,使算法模型越來越受到學界的廣泛重視。大數據分析首先涉及到存儲、傳輸等大數據管理方面的問題。僅從數量上來看,信息爆炸、數據過剩、數據泛濫、數據墳墓、豐富的數據貧乏的知識……這些詞組表達的主要是我們匱乏的、捉襟見肘的存儲能力,同時,存儲數據中有利用價值的部分卻少之又少或塵封窖藏難以被發現。這除了對開采工具的渴求,當時的情緒主要還是遷怨于盲目的記錄,把過多精力放在捕捉和存儲外在信息。在這種情況下,開采有用的知識等價于拋棄無用的數據。然而,大數據時代的思路改變了,開始變本加厲巨細靡遺地記錄一切可以記錄的數據。因為:數據再怎么拋棄還是會越來越多。我們不能通過刪減數據來適應自己的無能,為自己不愿做出改變找借口,而是應該面對現實,提高處理海量數據的能力。退一步,該刪除哪些數據呢?當前無用的數據將來也無用嗎?顯然刪除數據的成本要大于存儲的成本。大數據存儲目前廣泛應用的是GFS、HDFS等基于計算機群組的文件系統,它可以通過簡單增加計算機來無限地擴充存儲能力。值得注意的是,分布式文件系統存儲的數據僅僅是整個架構中最基礎的描述,是為其他部件服務的(比如MapReduce),并不能直接用于統計分析。而NoSQL這類分布式存儲系統可以實現高級查詢語言,事實上,有些RDBMS開始借鑒MapReduce的一些思路,而基于MapReduce的高級查詢語言也使MapReduce更接近傳統的數據庫編程,二者的差異將變得越來越模糊。大數據分析的可行性問題指的是,數據量可能大到已經超過了目前的存儲能力,或者盡管沒有大到無法存儲,但是如果算法對內存和處理器要求很高,那么數據相對也就“大”了。換句話說,可行性問題主要是,數據量太大了,或者算法的復雜度太高。大數據分析的有效性問題指的是,盡管目前的硬件條件允許,但是耗時太久,無法在可容忍的或者說可以接受的時間范圍內完成。目前對有效性的解決辦法是采用并行處理。注意到,高性能計算和網格計算也是并行處理,但是對于大數據而言,由于很多節點需要訪問大量數據,因此很多計算節點會因為網絡帶寬的限制而不得不空閑等待。而MapReduce會盡量在計算節點上存儲數據,以實現數據的本地快速訪問。因此,數據本地化是MapReduce的核心特征。

        四、結論

        (一)數據科學不能簡單地理解為統計學的重命名,二者所指“數據”并非同一概念,前者更為寬泛,不僅包括結構型數據,而且還包括文本、圖像、視頻、音頻、網絡日志等非結構型和半結構型數據;同時,數量級也是后者難以企及的(PB以上)。但是數據科學的理論基礎是統計學,數據科學可以看作是統計學在研究范圍(對象)和分析方法上不斷擴展的結果,特別是數據導向的、基于算法的數據分析方法越來越受到學界的廣泛重視。

        (二)從某種程度上來講,大數據考驗的并不是統計學的方法論,而是計算機科學技術和算法的適應性。譬如大數據的存儲、管理以及分析架構,這些都是技術上的應對,核心的數據分析邏輯并沒有實質性的改變。因此,大數據分析的關鍵是計算機技術如何更新升級以適應這種變革,以便可以像從前一樣滿足統計分析的需要。

        (三)大數據問題很大程度上來自于商業領域,受商業利益驅動,因此數據科學還被普遍定義為,將數據轉化為有價值的商業信息的完整過程。這種強調應用維度的觀點無可厚非,因為此處是數據產生的土壤,符合數據科學數據導向的理念。不過,早在20世紀90年代中期,已故圖靈獎得主格雷就已經意識到,數據庫技術的下一個“大數據”挑戰將會來自科學領域而非商業領域(科學研究領域成為產生大數據的重要土壤)。他提出科學研究的“第四范式”是數據,不同于實驗、理論、和計算這三種范式,在該范式下,需要“將計算用于數據,而非將數據用于計算”。這種觀點實際上將數據從計算科學中單獨區別開了。

        (四)數據科學范式對統計分析過程的各個環節都提出了挑戰,集中表現在數據收集和數據分析這兩個方面。數據收集不再是刻意的、經過設計的,而更多的是用戶使用電子數碼產品的副產品或用戶自行產生的內容,這種改變的直接影響是淡化了樣本的意義,同時增進了數據的客觀性。事實上,在某些場合(比如社會網絡數據),抽樣本身是困難的。數據的存儲和分析也不再一味地依賴于高性能計算機,而是轉向由中低端設備構成的大規模群組并行處理,采用橫向擴展的方式。

        第8篇:統計學的參數范文

        【關鍵詞】經濟類非統計專業 統計學教學

        統計學是一門研究統計活動規律和方法的方法論科學。統計學是經濟類各專業的主要課程或主干學科,幾乎所有的專業都把統計學作為一門專業基礎課來開設,以便為學生進行專業研究時提供一種可行的定量分析工具。而面對不同層次的教學對象,不同專業的教學需求,統計學課程教學過程面臨諸多挑戰。

        一、教學中存在的一些困難與問題

        統計學實際教學效果并不理想,不少學生認為統計學概念多,公式多,十分枯燥,比較難學,并且在實際中沒什么用處。本文主要從一個教師的角度對目前經濟類非統計專業的統計學教學存在的問題進行探討。

        (1)對于非統計專業的學生來說,他們本身的專業課學習負擔已經不輕, 加上對統計知識的認識不夠, 讓他們騰出更多的時間來學習統計知識是很難做到的。 而且,由于其本專業的課程體系要求,學生本身的數學基礎特別是概率論知識學得又不是很好,這就使得他們感到統計學知識難以理解,出現了統計難學的看法,最終導致一些學生徹底放棄。 這樣,學生在認識不到統計知識用處的情況下, 所學又和實際結合不緊密。 容易產生學統計無用的想法,學習興趣不高,以至于被迫學習,教學效果不佳。

        (2)在實際教學中,由于各種條件所限,教學方式還局限在傳統的教學手段上。隨著計算機的普及, 有關數據處理的軟件也越來越多,統計學的教學手段也應該日新月異。 多媒體教學使得教學信息量有所增加, 但是并沒有改變傳統的教師講、學生聽的教學方式,往往是一節課下來,教師講的嗓子冒煙,學生聽得直打瞌睡,究其原因還在于過于單一的教學手段, 使得學生不能直接參與到教學中去。

        (3)教學定位不清楚。統計學教學分為統計學專業的統計學教學和非統計專業的統計學教學。對統計學專業的學生而言要求他們掌握一整套系統的統計學分析方法,以便將來專門進行有關數據的研究;而對絕大多數非統計專業的學生來說,學習統計學主要是為他們提供一種統計學的思想, 在信息社會,如何辨別信息的真偽,做出判斷和決策,這都需要他們具備一些統計學的思想;其次是給他們提供一些實用的數據處理方法。 可是不少學校的非統計教學由于定位不清楚, 導致教學過程中還是充斥著大量的公式推導和概念闡述,如不少統計學教材上大篇幅介紹統計圖表, 并對其進行比較, 可是對于如何利用計算機軟件畫出這些圖表卻沒有闡述。 其結果是學生學完了統計學后只記得一些概念,而具體如何收集、整理、分析數據,并做出圖表卻一無所知, 結果是不少學生得出《統計學》難學也沒什么用的結論。

        二、教學方法與教學手段的更新

        (1)合理地安排教學內容

        經濟類非統計專業統計學教學的主要目的是通過學習統計學使學生具備在隨機性事物中尋找規律的能力,以及懂得如何在生活、學習、工作中運用統計學知識。 因此在教學內容的選擇上也應該有所取舍。整個統計學的教學應該按照收集數據、整理數據和分析數據的步驟進行。其主要內容還是包括描述統計和推斷統計兩部分,而重點應加以調整,應以推斷統計為主,描述統計為輔。 在描述統計部分,著重介紹搜集、整理、分析數據的方法。 在推斷統計部分,不僅要介紹抽樣推斷、參數估計、假設檢驗、方差分析和回歸分析,還應該介紹關于統計決策、多元統計分析和非參數統計等現代統計方法。 計算機的飛速發展給統計學的發展帶來了前所未有的突破。 統計學常用的軟件是 Excel 和 SPSS, 為了讓學生更多了解統計學方法在實際中的應用,因此實踐課程的加入是必須的。實踐課程中介紹這些軟件的使用方法, 使得統計學不在是高高在上的陽春白雪,成為可以隨時接觸的、使用的工具。

        (2)采用多樣化的教學手段

        統計學能否引起學生的興趣 ,教學手段多樣化也是一個關鍵的因素。 因此,當務之急是改變當前單一的教學手段,使用多樣化的教學手段。 首先,在教學過程中,將傳統的“灌輸式”教學轉變為“啟發式”教學。 充分調動學生的積極性,在課堂中應將講授式教學法、啟發式教學法和討論式教學法相結合,相互取長補短,以達到更好的效果。其次,由于統計學內容的繁多與復雜,適當加入學生的環節可以增強學習的主動性。例如讓學生用軟件設計問卷, 對自己收集的數據進行簡單的分析,寫出分析報告。 最后,統計學是一門實踐性、應用性很強的學科,應該加強教師和學生之間的互動和交流, 因此在教學中利用計算機輔助教學,加大實踐教學的比重。 這樣,既便于進行案例教學、小組討論,也便于調動學生學習的積極性,使每個學生都能參與到教學中去,真正做到“教學相長”。

        (3)部分內容采用實踐教學和靈活的考核方式

        單純的筆試往往使學生認為考試為大, 別的都是次要的,重點在于考試前死記硬背,而對于是否掌握知識沒有興趣。實踐教學一定比例的加入必然要求考核方式的多樣化。 因此,單純進行筆試考試改革勢在必行。并且統計學中的一些內容,例如推斷分析、方差分析和回歸分析等不借助計算機很難在筆試中實現甚至沒辦法實現,導致的結果是重要內容沒辦法考,能考的內容有可能反而不重要。 因此,必須采用靈活多樣的考核方式,尤其是以實踐教學為主的考核方式勢在必行。

        三、結語

        總之,在對經濟類非統計專業的統計學教學中,教師應充分調動學生學習的積極性。 不僅需要教師在選擇教學內容的時候要緊密聯系實際, 還要求教師要全方位的展示統計學的魅力,增加實踐課時,讓學生充分理解統計無處不在、無處不用。 其次, 教學手段與方式的選擇也起到事半功倍的作用。 統計軟件的應用、統計案例的講解,完全可以使統計學成為人人喜歡學習的一門數據處理的工具。

        參考文獻:

        [1]王來栓.財經院校非統計專業統計學教學法探討,內蒙古統計[J].2013(06).

        [2]董瑞.]經管類專業統計學教學改革的背景與設想.河南科技學院學報[J].20 l1(06).

        第9篇:統計學的參數范文

        關鍵詞:經濟管理類專業 統計學教材 統計軟件

        一、引言

        統計學作為一門搜集數據、整理數據、展示數據、分析數據的方法論學科,在當今社會的各個領域得到了越來越廣泛的應用,在我國各高等院校也日益受到重視,幾乎所有的經濟、管理類專業都把統計學作為學科基礎課來開設,使之成為本專業定量分析的工具。可是據我十多年的統計學教學實踐和調查結果來看,目前統計學在高校的開課效果并不理想,多數學生反映統計學公式多、計算量大、內容枯燥,還有不少同學對統計學存在畏懼心理,統計學也成為目前高校不及格率最高的科目之一。造成目前這種狀況的原因很多,但目前國內的統計學教材的“可讀性”差,讀起來“味同嚼蠟”應該是一個主要的原因。本文對當前經濟、管理類專業的統計學教材存在的一些問題進行探討。

        二、目前統計學教材存在的主要問題

        目前市面上國內編著的經濟、管理類的統計學教材數量繁多,其名字也五花八門,如:《統計學原理》《統計學基礎》《統計學》《經濟統計學》《管理統計學》等。據我調查,目前武漢市書店在售的這類圖書不下三十種。雖然數目眾多,但翻開一看,就會發現這些書的內容大同小異,和國外的統計學教材相比,對學生的吸引力不強。經過綜合,我認為國內的統計學教材主要存在以下問題。

        (一)內容陳舊。

        如今的經濟、管理類統計學教材由以前的只介紹描述統計變成既有描述又有推斷統計的大統計學。可是翻開現有的統計學教材,就會發現不少已經過時的描述統計學的概念比比皆是,學生平時在生活、學習中幾乎用不上。如不少教材里的第一章緒論部分重點介紹“標志”和“指標”這對概念,花很大篇幅來介紹兩者的聯系和區別,但這對概念在后續的數據分析中幾乎用不到;在“后續統計調查”這章中,對統計報表、重點調查和典型調查這些方法也是花了不少篇幅來介紹,而這些在計劃經濟條件下使用的調查方法現在很少采用;另外,目前不少教材保留了“指數”一章,詳細介紹了編制指數的兩種方法,而這些內容由于內容繁雜,應用面窄,除了專門的統計調查人員,一般人根本沒有必要掌握,只需要了解其基本含義。由此可見,目前國內統計學教材內容陳舊,教材中對廣大讀者用處不大的資源占用了大量的篇幅,而一些實用性很強的內容,如參數估計、假設檢驗及多元回歸則放在教材后面簡單介紹,由于學時有限,很多老師在課堂上只是簡單地提一下,其結果是學生用這樣的教材根本學不到有用的知識。

        (二)概念、公式多,案例少。

        目前很多學生并不需要學量系統的統計學知識,而只需要能用簡單、實用的統計學方法來辨別、處理出現的定量分析問題,并且能夠利用統計學軟件自己解決一部分,當自己不能解決時知道到哪里尋求幫助就行了。因此統計學教材的主要任務是教會他們統計學的主要思想,學會用統計分析方法解決實際問題。基于這種目的,統計學教材應偏重實際應用,多引入生活中常見的實例或案例,不知不覺地把讀者引入統計學專業知識的殿堂。但是目前的統計學教材一般都是先介紹理論、概念,再給出公式及其推導過程,最后才結合實踐進行舉例,而且大量繁瑣的數學推導占了很大的篇幅,而經濟、管理類專業的學生大多數是文科生,數學底子差,大量的公式推導往往讓他們望而卻步。而與大量公式相對應,國內現有的經濟、管理類的統計學教材有關經濟、管理的統計案例很少,大部分是過于簡單的設例,或是“編寫”的案例,甚至是若干年以前在自然科學領域內應用的陳舊的案例,與現實的經濟、管理工作嚴重脫節。國內統計學教材這種重理論學習和公式推導,輕結合實際案例的特點,使得本該妙趣橫生的統計學在學生眼里課程變得晦澀難懂、枯燥乏味。

        (三)實用性不強。

        統計學作為一門實用性很強的方法論學科,是和計算機以及統計軟件緊緊地聯系在一起,任何統計學方法都可以在統計學軟件上操作完成,目前常用的統計學軟件有SAS、STATISTIC、MINITAB、SPSS和EXCEL,對于經濟管理專業的學生來說,SPSS和EXCEL都是操作起來相當簡單方便的統計學軟件。目前國內的統計學教材只是介紹統計學原理和方法,而如何應用統計軟件來解決具體問題則沒有系統的介紹,如Excel制作圖、表的功能很強大,展示數據常用的直方圖、條形圖、餅圖、環形圖利用Excel都可以做得很漂亮,可是不少教材只是介紹什么是直方圖和條形圖,兩者有何區別,而具體如何利用軟件作圖則只字未提;時間數列分析、多元回歸分析等內容涉及的數據都很多,不借助統計軟件根本沒法完成,因此很多教材也只是介紹概念和方法,老師在課上也只簡單介紹方法,不給學生講授如何應用統計軟件來解決具體問題,這使得學生學完這門課后實際分析問題的能力沒有得到鍛煉,學生在學習后續課程或撰寫畢業論文時,抱怨統計學只是學了很多不會用,也不知怎么用的概念和公式。

        三、對策分析

        統計學教材的質量普遍不高,反映了當前我國定量分析問題的能力還有待提高。要解決這一問題,我覺得重點應從以下幾方面著手。

        (一)加大對從事統計學教學的教師的培訓力度。

        統計學教材是統計學教師教學實踐的結晶。目前國內統計學教材質量不高的根本原因在于從事統計學教學教師的統計學能力有所欠缺。從事經濟、管理類統計學教學的教師不僅要熟練地掌握統計學方法和統計軟件的使用技巧,還要對經濟、管理有一定的了解,并了解統計學在經濟、管理中的使用。可是據我對武漢市高校的調查統計,不少學校從事經濟、管理統計學教學的教師都是學習經濟、管理的,他們對統計學方法和統計軟件的使用并不熟悉,因此編出來的教材其質量也是可想而知。雖然一部分老師是統計學專業畢業的,但絕大多數是學經濟統計的,對推斷統計和統計軟件的使用并不精通。另外還有一小部分老師是學數理統計專業的,他們對統計學方法進行過系統的學習,可是由于對于經濟、管理了解甚少,因此沒法和經濟、管理的實際案例相結合,而只是像講數學一樣,著重公式的推導。因此要改變這種狀況,各校首先要加大對統計學重要性的認識,其次要拿出切實可行的方案來對從事統計學教學的教師進行全方位的培訓,使得他們具備從事統計學教學的專業水平,這樣才有可能從根本上改變統計學教材吸引不了學生的現狀。

        (二)借鑒國外優秀統計學教材的經驗。

        和國內經濟、管理類統計學教材內容陳舊、案例匱乏、實用性不強和趣味性差的現狀相比,國外的統計學教材則讓人眼前一亮。國外教材非常注重實際應用,每一部分都引入大量的生活中常見的實例或案例,不知不覺地把讀者引入統計專業知識的殿堂。這些教材幾乎都摒棄了繁瑣的數學推導,大部分只介紹基本公式,少數則采用純文字描述的形式來介紹統計學,讓沒有統計學基礎的學生也能輕松地學習統計學而且它們都非常詳細地介紹了如何利用統計軟件來進行操作,并貫穿在各章,課后也有大量配套的習題讓讀者自己去練習,以加深對統計學方法的理解。因此要提高目前國內統計學教材的質量,多多向國外同行學習是非常必要的,不少學校的老師直接以國外的教材作為學生的學習教材。但是完全采用國外的教材也有不少問題,如直接采用國外原版教材,對多數學生來說英文水平有待提高,而如果采用翻譯過來的教材,由于目前不少教材翻譯質量不高,學生讀起來感覺很生澀;另外國外的教材結合的都是本國的例子,和我國的具體國情不符,學生聽起來覺得陌生。因此最好的方法是借鑒國外統計學教材好的體系和編排方法,同時結合本國的具體實踐,編制適合我國國慶的教材,這就需要付出更多的努力。

        (三)合理安排統計學教材的章節設置。

        如今,國內經管類專業“統計學”教材通常包括緒論、統計調查、統計整理、數據的概括性描述、時間數列、抽樣分布與參數估計、相關分析與回歸分析、統計指數等八個部分。前面談到過有些章節的內容陳舊,因此有必要對各章節設置進行調整。借鑒國外統計學教材的經驗,應刪除描述統計的大部分內容部分,重點介紹推斷統計,即在有限的篇幅內重點介紹統計學的精華部分。具體來說,經濟、管理類統計學教材應包括以下幾部分:數據收集、數據的圖表展示、數據的概括性度量、時間數列、參數估計和假設檢驗、方差分析和相關與回歸。另外對章節的內容也要進行調整,多介紹實用性、強的內容,最后應加強統計軟件的介紹,著重可以Excel或SPSS為工具來進行實例分析。

        无码人妻一二三区久久免费_亚洲一区二区国产?变态?另类_国产精品一区免视频播放_日韩乱码人妻无码中文视频
      2. <input id="zdukh"></input>
      3. <b id="zdukh"><bdo id="zdukh"></bdo></b>
          <b id="zdukh"><bdo id="zdukh"></bdo></b>
        1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

          <wbr id="zdukh"><table id="zdukh"></table></wbr>

          1. <input id="zdukh"></input>
            <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
            <sub id="zdukh"></sub>
            日韩精品久久久久 | 先锋资源视频在线观看 | 日本人真婬视频一区二区三区 | 亚洲性夜夜综合久久麻豆 | 一区二区三区四区在线视频 | 午夜福利亚洲精品无遮挡 |