- 相關推薦
怎樣學好統計學
在學校上了無數次的統計課程,學了一大堆的理論知識,也記住了好多的計算公式,但是一旦碰到實際數據,總是不知如何下手,最終只能找幾篇類似的文章,照搬上面的方法,也不管對不對了。下面為大家帶來怎樣學好統計學,快來看看吧。
怎樣學好統計學
我們為什么學不會統計,估計很多人很少會去像這個問題。我雖然也沒有刻意去思考,但是在多年的協助別人設計、分析的經歷中,慢慢地發現了一些可能的原因。
第一、統計學本身是一個非常靈活的學科,真正符合“具體問題具體分析”這樣的一個哲學理念。即使是同樣的指標,在不同場合下所選用的方法也可能不同。單說一個簡單的方差分析,就因不同的設計類型需要采用不同的分析方法。甚至于同一批數據如果目的不同,其方法與結果也是不同的。
第二、大多數人最頭疼的問題應該是:對于一批數據,不知道到底應該選用什么方法。盡管各種方法應用的前提條件背了一堆,但好像每個都像,每個又都不像。感覺好像用哪個方法也行,就是不知道哪個方法更準確。對于這樣的問題,確實沒有什么好辦法能解決。正像醫學生剛畢業時判斷不準疾病一樣,只能靠經驗積累。
第三、目前的醫學統計學教材大都是一個模式,冷冰冰的框架,沒有一點人性化的詞語,全是一些讓人摸不著頭腦的話語。實際上,這也正是目前醫學統計學領域的悲哀,真正有水平的人很少,大多都是似懂非懂,缺乏分析的經驗,寫書時只能是照搬,相互抄來抄去,最終導致所有的醫學統計學教材都是一個面孔。
第四、目前是學術界煩躁的一個時期,沒有多少人能夠耐住寂寞地真正研究理論。多數人都只是學了一知半解,就自封為“專家”、“人才”。帽子很大,學問不多。也有很多人能夠學習理論,但是又不能結合實際,脫離實際問題,沒有真正的效益。統計學是一門方法學,本身也在不斷地發展,真正想要掌握統計,必須不斷地學習新知識,同時應不斷地應用,只有在應用過程中才能真正地學會并理解。目前國內醫學統計領域真正的高手已經越來越少,主要就是因為大多數人都很難沉下心來仔細研究統計學方法的進展和應用。如果自己都對統計學不了解,如何談得上教授學生,結果必將是讓學生更加糊涂。
真正的統計高手,至少應熟悉傳統的統計學理論,了解最新的統計學進展,經常應用統計學解決各種各樣的問題,至少精通一個數據庫工具,至少掌握一門編程語言,必須精通SAS,這里不說SPSS,因為只有在SAS編程過程中,才能夠更加理解統計學理論,而SPSS僅靠菜單運行,除了知道結果之外,對如何得出結果仍然一無所知,無助于統計學的理解。世界500強中90%以上用SAS而不是SPSS分析數據,不是沒有道理的。
統計學發展過程
起源
統計學的英文statistics最早源于現代拉丁文Statisticum Collegium(國會)、意大利文Statista(國民或政治家)以及德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表對國家的資料進行分析的學問,也就是“研究國家的科學”。十九世紀,統計學在廣泛的數據以及資料中探究其意義,并且由John Sinclair引進到英語世界。
統計學是一門很古老的科學,一般認為其學理研究始于古希臘的亞里士多德時代,迄今已有兩千三百多年的歷史。它起源于研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了“城邦政情”、“政治算數”和“統計分析科學”三個發展階段。所謂“數理統計”并非獨立于統計學的新學科,確切地說,它是統計學在第三個發展階段所形成的所有收集和分析數據的新方法的一個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬于統計學的范疇,而是屬于數學的范疇。
城邦政情
“城邦政情”(Matters of state)階段始于古希臘的亞里斯多德撰寫“城邦政情”或“城邦紀要”。他一共撰寫了一百五十余種紀要,其內容包括各城邦的歷史、行政、科學、藝術、人口、資源和財富等社會和經濟情況的比較、分析,具有社會科學特點。“城邦政情”式的統計研究延續了一兩千年,直至十七世紀中葉才逐漸被“政治算術”這個名詞所替代,并且很快被演化為“統計學”(Statistics)。但統計學依然保留了城邦(state)這個詞根。
政治算術
與“城邦政情”階段沒有很明顯的分界點,本質的差別也不大。
“政治算術”的特點是統計方法與數學計算和推理方法開始結合。分析社會經濟問題的方式更加注重運用定量分析方法。
1690年英國威廉·配弟出版《政治算數》一書作為這個階段的起始標志。
威廉·配第用數字、重量和尺度將社會經濟現象數量化的方法是近代統計學的重要特征。因此,威廉·配第的《政治算術》被后來的學者評價為近代統計學的來源,威廉·配第本人也被評價為近代統計學之父。
配第在書中使用的數字有三類:
第一類是對社會經濟現象進行統計調查和經驗觀察得到的數字。因為受歷史條件的限制,書中通過嚴格的統計調查得到的數據少,根據經驗得出的數字多;
第二類是運用某種數學方法推算出來的數字。其推算方法可分為三種:
(1)以已知數或已知量為基礎,循著某種具體關系進行推算的方法;
(2)通過運用數字的理論性推理來進行推算的方法;
(3)以平均數為基礎進行推算的方法”;
第三類是為了進行理論性推理而采用的例示性的數字。配第把這種運用數字和符號進行的推理稱之為“代數的算法”。從配第使用數據的方法看,“政治算數”階段的統計學已經比較明顯地體現了“收集和分析數據的科學和藝術”特點,統計實證方法和理論分析方法渾然一體,這種方法即使是現代統計學也依然繼承。
統計分析科學
在“政治算術”階段出現的統計與數學的結合趨勢逐漸發展形成了“統計分析科學”。
十九世紀末,歐洲大學開設的“國情紀要”或“政治算數”等課程名稱逐漸消失,代之而起的是“統計分析科學”課程。當時的“統計分析科學”(Science of statistical analysis)課程的內容仍然是分析研究社會經濟問題。
“統計分析科學”課程的出現是現代統計發展階段的開端。1908年,“學生”氏(William Sleey Gosset的筆名Student)發表了關于t分布的論文。這是一篇在統計學發展史上劃時代的文章,它創立了小樣本代替大樣本的方法,開創了統計學的新紀元。
現代統計學的代表人物首推比利時統計學家奎特萊(Adolphe Quelet),他將統計分析科學廣泛應用于社會科學,自然科學和工程技術科學領域,因為他深信統計學是可以用于研究任何科學的一般研究方法.
現代統計學的理論基礎概率論始于研究賭博的機遇問題,大約開始于1477年。數學家為了解釋支配機遇的一般法則進行了長期的研究,逐漸形成了概率論理論框架。在概率論進一步發展的基礎上,到十九世紀初,數學家們逐漸建立了觀察誤差理論,正態分布理論和最小平方法則。于是,現代統計方法便有了比較堅實的理論基礎。
主要術語
統計學(statistics):收集、處理、分析、解釋數據并從數據中得出結論的科學。
描述統計(descriptive statistics):研究數據收集、處理和描述的統計學方法。
推斷統計(inferential statistics):研究如何利用樣本數據來推斷總體特征的統計學方法。
變量(variable):每次觀察會得到不同結果的某種特征。
分類變量(categorical variable):觀測結果表現為某種類別的變量。
順序變量(rank variable):又稱有序分類變量,觀測結果表現為某種有序類別的變量。
數值型變量(metric variable):又稱定量變量,觀測結果表現為數字的變量。
均值(mean):均值也就是平均數,有時特指算術平均數,這是相對其他方式計算的均值,求法是先將所有數字加起來,然后除以數字的個數,這是測量集中趨勢,或者說平均數的一種方法。
中位數(median):也就是選取中間的數,要找中位數,首先需要從小到大排序,排序后,再看中間的數字是什么。
眾數(mode):眾數也就是數據集中出現頻率最多的數字。
【怎樣學好統計學】相關文章:
學好統計學的方法有哪些05-11
怎樣學好JavaScript這門語言12-13
怎樣才能學好科目二06-27
怎樣才能學好英語口語07-21
2017怎樣學好中級財務管理03-07
怎樣才能學好中級《財務管理》05-03
怎么學好英語12-04
學好英語的意義04-09