做實(shí)驗(yàn)需要掌握哪些統(tǒng)計(jì)學(xué)知識？

2022-10-13 17:41:32 admin

統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的基石。學(xué)了統(tǒng)計(jì)學(xué)，你會發(fā)現(xiàn)很多時候的分析并不靠譜。比如很多人都喜歡用平均數(shù)去分析一個事物的結(jié)果，但是這往往是粗糙的，不準(zhǔn)確的。如果學(xué)了統(tǒng)計(jì)學(xué)，那么我們就能以更多更科學(xué)的角度看待數(shù)據(jù)。

大部分的數(shù)據(jù)分析，都會用到統(tǒng)計(jì)方面的以下知識，可以重點(diǎn)學(xué)習(xí)：

基本的統(tǒng)計(jì)量：均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差、百分位數(shù)等
概率分布：幾何分布、二項(xiàng)分布、泊松分布、正態(tài)分布等
總體和樣本：了解基本概念，抽樣的概念
置信區(qū)間與假設(shè)檢驗(yàn)：如何進(jìn)行驗(yàn)證分析
相關(guān)性與回歸分析：一般數(shù)據(jù)分析的基本模型

通過基本的統(tǒng)計(jì)量，你可以進(jìn)行更多元化的可視化，以實(shí)現(xiàn)更加精細(xì)化的數(shù)據(jù)分析。這個時候也需要你去了解更多的Excel函數(shù)來實(shí)現(xiàn)基本的計(jì)算，或者python、R里面一些對應(yīng)的可視化方法。

有了總體和樣本的概念，你就知道在面對大規(guī)模數(shù)據(jù)的時候，怎樣去進(jìn)行抽樣分析。

你也可以應(yīng)用假設(shè)檢驗(yàn)的方法，對一些感性的假設(shè)做出更加精確地檢驗(yàn)。

利用回歸分析的方法，你可以對未來的一些數(shù)據(jù)、缺失的數(shù)據(jù)做基本的預(yù)測。

了解統(tǒng)計(jì)學(xué)的原理之后，你不一定能夠通過工具實(shí)現(xiàn)，那么你需要去對應(yīng)的找網(wǎng)上找相關(guān)的實(shí)現(xiàn)方法，也可以看書。先推薦一本非常簡單的：吳喜之-《統(tǒng)計(jì)學(xué)·從數(shù)據(jù)到結(jié)論》。

另外，如何精力允許，請掌握一些主流算法的原理，比如線性回歸、邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)分析、聚類、協(xié)同過濾、隨機(jī)森林。再深入一點(diǎn)，還可以掌握文本分析、深度學(xué)習(xí)、圖像識別等相關(guān)的算法。關(guān)于這些算法，不僅需要了解其原理，你最好可以流暢地闡述出來，還需要你知曉其在各行業(yè)的一些應(yīng)用場景。如果現(xiàn)階段不是工作剛需，可不作為重點(diǎn)。

本文算是一個知識點(diǎn)匯總，不做細(xì)致展開，讓大家了解統(tǒng)計(jì)學(xué)有哪幾大塊，每一類分別用于什么樣的分析場景。后面幾篇會以實(shí)際案例的方式，細(xì)致講講描述性統(tǒng)計(jì)、概率分布等。

知識點(diǎn)匯總：

1.集中趨勢

2.變異性

3.歸一化

4.正態(tài)分布

5.抽樣分布