ap統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)
AP統(tǒng)計(jì)學(xué)考試知識(shí)點(diǎn)一、描述統(tǒng)計(jì)
* 數(shù)據(jù)(data)分為定性數(shù)據(jù)(qualitative or categorical data)與定量數(shù)據(jù)(quantitativedate)。
定性數(shù)據(jù):按照類別進(jìn)行劃分,展示對(duì)象的屬性;
定量數(shù)據(jù):展示對(duì)象的數(shù)值特征。
* 圖(graph):分為bar chart, pie chart, dotplot, stemplot, histogram, boxplot
* 通過(guò)圖形可以看出數(shù)據(jù)的分布特征:
(1)對(duì)稱(symmetric)
(2)偏態(tài)(skewed)
左偏(skewed to the left)
右偏(skewed to the right)
(3)集中趨勢(shì)
(4)異常值
* histogram的畫法:
(1)以個(gè)數(shù)作為高度
(2)以百分比作為高度
(3)以百分比作為面積。
* 概率密度(probability density function, pdf)
描繪以百分比作為面積的histogram的曲線。
* 累積分布(cumulative distribution function, cdf)
以小于等于該數(shù)的數(shù)據(jù)所占百分比作為該數(shù)的縱坐標(biāo)繪制出的曲線。
* 數(shù)字特征(numerical value)
(1)描述集中趨勢(shì)
(2)描述離散趨勢(shì)
(3)描述位置
(4)標(biāo)準(zhǔn)化變量(z-score)
* 眾數(shù)(mode)
一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù);
* 平均數(shù)(mean)
數(shù)據(jù)求和后除以數(shù)據(jù)個(gè)數(shù)。
* 方差(variance)與標(biāo)準(zhǔn)差(standard deviation)
衡量數(shù)據(jù)與平均值偏離程度平方和的平均值。
* 標(biāo)準(zhǔn)化變量(z-score)
計(jì)算方式是將原始數(shù)據(jù)減去平均數(shù)之后再除以標(biāo)準(zhǔn)差,用它可以展示不同度量單位數(shù)據(jù)的偏離程度。
* 散點(diǎn)圖(scatterplot)
以一個(gè)變量作為橫坐標(biāo)、另一個(gè)變量作為縱坐標(biāo)繪制出的圖形,以散點(diǎn)的形式表現(xiàn)在坐標(biāo)軸中。變量選用單位不同,會(huì)造成圖形有差異。
* 相關(guān)系數(shù)(linear correlation coefficient)
衡量?jī)蓚€(gè)量之間線性關(guān)系的指標(biāo),介于-1和1之間,負(fù)數(shù)代表兩個(gè)變量之間是反向變化的,正數(shù)代表兩個(gè)變量之間是同向變化的,越靠近0代表線性關(guān)系越弱,越靠近-1和1代表線性關(guān)系越強(qiáng)。它只能衡量線性關(guān)系,不能衡量非線性關(guān)系;只反應(yīng)關(guān)系,不代表因果。
* 回歸(regression)
尋找代表變量之間關(guān)系的數(shù)學(xué)表達(dá)式。
* 線性回歸
假定變量之間存在一次函數(shù)的關(guān)系(形如y=kx+b)。此函數(shù)在坐標(biāo)系中圖像是一條直線,因此稱作線性回歸。
* 殘差(residual)
真實(shí)值與估計(jì)值之間的差。
* 殘差圖(residual plot)
以一個(gè)變量作為橫坐標(biāo)、該變量所對(duì)應(yīng)的殘差為縱坐標(biāo)繪制出的圖形。若兩變量之間存在線性關(guān)系,則殘差圖應(yīng)為無(wú)規(guī)則的散點(diǎn)。
* 最小二乘法(least square)
利用殘差平方和最小求出直線斜率與截距(k和b)的方法。
* 線性化(linearity)
將非線性關(guān)系轉(zhuǎn)換為線性關(guān)系的方法,常用有對(duì)數(shù)變換、指數(shù)變換等。
AP統(tǒng)計(jì)學(xué)考試知識(shí)點(diǎn)二、抽樣方法
* 總體(population):
研究對(duì)象的全體。
* 樣本(sample):
總體中的一部分。
* 參數(shù)(parameter):
描述總體特征的指標(biāo),一般用希臘字母表示。
* 統(tǒng)計(jì)量(statistics):
描述樣本特征的指標(biāo),一般用拉丁字母表示。
* 普查(census):
對(duì)總體中的每一個(gè)個(gè)體都進(jìn)行研究。
* 抽樣(sample):
對(duì)總體中的部分個(gè)體進(jìn)行研究。
* 實(shí)驗(yàn)法(experiment):
對(duì)目標(biāo)群體進(jìn)行干預(yù)而得到數(shù)據(jù)。
