統計 stats¶
このセクションでは、さまざまな統計的テストとツールを集めています。モデルとは独立して使用できるものもあれば、モデルとモデル結果の拡張として使用されるものもあります。
API 警告: このカテゴリの関数とオブジェクトはさまざまなモジュールに分散されており、依然として移動される可能性があります。将来的には、統計テストにより、生の数値だけではなく、より有益なレポートを含むクラス インスタンスが返されることが期待されます。
残差診断及び特定化の検定¶
Autocorrelation¶
|
ダービン・ワトソン統計量を計算します。 |
|
残差自己相関のための Breusch-Godfrey のラグランジュ乗数検定。 |
|
残差自己相関のための Ljung-Box 検定。 |
|
ラグランジュ乗数法による自己相関の検定。 |
Heteroscedasticity¶
|
自己回帰条件付き不均一分散性 (ARCH) の Engle 検定。 |
|
不均一分散性のBreusch-Pagan によるラグランジュ乗数検定 |
|
Goldfeld-Quandtの等分散性検定。 |
|
不均一分散性のための White のラグランジュ乗数検定。 |
Kurtosis¶
|
キムとホワイト の4つの尖度尺度を計算します |
|
データが正規分布していると仮定して、キムとホワイト のロバストな尖度尺度の期待値を計算します。 |
Normality¶
|
ジャック–ベラ正規性検定。 |
|
正規性の総括的検定 |
Outliers and Influence¶
|
外れ値を計算し、OLS 結果の影響測定を行うクラス |
|
影響と外れ値の測定 (実験的) |
|
グローバルな影響力と異常値の測定 (実験的) |
|
1 つの外生変数に対する分散膨張係数 VIF |
Skewness¶
|
歪度のロバストな尺度として中央値を計算する。 |
|
キムとホワイト の4つの歪度尺度を計算します |
Stability¶
|
ols 残差に基づいたパラメーターの安定性の Cusum 検定。 |
|
モデル安定性の検定、OLSパラメータでの破れ、(Hansen 1992年) |
|
残差と Cusum 検定統計量を使用して再帰的 OLS を計算します |
Specification test¶
|
ネストされていないモデルの Cox 検定を計算します |
|
ネストされていないモデルを比較するための Davidson-MacKinnon 包含検定 |
|
ネストされていないモデルの J 検定を計算する |
|
White の2-モーメント 特定化の検定 |
|
ハーベイ・コリアーの線形性検定 |
|
代替関数に対する線形性のラグランジュ乗数検定 |
|
線型性に対するRainbow 検定 |
|
無視された非線形性に対する Ramsey の RESET 検定 |
notes on regression diagnostics も参照してください
ロバストなサンドイッチ共分散¶
次の関数は、誤差の不等分散性と自己相関に対して頑健なパラメータ推定値の共分散行列と標準誤差を計算します。これらの方法は、LinearModelResultsで利用可能な方法と同様に、OLSで使用するように設計されています。
|
不均一分散性と自己相関のロバストな共分散行列 (Newey-West) |
|
パネル HAC ロバスト共分散行列 |
|
Driscoll および Kraay のパネルのロバストな共分散行列 |
|
クラスターのロバストな共分散行列 |
2 つのグループ/クラスターのクラスターのロバストな共分散行列 |
|
|
不均一分散ロバスト共分散行列 (White) |
以下は、LinearModelResults に添付される不均一分散性のロバストな標準誤差のスタンドアロン バージョンです
|
statsmodels.RegressionResults を参照してください |
|
statsmodels.RegressionResults を参照してください |
|
statsmodels.RegressionResults を参照してください |
|
statsmodels.RegressionResults を参照してください |
共分散行列から標準偏差を取得します |
適合度の検定と測定¶
一変量分布の適合度の効果に関するいくつかの検定
|
観察されたデータと期待されるデータの間の不一致の尺度として、適合度テストのクラスである検出力の不一致を計算します。 |
|
離散分布のランダムなサンプルに対してカイ二乗検定を実行します |
|
離散分布のカイ二乗型 gof 検定のビンを取得する |
|
カイ二乗適合度検定の効果量 |
|
Anderson-Darling a2 統計量を計算します。 |
|
正規分布の未知の平均と分散に対するアンダーソン・ダーリング検定。 |
|
検定では、Lilliefors 検定を使用して正規分布または指数分布を仮定しました。 |
|
検定では、Lilliefors 検定を使用して正規分布または指数分布を仮定しました。 |
|
検定では、Lilliefors 検定を使用して正規分布または指数分布を仮定しました。 |
|
検定では、Lilliefors 検定を使用して正規分布または指数分布を仮定しました。 |
ノンパラメトリック検定¶
|
McNemar 検定 |
|
(k, k) 平方分割表の対称性の検定 |
|
中央値と位置が等しいかどうかのカイ二乗検定 |
|
カットオフを上回る/下回るバイナリ離散化データに対して検定を実行します |
|
2つのサンプルに対するWald-Wolfowitz ラン検定 |
|
k 回の治療の同一効果に対するコクランの Q 検定 |
|
二値シーケンスに対するラン検定のためのクラス |
|
符号検定 |
|
x1がx2よりも大きな値を持つ確率の統計と検定。 |
|
2つの独立した順序サンプルの確率的により大きな確率。 |
|
ランク比較結果 |
コーエンの d 効果サイズを確率的に大きい確率に変換します。 |
|
|
distr1 が distr2 よりも確率的に大きいことを示す確率。 |
|
2 つの標本の中間ランクを計算する |
記述統計¶
|
データの拡張記述統計 |
|
データの拡張記述統計 |
評価者間の信頼性と合意¶
statsmodels が現在評価者間合意の測定とテストに使用できる主な関数は、コーエン の Kappa です。 フライスの Kappa は現在、測定としてのみ実装されていますが、関連する結果統計はありません。
|
分散と等価ゼロ検定を使用してコーエンのカッパを計算する |
|
フライスとランドルフのカッパ複数評価者合意尺度 |
|
形状のある生データ (被験者、評価者) を (評価者 1、評価者 2) に変換します |
|
shapeが (subject, rater)である生データを (subject, cat_counts)に変換します |
複数の検定と複数の比較手順¶
multipletests はp値補正の機能で、 fdrcorrection のfdrに基づくp値補正も含まれています。 tukeyhsd は(独立した)平均の比較のための同時検定を行います。これら3つの機能が検証されます。GroupsStatsとMultiComparisonは、一元配置ANOVAに似た多重比較のための便利なクラスですが、まだ開発中です
|
複数の検定の検定結果と p 値補正 |
|
誤検出率の pvalue 補正。 |
|
グループ別統計(別バージョン) |
|
多重比較の検定 |
|
追加のプロット方法を使用した テューキー HSD 検定の結果 |
|
テューキーHSD 信頼区間を使用してすべてのペアごとの比較を計算します |
|
Z スコアのリストのローカル FDR 値を計算します。 |
|
真の仮説の数を推定する(反復)2段階線形ステップアップ手順 |
|
null Z スコアのガウス分布を推定します。 |
|
回帰手順で FDR を制御します。 |
FDRコントロールの限界相関効果量。 |
|
ノックオフ分析のための OLS 回帰。 |
|
|
FDRコントロールの前方選択効果の大きさ。 |
ノックオフ分析のための OLS 回帰。 |
|
|
回帰 FDR 分析には任意の回帰モデルを使用します。 |
以下の機能は(まだ)公開されていません
|
すべてのペアのサンプルサイズが等しくない場合の分散の補正係数 |
|
すべての、ペアの分散が等しくなくかつサンプルサイズが等しくないサンプルから、結合分散を返します |
|
サンプルサイズが等しくない場合の分散の補正係数 |
|
分散が等しくなく、サンプルサイズが等しくないサンプルから結合分散を返します |
|
ステップダウンメソッドのクラス |
|
|
配列オブジェクトは、固定サイズの項目の多次元の同種配列を表します。 |
|
|
平均値の単純な順序付けされた逐次比較 |
|
tukeyhsdから委託されたペアワイズ距離行列 |
|
fdrcorrectionで使用される余分のない経験的CDF |
|
テューキーの HSD (Q) の臨界値を返します |
|
すべての val のペアの最小距離を再帰的にチェックします |
|
すべてのゼロ交差を見つけて、最も高いもののインデックスを返します |
|
すべてのゼロ交差を見つけて、最も高いもののインデックスを返します |
|
fdrcorrection を検定するためのモンテカルロ法 |
str(object='') -> str str(bytes_or_buffer[, encoding[, errors]]) -> str |
|
|
等相関多変量正規分布からランダムな抽出を作成する |
|
ランクデータ、scipy.stats.rankdata と同等 |
|
多重検定における棄却の基準ライン |
|
タプルのリストからパーティションを抽出します |
|
別のセットのサブセットであるセットをタプルのリストから削除する |
|
scipy.stats.tiecorrectと同等である必要があります |
基本統計量と頻度加重 t 検定¶
ケースの重みを持つデータの平均、分散、共分散、相関などの基本的な統計に加えて、ここのクラスは平均のための1つおよび2つのサンプ検定を提供します。t検定にはscipy.statsよりも多くのオプションがありますが、配列の形はより制限されています。平均の信頼区間は、t検定と同じ仮定に基づいて提供されます。
さらに、平均の同等性の検定は、1つのサンプルと2つのペアまたは独立したサンプルに対して利用可能です。これらの検定は、平均が互いに「近く」ないという帰無仮説を持つ2つの片側検定であるTOSTに基づいています。
|
ケースの重み付けを使用した記述統計と検定 |
|
2標本比較のためのクラス |
|
t 検定の独立した標本 |
|
2 つの独立した標本 (非) 同等性の検定 |
|
2 つの依存する一対の標本の (非) 同等性の検定 |
|
1 標本または 2 標本に対する正規分布に基づく平均の検定 |
|
正規分布に基づく等価性検定 |
|
正規分布の Z 検定に基づく信頼区間 |
Weightstats には、要約データに基づく検定と信頼区間も含まれています
|
要約統計量に基づく一般的な t-信頼区間 |
|
要約統計量に基づく一般的な t検定 |
|
要約統計量に基づく一般的な正規信頼区間 |
|
要約統計量に基づく一般的な (正規) Z 検定 |
|
要約統計量に基づく一般的な (正規) Z 検定 |
検出力とサンプルサイズの計算¶
power モジュールは現在、t検定、正規基底検定、F検定、および カイ二乗 の適合度検定のための検出力と標本数の計算を実装しています。実装はクラスベースですが、このモジュールは3つのショートカット関数、 tt_solve_power 、 tt_ind_solve_power 、 zt_ind_solve_power も提供しており、累乗方程式のパラメータのいずれかを解くことができます。
|
2 つの独立した標本の t 検定の統計的検出力の計算 |
|
1 つの標本または対応のある標本の t 検定の統計的検出力の計算 |
|
1 つの標本のカイ二乗検定の統計的検出力の計算 |
|
2 つの独立した標本に対する Z 検定の統計的検出力の計算。 |
|
統計的検出力の計算 1 因子平衡分散分析の F 検定 |
|
制約条件の一般的なF検定の統計的検出力の計算 |
|
正規分布検定統計量の検出力を計算する |
|
1 つの裾のみが関連する場合の明示的な標本サイズの計算 |
|
1 標本の t 検定の検出力の任意の 1 つのパラメータを解く |
|
2 標本の t 検定のべき乗の任意の 1 つのパラメータを解く |
|
2 標本の Z 検定のべき乗の任意の 1 つのパラメーターを解決します |
比率¶
NormalIndPowerで使用できる比率については、仮説検定、信頼区間、効果量も利用できます。
|
二項比率の信頼区間 |
|
2 つの比率を比較する検定の効果量 |
|
成功の確率が p である検定を実行します。 |
|
1 つの標本比率に対する二項検定の棄却域 |
|
二項分布を使用した 1 つの比率に対する正確な TOST 検定 |
|
二項TOSTの棄却域 |
|
多項比率の信頼区間。 |
|
正規 (z) 検定に基づく比率の検定 |
|
正規分布に基づく等価性検定 |
|
カイ二乗検定に基づいて比率を検定する |
|
k 個の標本のすべてのペアに対する比率のカイ二乗検定 |
|
対照と比較した k 個の標本のペアの比率のカイ二乗検定 |
|
2 つの比率を比較する検定の効果量 |
|
|
|
正規分布に基づく比例定数検定の検出力 |
|
必要な信頼区間の長さを得るための標本サイズを見つける |
2つの独立した標本の統計ステータス:試験的、APIは変更される可能性あり、0.12で追加
|
2 つの独立した比率を比較するための仮説検定 |
|
2 つの独立した比率を比較するための信頼区間。 |
|
2つの独立した比率が等しいことを証明するztestの検出力 |
|
2つの片側 test_proportions_2 indep に基づく同等性テスト |
|
片側のテイルに基づく正規分布を仮定したときに必要となる標本サイズ |
|
2 つの独立した比率のスコア検定 |
|
スコア検定を反転してスコア信頼区間を計算する |
レート¶
レートの統計関数。これには現在、2つの独立した標本の仮説検定が含まれています。 Poisson Rates の概要についてはノートブックの例も参照してください
ステータス:試験的、APIは 0.12 で変更され、0.14で再設計と強化が施される可能性があります
1 標本に対する統計関数
|
1標本のポアソン率(あるいは平均)の検定 |
|
ポアソン平均またはポアソン率(あるいは平均)の信頼区間 |
|
ポアソン確率変数の分位値の信頼区間 |
|
ポアソン観測の許容範囲 |
2 つの独立した標本の統計関数
|
2 標本のポアソン強度率を比較するための検定。 |
|
2 標本ポアソン率の比率を E 検定します。 |
|
2つの独立したポアソン率の比または差の信頼区間。 |
|
2つの片側 test_proportions_2 indep に基づく同等性テスト |
|
非等価の検定、ポアソンの最小効果。 |
統計的検出力を求める関数
|
2 つの独立したポアソン率の比の検定の検出力。 |
|
2 つの独立したポアソン率の比の等価検出力検定。 |
|
2 つの独立したポアソン率の差に対する ztest の検出力。 |
|
2 つの独立した負の二項率の比の検定の検出力。 |
|
独立した比 2 の等価検出力検定。 |
多変量¶
多変量標本の統計関数。
これには、多変量観察の標本平均に対する仮説検定と信頼区間、および共分散行列の構造に対する仮説検定が含まれます。
ステータス:試験的、API は 0.12 で変更および追加される可能性があります
|
1 標本における多変量平均のホテリング検定 |
|
多変量平均の線形変換の信頼区間 |
|
多変量平均の線形変換の信頼区間 |
|
2 つの独立した表本の多変量平均に対するホテリング検定 |
|
ヌル共分散に等しい共分散に対する1標本仮説検定 |
|
共分散がブロック対角であることの1標本仮説検定。 |
|
共分散行列が対角行列であることの1標本仮説検定。 |
|
共分散行列が等しいことの多重標本仮説検定。 |
|
共分散行列が球面性であることの1標本仮説検定 |
一元配置分散分析¶
k 標本の一元配置解析のための仮説検定、信頼区間および効果量。
ステータス:試験的、API は 0.12 で変更および追加される可能性があります
|
一元配置分散分析 |
|
要約統計量に基づく一元配置分散分析 |
|
一元配置分散分析の等価検定(Wellekの分散分析) |
|
一元配置分散分析の同等性検定(ウェレクおよび拡張) |
|
一方向等価検定の検出力 |
|
一元性等価性検定の経験的検出力 |
|
等しいスケール、分散、またはディスパージョンに対する一元配置分散分析検定 |
|
スケール、分散、またはディスパージョンの等価性に関する一元配置分散分析検定 |
|
F 分布の一元配置分散分析における効果量の信頼区間 |
|
F検定における非心度パラメータの信頼区間 |
|
f ファミリの二乗効果サイズを変換する |
|
一元配置分散分析のコーエンの f = nc / nobs に対応する効果量 |
|
コーエンの f 二乗をウェレックの効果サイズ (sqrt) に変換します |
|
F 統計量を Wellek の効果サイズ eps 2 乗に変換します |
|
Wellek の効果サイズ (sqrt) を Cohen の f 二乗に変換します |
|
F 統計量から分散効果サイズを計算する |
|
Levene タイプ検定の分散比較のためにデータを変換する |
|
一元配置等価性検定の検出力のシミュレーション (Wellek の Anova) |
堅牢でトリミングされた統計¶
固定比率でトリムされた標本の統計。これには、1つの標本統計のクラスTrimmedMeanが含まれます。トリムされた "Yuen" 分散分析の stats.oneway 使用されます。
ステータス:試験的、API は 0.12 で変更および追加される可能性があります
|
トリムおよびウィンザライズドされた1標本統計のクラス |
|
Levene タイプ検定の分散比較のためにデータを変換する |
|
両方のテイルから観測値をトリミングした後、配列の平均を返します。 |
|
配列の両端から一定割合の項目を切り取ります。 |
モーメントヘルパー¶
欠損値がある場合、相関行列または共分散行列が半正定値ではない可能性があります。次の関数を使用して、正定値で元の行列に近い相関行列または共分散行列を見つけることができます。追加の関数では、空間共分散行列と正則化逆共分散または精度行列を推定します。
|
半正定値である近似相関行列を求める |
|
半正定値である最も近い相関行列を見つける。 |
|
与えられた正方行列に最も近い因子構造をもつ相関行列を見つけます。 |
|
データ配列から、しきい値処理された行単位の相関行列を含むスパース行列を構築します。 |
|
最も近い(半)正定値の共分散行列を検索します |
|
k*I + XX' の形式の因子構造行列を使用して、任意の正方行列を近似します。 |
|
因数分解形式での半正定値行列の表現。 |
|
カーネル平均を使用して、多変量共分散関数を推定します。 |
|
ノードごとの回帰を使用して正則化された逆共分散を推定するためのクラス |
これらは、中心モーメントと非中心モーメント、歪度、尖度、キュムラントを変換するためのユーティリティ関数である。
|
非中心モーメントをキュムラントに変換する再帰式はモーメントと同じ数のキュムラントを生成します |
|
中心モーメントを非中心モーメントに変換し、再帰式を使用します。オプションで最初のモーメントを調整して平均値を返します |
|
中心モーメントを平均、分散、歪度、尖度に変換します |
|
非中心モーメントをキュムラントに変換する再帰式はモーメントと同じ数のキュムラントを生成します |
|
非中心モーメントをキュムラントに変換する再帰式はモーメントと同じ数のキュムラントを生成します |
|
中心モーメントを平均、分散、歪度、尖度に変換します |
|
平均、分散、歪度、尖度を中心モーメントに変換 |
|
平均、分散、歪度、尖度を非中心モーメントに変換する |
|
共分散行列を相関行列に変換する |
|
標準偏差を指定して相関行列を共分散行列に変換します |
|
共分散行列から標準偏差を取得します |
メディエーション分析¶
媒介分析は、 'outcome' 、 'treatment' 、そして 'mediator' という3つの主要変数間の関係に焦点を当てます。媒介分析は因果推論の一形態であるため、検証が困難または不可能ないくつかの仮定が含まれています。理想的には、媒介分析は、治療がランダムに割り当てられた今回のような実験の文脈で実施されます。また、治療が「曝露」と考えられる観察データを用いて媒介分析を実施することも一般的です。媒介分析の背後にある仮定は、観察の場で検証することはさらに困難です。
|
媒介分析を実施します。 |
|
メディエーション分析の結果を保持するクラス。 |
オアハカ・ブラインダー分解¶
オアハカ-ブラインダー、またはブラインダー-オアハカと呼ばれる分解は、グループの平均のギャップを説明しようとするものです。2つの与えられた回帰方程式の線形モデルを使用して、回帰係数と既知のデータによって説明されるものと、同じデータを使用して説明されないものを示します。オアハカ-ブラインダー分解には2倍と3倍の2つのタイプがあり、どちらも経済学文献でグループの違いを議論するために使用でき、使用されています。この方法は、識別または観察されない効果を分類するのに役立ちます。この関数は、STATAのoaxacaコマンドの機能をPythonに移植しようとします。
|
オアハカ-ブラインダー分解を実行するクラス。 |
|
このクラスは、OaxacaBlinder モデルの適合を要約します。 |
距離依存¶
距離依存メジャーと距離共分散検定(dCov)
|
距離共分散検定(dCov) |
|
さまざまな距離依存統計量を計算します。 |
|
距離相関。 |
|
距離共分散。 |
距離分散。 |
メタ分析¶
標本統計量のコレクションに対する基本的なメタ分析のための関数。
例はノートブックにあります
ステータス:試験的、API は 0.12 で変更および追加される可能性があります
|
メタ分析を使用して効果サイズと効果サイズを組み合わせる |
|
2 つのサンプル二項比率の効果サイズ |
|
メタ分析で使用するための平均差の効果サイズ |
|
平均値または効果サイズを組み合わせた推定値からの結果 |
このモジュールには、変量効果の分散を計算する内部関数も含まれています。
|
ランダム効果間の分散モーメント推定の反復法 |
|
ランダム効果間の分散のポール・マンデル反復推定 |
|
変量効果間の分散のモーメント推定のワンステップ法 |