サンドボックス¶

このサンドボックスには、さまざまな理由で statsmodels 自体に含める準備ができていないコードが含まれています。これには、テスト、検証されておらず、新しい statsmodels 構造に更新されていない古い stats.models コードのモジュールが含まれています: cox 生存モデル、反復測定による混合効果モデル、一般化された加算モデル、数式フレームワーク。サンドボックスには、統計モデルのパターンに適合するか、十分にテストされるまで現在作業中のコードも含まれています。

すべてのサンドボックスモジュールは、統計モデルのコアの一部ではないことを示すために明示的にインポートする必要があります。サンドボックスコードの品質とテストは大きく異なります。

例¶

sandbox.examples フォルダーにはいくつかの例があります。追加のサンプルは、モジュールおよびサンドボックスのサブフォルダーに直接含まれています。

モジュールリファレンス¶

時系列分析 `tsa`¶

このパートでは、時系列分析に役立つモデルと関数を展開します。ほとんどのモデルと関数は statsmodels.tsa に移動されました。

移動ウィンドウ統計量¶

ローリング平均、モーメント(4次まで)、最小、最大、平均、分散など、ほとんどの移動ウィンドウ統計量は、Pandasのウィンドウ操作の関数でカバーされています。

`movstat.movorder`(x[, order, windsize, lag])	移動オーダー統計量
`movstat.movmean`(x[, windowsize, lag])	移動ウィンドウ平均
`movstat.movvar`(x[, windowsize, lag])	移動ウィンドウ分散
`movstat.movmoment`(x, k[, windowsize, lag])	非中心モーメント

回帰と分散分析¶

以下の2つの ANOVA 関数は、バランスのとれた一元配置 ANOVA の NIST テストデータに対して完全にテストされています。 anova_oneway は scipy.stats の一元配置 ANOVA 関数と同じパターンに従いますが、スケールの悪い問題に対してはより高い精度になります。 anova_ols は、OLSモデルクラスを使用して一元配置 ANOVA と同じ結果を生成します。また、 NIST テストに対しても検証しますが、スケールが最悪の場合にはいくつかの問題があります。これは、statsmodels を使用して簡単な ANOVA を行う方法を 3 行で示しており、レシピとしても最適です。

`anova_oneway`(y, x[, seq])
`anova_ols`(y, x)

以下は、ダミー変数を操作し、OLS で ANOVA 結果を生成するためのヘルパー関数です。これらは特定の用途を念頭に置いて書かれているため、レシピとして考えるのが最適です。これらの関数は、最終的には書き換えられるか、再編成されるでしょう。

`try_ols_anova.data2dummy`(x[, returnall])	カテゴリの配列をデフォルトでダミー変数に変換します。最後のカテゴリのダミー変数を削除します。ravel、1d のみを使用します
`try_ols_anova.data2groupcont`(x1, x2)	ダミーの連続変数を作成する
`try_ols_anova.data2proddummy`(x)	2次元配列の2列から積ダミー変数を作成します
`try_ols_anova.dropname`(ss, li)	文字列のリストから名前をドロップします。ドロップする名前はスペースで区切られたリスト内にあり、元のリストは変更されません
`try_ols_anova.form2design`(ss, data)	文字列式をデータ辞書に変換する

以下は、グループがラベル配列によって定義されるグループ統計用のヘルパー関数です。前のグループの修飾コメントは、このグループの関数にも適用されます。

`try_catdata.cat2dummy`(y[, nonseq])
`try_catdata.convertlabels`(ys[, indices])	複数の変数または文字列ラベルに基づくラベルを一意のインデックスラベル 0,1,2,...,nk-1 に変換します。ここで、nk は個別のラベルの数です
`try_catdata.groupsstats_1d`(y, x, labelsunique)	ndimage を使用して平均と分散を高速に取得します
`try_catdata.groupsstats_dummy`(y, x[, nonseq])
`try_catdata.groupstatsbin`(factors, values)	np.bincount を使用し、因子/ラベルが整数であると仮定します
`try_catdata.labelmeanfilter`(y, x)
`try_catdata.labelmeanfilter_nd`(y, x)
`try_catdata.labelmeanfilter_str`(ys, x)

これらの関数に加えて、サンドボックス回帰には、statsmodel の回帰モデルの使用例を示すいくつかの例が含まれています。

回帰方程式系と連立方程式¶

以下は連立方程式モデルをフィッティングするためのものです。返されたパラメーターは正確であることが確認されていますが、このコードはまだ非常に実験的なものであり、モデルの使用法はメインのコードベースに追加される前に大幅に変更される可能性が非常に高くなります。

`SUR`(sys[, sigma, dfk])	一見無関係に見える回帰
`Sem2SLS`(sys[, indep_endog, instruments])	連立方程式の 2 段階最小二乗法

その他¶

記述統計の出力¶

`descstats.sign_test`(samp[, mu0])	兆候テスト
`descstats.descstats`(data[, cols, axis])	1 つまたは複数の変数の記述統計を出力します。

オリジナルの stats.models¶

これらはどれも完全に機能していません。数式フレームワークは cox と混合で使用されます。

EM アルゴリズムを使用した反復測定による混合効果モデル

statsmodels.sandbox.mixed

コックス比例ハザードモデル

statsmodels.sandbox.cox

一般化された加算モデル

statsmodels.sandbox.gam

式

statsmodels.sandbox.formula

最終更新日: 2025年01月28日