* 統計分析レポート

  統計は社会活動によって得られた成果の全体を適切に把握することをとおして、将来に向けての有効な戦略的支援を提供するものです。またあたかも精密部品のように正確に機能する関数を統計的手法を用いて開発し、現場の各種工程に応用することもできます。活動の一端を紹介してまいりますので、ご意見、ご希望はメールでお送りください。

重回帰分析

  工業分野における1、2変数回帰方程式や、経済分野におけるダミー変数を使った回帰方程式が活躍
<例: 空気の比エンタルピー計算>
  気温30℃、湿度60%の空気1d[DA]を冷却して 25℃ 50%にするには、21[MJ] の熱量を処理することが必要ですが、このような計算をパソコンで行うには、計算上空気の飽和湿度を、気温を変数とする 5次式程度の関数に近似する必要があります。この近似関数は回帰分析で求めることができます。

トップページ

正準相関分析

  2組の多変量資料間での相関関係をみる
<例: 指数関数 exp[x] の部分和>
  exp[x]のテイラー展開は7次式程度でかなり良い近似値を与えるが、これを材料に使った正準相関分析の1例です。7次展開式を 0〜2次および 3〜7次の二つの部分和に分けて第1グループの二つの変量とします。つぎに、7次展開式を 0〜1次および 2〜7次の二つの部分和に分けて第2グループの二変量とします。さて100個の乱数(0 < x <1)を変数とする指数関数を準備して、変数ごとに今言った 4とおりの部分和を計算し、一組2系列で二組 4系列の標本を作ります。二つのグループに正準相関分析を行うと、正準構造係数はどのような値になるでしょうか。結果は予想どおり、4つとも1に近い値となります。すなわち合算することで 2つのグループの相関係数が 1となることが示されます。

トップページ

主成分分析

  多変量資料の全体をよく説明する代表的な二つの主成分を見つける
<例: 国民栄養調査におけるビタミン摂取量の変動>
  ビタミンB1、B2、C の摂取量について 1995年から 2005年までの間に10回行われた調査結果をグラフで見ます。3種類の栄養素についてでありますが、二つのトレンドに集約されそうですのでこの点を主成分分析で確認してみましょう。
  3種のビタミン摂取量についての相関行列をつくると、行列の固有値が 2.3、0.6、0.05 となり、上位二つ合わせて 98%の寄与率となって、2つのトレンドに集約できることを裏付けています。第1主成分は3つの変量をほぼ均等に反映した構造を持ち、第2主成分は3つの変量のうちビタミンB2を集中的に反映した構造となっていて独自の変動を示す軌跡となっています。実は二つの主成分は互いに直交し、無相関となります。

トップページ

判別分析

  多数のデータを二つに区分け・分割する関係式の導入
<例: 重なりのある二つの正規分布標本の分割>
  2変数正規分布の一つが周辺分布 X=N(0,1), Y=N(0,2) で与えられ、二つめの 2変数正規分布が 周辺分布 X=N(3,1), Y=N(3,2) で与えられるとき、この二つの正規母集団からの標本に判別直線を引いてみよう。
  100個ずつの正規分布乱数を割り当て二つの正規母集団から作られた標本を準備し、この標本の判別直線を計算すると Z = X + 0.2Y で、判別率 87%であった。標本を作り変えてリトライした結果では判別率 90%となった。

トップページ

管理図

  生産工程の安定な推移を管理する目的達成のため、逐次検定の導入。
<例: 比率の検定>
  パソコンで 1から 9までの乱数を発生させ、そのうちに含まれる奇数の母比率を検定することをやってみます。
  サンプルデータとして300個の乱数を発生させ、試行回数と併せて奇数の発生度数を集計しグラフにします。次に、値 0.60、0.56、0.46 の中から検定仮説と対立仮説を選び、グラフの上に仮説に基づく判定直線を重ねて表示します。検定の有意水準 5%、第2種の誤り10%の確率で判定を行うと、仮説p=0.56 が明らかに優勢であることがグラフから読み取れます。さらに新たに仮説を追加して優勢な値の範囲を絞り込むには、試行回数を続ければよいのです。
<例:  2変量管理>
  パソコンから乱数を抽出し、相関係数 0.8の2変量正規分布 N(3,3,1,1;0.8) の標本(個数=50)を作ります。その2変量標本を管理するため、マハラノビスの距離を、いま仮に分布の限界確率 5%に対応するようにして得られた値とします。標本値と比較をして、1標本分布に含まれる管理値を超える正規乱数の個数を数えます。次々と新しい標本分布について繰り返していくと、その個数は毎回ほぼ0〜3個、稀に4個実現することが示されます。
  母集団が正規分布に従わない例であっても、互いに相関のある2変量母集団の重心と標本の隔たりの距離の大きさを効果的に示すことができます。

トップページ

分布母数の推定

  管理区分の単位としての、1つの母集団分布の母数を標本から推定
<例:  母平均の推定>
  パソコンから50個の正規分布 N(1,4)乱数の標本を取出し、この標本を出発点として母平均と母分散を推定してみよう。与えられた標本の標本平均と標本分散はそれぞれ 0.523、4.765 であった。50個の標本値を5段階に級分けすると次の表が得られた。

度数分布表
級下限〜級上限度数期待度数χ2乗
-0.42 〜 -1.40 10 8.698 0.1948
-1.40 〜 0.00 12 10.81 0.1312
0.00 〜 1.40 10 12.54 0.5137
1.40 〜 2.80 10 9.773 0.0053
2.80 〜 5.60 8 6.919 0.1688
50 1.0138

  上表中の「期待度数」は母集団が正規分布であるとき各階級に分布する実測度数の期待値で、実測度数との差の2乗をさらに期待度数で割るとχ2乗の値になります。χ2乗値の総和は正規分布との隔たりの大きさを示しますから、一定の範囲に収まればこの標本が正規母集団からの標本であるといえます。危険率5%で限界範囲を計算すると、Σχ2乗<5.99 となります。表に示された値はこの範囲内にあることがわかります。
  正規母集団からの標本として標本平均と標本分散を計算し、母平均と母分散を危険率5%で区間推定すると、真の母数の推定範囲は
  母平均: -0.1 < μ < 1.143
  母分散: 3.32 < σ2 < 7.4
となり、真の母数がこの範囲外である確率は5%です。事実 N(1,4)の母数がこの範囲内にあることがわかります。

トップページ

固有値の計算の手順

実対称行列が与えられている場合は、ヤコビ法など幾つか便利な手法があり、それぞれの特長を活かして利用することができるが、ここではより基本的な方法の概略を示してみます。与えられた行列 A の固有値と固有ベクトルを計算した結果は、行列 B の対角線上に固有値が並び、対応する固有ベクトルが行列 P の列として並びます。

行列 A
23-1-2
2 1 -2 0
3 3 -2 -2
2 2 -2 -1
固有ベクトル行列 P
1101
0 1 1 0
1 1 1 1
0 1 1 1
ジョルダン行列 B
1100
0 1 0 0
0 0 -1 0
0 0 0 -1


手順
(1) 行列 A の特性多項式を求める。
行列 Aに対して Frame の方法を用いて計算すると、4次多項式 det(xI-A)=x^4-2x^2+1 のように、その係数を求めることができる。
(2) 特性多項式の根を求める。
固有値の絶対値は行列 A のスペクトル半径より大きくないから、スペクトル半径の大きさの範囲がわかると都合が良い。行列 A を4乗した後、その要素の平方和の平方根のさらに4乗根を計算すると1.7・・であり、スペクトル半径は2より小さい。よって、-2< 特性多項式の根 <2 である。Aの逆行列のスペクトル半径を同じ方法で計算すると、2より小さい。従って行列 A の固有値の絶対値は 1/2 より大きい。ゆえに特性多項式の根は、(-2、-1/2)または(1/2、2)であることがわかる。
(x-10)をダミーとして、F(x)=(x^4-2x^2+1)(x-10) に対して割線法を用いると、 F(x)=0 の根としては、1 と-1 が推定される。さらに組立除法を適用すると推定値が根であるかどうかを確認でき、また残りの根が、x^2-1=0 の解であることもわかる。続けて処理すると結局すべての根が 1、1、-1、-1 となり、特性多項式が、(x-1)(x-1)(x+1)(x+1)であることが知られる。
(3) 最小多項式を求める。
多項式の xに行列 Aを代入し、因数の部分積が零行列となるもののうち、(A+I)(A-I)(A-I)=0 が最小次数のものとなるから、最小多項式は、(x+1)(x-1)^2 であり ジョルダン細胞は J(-1,1) および J(1,2)となる。
(4)ジョルダン細胞の個数を求める。
行列 (A+I) と (A-I) に行列の基本変形を行うと、それぞれの階数は 2 と 3 である。従って、ジョルダン細胞 J(-1,1)は 4-2=2個、J(1,2)は 4-3=1個となる。
(5)固有ベクトルを求める。
x=Ker(A+I) は斉次連立方程式 (A+I)x=0, x≠0 の解として 固有ベクトル(0,1,1,1) と 固有ベクトル(1,0,1,1)。
x=Ker(A-I)^2 は斉次連立方程式 (A-I)^2・x=0, x≠0 の解として 固有ベクトル(1,0,1,0) と ジョルダン基底(1,1,1,1) の4つの線型独立なベクトルが得られ,これらを列ベクトルとして行列 B をつくる。(A-I)・x=0 とならないから (1,1,1,1) は固有ベクトルではない。行列 A の要素次第で、ときに (A-λI)^k が k次のベキ零となる場合は、基本ベクトルを基底xのひとつに取り、(A-λI)^(k-1)・x≠0 を固有ベクトルとすることができる。
(6) ジョルダン行列に変換する。
行列 Aに相似変換 B=(invP)AP を行うとジョルダン行列に なる。( (invP)はPの逆行列 )

トップページ

2項分布標本の作り方

確率p のベルヌーイ試行を n回行い、成功数がx以下となる累積確率をP(x)とする。累積確率P(x)を与えて、これに見合う最小成功数を計算するには、エクセル関数CRITBINOM ()を用いて ”=CRITBINOM (n,p,P(x))”とする。さて 2項分布標本は、ベルヌーイ試行(ここでは n=10、成功確率 p= 0.4、0.5、0.6)と標本の件数(ここでは19件)を決めてから次の手順で作る。
  (1) 0<P(x)<1 から一様分布乱数を目標の標本数だけ抽出したところ、たまたま次のような乱数を得た。
      P(x) = 0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40、0.45、0.50、0.55、0.60、0.65、0.70、0.75、0.80、0.85、0.90、0.95  (19個の乱数)
  (2) P(x)の一つ一つを ”=CRITBINOM(10,p,P(x))”に代入すると、対応する成功回数xが次のとおり出現する。
      p=0.5のとき x= 2、2、2、3、3、3、3、4、4、4、4、4、5、5、5、5、6、6、7
      p=0.4のとき x= 2、3、3、4、4、4、4、5、5、5、5、5、6、6、6、6、7、7、8
      p=0.6のとき x= 3、4、4、5、5、5、5、6、6、6、6、6、7、7、7、7、8、8、8
  (3) まとめると、成功回数xの2項分布は次のとおり。
      p=0.4 のとき x = 2 → 3件、 x = 3 → 4件、 x = 4 → 5件、 x = 5 → 4件、 x = 6 → 2件、 x = 7 → 1件  (計19件)
      p=0.5 のとき x = 2 → 1件、 x = 3 → 2件、 x = 4 → 4件、 x = 5 → 5件、 x = 6 → 4件、 x = 7 → 2件、 x = 8 → 1件  (計19件)
      p=0.6 のとき x = 2 → 0件、 x = 3 → 1件、 x = 4 → 2件、 x = 5 → 4件、 x = 6 → 5件、 x = 7 → 4件、 x = 8 → 3件  (計19件)

トップページ

正規相関標本の作り方

密度関数を  f(x,y) = [1/2/π/σx/σy/(1-ρ2)1/2] exp[-1/2/(1-ρ2) { ((x-μx)/σx)2 - 2ρ((x-μx)/σx)((y-μy)/σy) + ((y-μy)/σy)2 } ]
とすると、x の周辺分布は   g(x) =-∞+∞ f(x,y)dy = 1/σx/(2π)1/2 exp[-1/2 { (x-μx)/σx }]
yの条件付き分布は   f(y|x) = f(x,y)/g(x) = [1/(2π)1/2/σy/(1-ρ2)1/2 ] exp[-1/2/(1-ρ2)/σy2 { y-μy-ρσy/σx (x-μx) }2 ]
よって y の条件付き分布の平均値と分散は   μ(y|x) = μy + ρσy/σx (x-μx), σ2(y|x) = (1-ρ2)σy2
<手順>
@ エクセル関数 "=NORMINV ( 確率F(x)、平均μx、標準偏差σx )" を用いると xi (i =1,2,・・・,n) は正規分布乱数となる。( ただし F(x)=RAND(系列1) )
A エクセル関数 "=NORMINV ( 確率F(y)、平均 μy+ρσy/σx (xi-μx)、標準偏差 (1-ρ2)1/2 σy) " を用いると yi (i =1,2,・・・,n) は正規分布乱数となる。( ただし F(y)=RAND(系列2))
B ( xi, yi ) は、正規相関標本である。
<例> μx =10, σx2 =102, μy =5, σy2 =102, ρ=0.5 を選ぶと
  xi = 6.72, 5.61, 10.9, 5.64, 8.25, 13.9, 11.2, 8.70, 12.4, 11.5, 6.69, 4.48, 12.6, 7.32, 9.11, 4.02, 7.90, 9.50, 5.88, 11.5, 10.4, 4.60, 7.05, 10.1, 6.77, 13.3, 10.5, 9.15, 6.17, 11.9
  yi = 5.45, 1.45, 4.92, 3.08, 3.35, 7.69, 5.95, 5.19, 9.73, 5.77, 2.69, 4.18, 9.07, 1.63, 9.15, 1.68, 3.67, 8.62, 2.34, 4.30, 2.82, 0.70, 2.83, 5.90, 7.15, 8.06, 6.37, 3.81, 3.10, 5.59
は、正規相関の標本である。

トップページ