ブラックベルトの資料室
HomeBlog Link Information E-mail、連絡
データを分析する
そのデータに有意性はあるか?検定の必要性

 データの分析・・・多くの場合、「改善前」「改善後(改善途中)」のデータ群を比較する(=平均値が上がったのか、下がったのか)ことだと思います。その分析には大きな流れがあり:
  1. 正規分布かどうか検定する。
  2. バラツキがどうかF検定を行なう。
  3. 平均値の検定をt検定で行なう。
で、1で正規分布であれば2へ、2の結果を元に3の検定を行ないます。
それでは以下に、エクセルでの手順を示します。
例で使用したデータは本ページの一番下にダウンロード可能な状態で置いておきます。





Back



正規性検定-> F検定-> t検定

この流れは結構多い分析の流れである。分析はエクセルで!


1.正規分布かどうか検定する。

まず、前提として、この例は「改善前」「改善後」の2群のデータの平均値を比較し、それが有意であるか(有意水準5%において)を確かめるものです。

”正規分布”は確率分布の一つで、最も一般的な分布です(確率分布の説明はこちら)。
あるデータが正規分布であるか否かの検定は:

-----*-----*-----*-----
①エクセルでもできるのは、以下のサイトの”エクセル用のマクロプログラム”からダウンロード可能です。→ http://www.swetake.com/
② 統計解析ソフトMinitabでの検定はこちら

③ 統計解析ソフトJUSE-StatWorksでの検定はこちら
-----*-----*-----*-----


*検定ではP値を指標にしますが、最初はメンバーは戸惑います。なので、「P値が0.05より小さければ有意」と覚えておきましょう(=正式には、“有意水準5%において有意”といいます)、とすると、経験的にはメンバーの各種検定使用度が高まります。

*実際、正規分布でない場合は結構あります。そのような時は、今回の様な分析目的の場合、「中央値検定」などで行なえます。経験的には、取得したデータの母体のプロセスが「正規分布でない」場合、何らかのわかりやすい欠陥を抱えていることがほとんどなので、まずその理由を明らかにしましょう(正規分布であることが”正しい”わけではなく、そうでない場合もあります=シックスシグマでは正規分布であることが”正しい”という嫌いがあるので一応・・・)。

画面トップへ戻る




2.バラツキがどうかF検定を行なう。

これは、分布のバラツキに比較するデータ群で差があるか検定するものです。エクセルで実際に行ないます。

まず、[ツール]→[分析ツール]で下の画面を呼び出します。
*[分析ツール]がない場合は、[ツール]→[アドイン]から入れることができます。

F検定1

図のように”F検定”を選択しOK。
すると、下の画面になり、赤の□の部分を選択(もしくは入力)します。
入力範囲は、このページ下の添付ファイルに沿っていますので、ご参照ください。

F検定2


すると、分析が終了し、以下の画面がシートに記載されています。
F検定3

データ群、それぞれの平均値、分散などの統計量と、赤の□で囲んだP-値が計算されています。
P-値の考え方は、仮に今の検定の有意水準を5%であると考えるとするならば*、P-値は0.05以下で有意と言えます(帰無仮説を棄却)。

この場合、P=0.138>0.05なので有意差はありません。すなわち、「有意水準5%において2群のデータのバラツキに差はない」と考えます。

*5%は一般的でデフォルトとなっている統計ソフトも多いです。ですが、これは検定する内容により異なり、実験の結果などは10%、アンケート、インタビューの場合1%などその分野により異なります。



画面トップへ戻る



3.平均値の検定をt検定で行なう。


次に、F検定と同様に、[ツール]→[分析ツール]で以下の画面を呼び出します。

t検定1

先ほどのF検定において、2のデータ群には、バラツキに有意差が見られない分析結果だったので、上では、「等分散を仮定した・・・」を選択します。

すると、先ほどと同様に、分析するデータの入力範囲などを設定する画面が呼び出されますので、必要事項を選択(もしくは入力)します。

t検定2

”OK”をクリックすると、以下のように分析結果が示されます。

t検定3

P-値が0.158であり、有意水準5%では、有意性があるとはいえません。

従って、(ファイルのデータ**)この改善効果に有意水準5%において有意差はありません。

**ファイルのデータは、「改善前」「改善後」の2群(標本)を準備していますが、改善後の平均値は、改善前にくらべて5%大きく設定しています。


最後に・・・

ここで学んだ検定では、結局は分析の内容をプレゼンテーションするわけではありませんが、プレゼンテーションでは:

「有意水準○○%において有意である(もしくは有意でない)。」

と言えば、全く問題ありませんし、配布資料においても、この記載は非常に有効です。

この分析のエクセルファイルはこちらです(ZIP)。

Back


[総合目次 | 資料室TOP]






画面トップへ戻る
ブラックベルト資料室のコンテンツ

コンテンツの詳細
ブラックベルトの資料室トップへ
アクセストップ5




関連書籍









シックスシグマ
経営手法の一つ。シックスシグマのシグマは統計学上のσ(標準偏差)であり、6σ(シックスシグマ)とは、バラツキが極めて小さく、製品・サービスの欠陥の発生確率が3.4/100万回であることを意味し、問題解決論のフェーズによりプロジェクトを遂行する。

DMAIC
シックスシグマのプロセス―定義(Define)、測定(Measure)、分析(Analyze)、改善(Improve)及び管理(Control)―のそれぞれ頭文字をとり、DMAICモデルと呼ぶ。

COPQ
シックスシグマのプロジェクトを運営していく上で財務上の指標となるのは、COPQ(=Cost of Poor Quality)と呼ばれる欠陥により発生するコストの総称である。
[COPQ]

P値、p-value
仮説検定において、帰無仮説を棄却するかどうかを判断する指標。p-値の基準値を0.05としたとき(=有意水準5%)、たとえば、ある検定統計量の計算されたp-値が0.05より小さい場合は、帰無仮説を棄却する(=有意水準5%にいおいて有意である)。
(記載は統計ソフトMinitabのヘルプを参考にしています。)
[Minitab]はこちら。

正規性検定
データが正規分布に従うかどうかの検定。正規確率プロットが作成され、観測値が正規分布に従うかどうかを調べる正規性の検定が行われる。
データが正規分布に従うかどうかの検定。正規分布であれば、データ処理が容易になるが、正規分布に従わないデータは多い。

F検定
データとデータのバラツキに差があるかどうかの仮説検定で、2つの分散の比を検査してその同等性を決定する。
バラツキに有意性がなければ、平均値の検定が行ないやすい。

t検定
独立な2サンプルの平均値に有意性があるかどうかの際に行われる検定。複数のサンプルの場合は、ANOVA(分散分析や等分散性の検定)が好適。

確率変数
多くの現象は、正規分布、一様分布、三角分布などの確率変数で示すことが出来る。製造分野では、ワイブル分布が有名で実用的である。
これを把握することにより、予測、推測が可能になり、その特徴を知ることは製造分野に限らず、重要視されている。
[確率変数]



[他の用語はこちら]










Designed by…
本サイトで使用している素材は種々のサイトの素材を利用しています。
利用したサイトは、トップページの右下に記載していますので、ご参考ください。
ブラックベルトの資料室トップへ





E-mailはこちら *お問い合せはこちらからお願いします。返信は気長にお待ちください。

Home | Blog | Contents | Information | E-mail
Copyright (C) i-Library MOT テキスト製作委員会 since 2008.