[[20030714232700]] 『統計について』(さくら) ページの最後に飛ぶ

[ 初めての方へ | 一覧(最新更新順) | 全文検索 | 過去ログ ]

 

『統計について』(さくら)

すみません。ほんとにど素人で申し訳ないんですか、どうか教えてやってください。
A(10人)、B(15人)グループがあって、それぞれ開始時間が入っています。Aグループは何もせず、Bグループは、実験をしてその開始時間は短縮されるという仮設を立てました。それぞれの平均は出たのですが、検定をかけなくてはいけません。エクセルを使用したいのですが、その場合、どの関数を使ったらよいのでしょうか?10:00というような入力で計算はできるのでしょうか?順位をつけて検定をかけたほうがよいでしょうか?どうかよろしくお願いします。

	A	B
	10:00	10:30
	11:10	10:00
	10:30	10:20
	11:32	10:00
	10:20	10:00
	つづく	つづく
平均	10:50	10:20

というような表です。


 1)入力方法:
  「10:45」と「11:17」の平均(=Average(セル範囲)を入力)を計算してみてください。
  これが「11:01」と出ればOKです。ちゃんと「時間:分」として計算できています。

 2)検定:
  どのような検定をしたいのでしょうか?
  分散は既知ですか?
  分散は未知だけれども等分散とみなせますか?
   :

 エクセルの分析ツールでは、t検定や、z検定などができます。
 使うには分析ツールアドインをインストールする必要があります。
 順位をつけて検定…の方法は私には分かりません。m(__)m
 Excelのヘルプにも、統計について多少説明が載っていますよ。
 (ちゅうねん)


ありがとうございます。平均はちゃんとできてるようですが、それを証明するのに検定をしなければならないけど、どの検定を使うのがいいのかわからないというくらいのレベルです。
統計学のホームページをみましたが、
難しく、エクセルの検定を試しにしてみましたが、結果を出せてもその方法が正しいのか、結果はどういう意味なのかなどがわかりません。
そんなレベルなのに質問して済みませんでした。(さくら)


 さくらさんが言いたいのは、端的に言うと、
 2つのサンプル集団A,Bについて、平均値を計算すると10:50と10:20となった。
 統計学的に平均値に差があるといえるか?
 だと思います。

 しかし、検定をするには「分散」(ばらつき具合を示すもの)が必要になります。
 これが既知なのか、未知なのか、A,Bで同じといえるのかどうかで、検定の式が
 異なります。

 例えば、一定長さのものを作る機械を考えた場合、センサーの位置を変更して
 長さを微調整したとき、ホントに平均値が前回と変わったか?と考えるときには、
 分散は変化していないと考えて良いでしょう。また、過去のたくさんのデータから、
 ばらつき具合(母分散)が既に分かっているなら、最も単純(精度が高めやすい)に
 なります。

 一方、機械を大がかりに変更して、前回と平均値が変わったか?と論じる場合は
 分散も変化してしまうでしょうから複雑(精度が高めにくい)になります。

 分散が既知か、同一といえるかなどは、測定した値だけを見ても分かりません。
 どういった条件でデータを採取したか、などある種「思想」が必要です。

 私の手元の資料には、2つの母平均の差の検定について、
 ・2つの集団の分散が既知→u検定(エクセルで言うZ検定のことと思う)
 ・2つの集団の分散が未知だが、互いの分散は等しいと言える→t検定
 ・2つの集団の分散が未知で、互いの分散が異なる→Welchの検定
 というのがありました。

 まずは、どのような検定が必要かを考えて下さい。
 検定方法が決まったら、その次にエクセルで計算するにはどうしたらよいかを考えましょう。
 (ちゅうねん)


	A	B
10:00	0	6
10:10	1	0
10:20	0	0
10:30	5	4
10:40	0	1
10:50	3	2
11:00	1	1

度数分布表にしてみました。数値は人数です。ある操作をしてBは時間が早くなりましたと証明したいです。
この場合、何検定が必要なのでしょう。そして方法を教えてくださいませ。
よろしくお願いします。(さくら)


 データ数が少ないような気がします(平均に違いがあると言い切りにくい)が、
 ひとまず、エクセルでの計算方法を書きます。
 以下は、Excel2002(OfficeXP)の場合の例です。他のバージョンの時は多少表記が
 違うかもしれません。

 まず、検定には度数分布表にしていないデータを使いましょう。
 ここでは、データが以下のようであるとします
 	  A	  B
  1	10:15	10:01
  2	10:31	10:02
  3	10:33	10:04
  4	10:35	10:06
  5	10:37	10:08
  6	10:39	10:09
  7	10:52	10:32
  8	10:55	10:34
  9	10:57	10:36
 10	11:05	10:38
 11		10:45
 12		10:53
 13		10:57
 14		11:05

 1)[ツール] メニューの [分析ツール] をクリックします。
  ([分析ツール] が表示されない場合は、アドインで組み込んで下さい)
 2)[データ分析] ダイアログ ボックスの下の方に、「t検定:」がありますので
  これを選択します。以前にも書きましたが、等分散が仮定できるかどうかで
  使う式が異なります。以下のどちらかになるでしょう。
    t 検定 : 等分散を仮定した 2 標本による検定
    t 検定 : 分散が等しくないと仮定した 2 標本による検定
 3)どちらの場合も、
  [変数 1 の入力範囲] ボックスには $A$1:$A$10 を、
  [変数 2 の入力範囲] ボックスには $B$1:$B$14 を、
  [仮説平均との差異] ボックスには 0 (ゼロ)を、
  [ラベル] チェック ボックスはチェックなしに、
  [α] ボックスには有意水準(例えば0.05とか0.10など)を入れてOKを押します。
 4)統計量が表になってシートに埋め込まれます。
  この表は計算式になっていないので、データ修正など再計算が必要になったら、
  再度上記1)から実行します。
 5)表で、平均、分散は分かりますよね?
  観測数はデータ数で、自由度は(たいていの場合)データ数の合計-2になります。
  tがデータから求められた値です。この値が「t境界値 片側」あるいは
  「t境界値 両側」(どちらを使うかは、測定データの性質によります)よりも
  大きければ、統計学的には
  『有意水準(危険率)αで、平均に差があるといえる』ことになります。

 有意水準(危険率とも言う)は、小さい方が結論の確実性が高いですが、
 『平均に差がある』という結論に達しづらくなります。
 なお、『平均に差があるといえる』という結論に達しなかった場合は統計学的に
 平均が同じであると言える…訳ではありません。
 データ数を増やすと『差があるといえる』かもしれません。
 頑張って下さい。
 (ちゅうねん)


ちゅうねんさんありがとうございました。
とりあえず、
t-検定 : 分散が等しくないと仮定した2標本による検定

	変数 1	変数 2	
平均	0.444878472	0.435378086	
分散	0.000231281	0.000269691	
観測数	16	18	
仮説平均との差異	0		
自由度	32		
t 	1.751007147		
P(T<=t) 片側	0.044763386		
t 境界値 片側	1.693888407		
P(T<=t) 両側	0.089526772		
t 境界値 両側	2.036931619		

このような結果になったのですが、
片側だけでも大きければ、差があるといえますか?
有意水準が0.1だと両側も大きくでるのですけど。微妙なとこなんでしょうか?(さくら)


 片側で検定すべきか両側で検定すべきかは、どのような思想で検定するかによります。
 数字だけを見て、これでよいかと聞かれても困る問題です。
 また、危険率が5%(=0.05)で検定すべきか10%で検定すべきかも、同じです。
 ただ平均値には差がありそうです。ホントはもう少しデータ数が欲しいところです。

 危険率とは、ホントは差がないのに「差があるといえる」と間違った結論づけをして
 しまう率をどこまで許容するかという数字です。
 逆に言うと、危険率10%での検定では「差があるといえる」という結論づけに90%以上の
 信頼性があるということになります。

 どれだけの信頼性を必要とするかについては、さくらさんご自身で決める必要が
 あります。
 (ちゅうねん)


色々ありがとうござました。あまり考えなしでしてるもんで、思想とかないんですよね。お恥ずかしいです。すみませんでした。(さくら)


 謝る必要はないです。こちらこそ、横柄な回答のようですみませんでした。
 統計学的には、「以前とは差があるか」という検定で「差がある」と言うためには 両側検定
 をします。「以前とは増えているか」とか、「以前とは減少しているか」という検定では、
 片側検定をします。今回の場合どちらを使うべきかは、さくらさんが判断してください。

 危険率は、業界で一般に使われる率があるようです。
 個人的には5%であれば完璧、10%であれば充分とも思いますが、人命にかかわる重大事なら
 1%や、これより小さい危険率で判断することもあるようです。
 周囲の人に聞いたり、過去の事例を探したりしてみてください。
 (ちゅうねん)


いえいえ、わからない私に詳しく教えていただいて助かりました。
命にかかわることではないので片側検定でごまかそうと思います。(・・*)ゞ
ありがとうございました。(さくら)


コメント返信:

[ 一覧(最新更新順) ]


YukiWiki 1.6.7 Copyright (C) 2000,2001 by Hiroshi Yuki. Modified by kazu.