あなたの投資顧問は、毎月変動リターンを約束する毎月の所得投資スキームを提案します。月額180ドルの平均収入が保証されている場合にのみ投資します。あなたのアドバイザーはまた、過去300ヶ月間、平均190ドルの標準偏差と75ドルの標準偏差を持つリターンを持っていたと伝えます。このスキームに投資すべきですか?仮説検定は、そのような意思決定の助けとなる。
<! - 1 - >
この記事では、統計の正規分布表、公式、p値および関連する基礎の概念に読者が精通していることを前提としています。仮説検定
(または有意差検定)は、クレーム、アイデアまたは仮説をテストするための数学的モデルであるサンプルセットで測定されたデータを使用して、所与の母集団セット内の関心のあるパラメータに関する。選択されたサンプルで計算が行われ、母集団全体の特性に関するより決定的な情報が収集され、データセット全体に関するクレームやアイデアを体系的にテストできます。
<!ここでは簡単な例を示します:(A)学校のプリンシパルは、学校の学生が試験で平均10点のスコアを取ったと報告しています。この「仮説」を検証するために、学校の全学生集団(例えば300名)から30名(標本)の標章を記録し、その標本の平均を計算する。次に、(計算した)標本平均を(報告した)母集団平均と比較し、仮説を確認しようとする。 <! (B)特定のミューチュアルファンドの年間収益率は8%です。ミューチュアルファンドが20年間存在していたと仮定します。私たちは、例えば、5年間(サンプル)のミューチュアルファンドの年間収益の無作為標本を取ってその平均を計算します。次に、(計算された)サンプル平均と(クレームされた)母集団平均を比較して仮説を検証する。仮説検定のための異なる方法論が存在する。以下の4つの基本的ステップが含まれる:
ステップ1:仮説の定義:通常、報告された値(またはクレーム統計)は仮説として記述され、真であると推定される。例9:学校の生徒が試験で平均10点7点を得た場合例B:ミューチュアルファンドの年間収益率は年率8%です。
これは前述の例の場合、仮説は以下のようになります。記述は、「ヌル仮説(H 999)999」を構成し、真実であると仮定される
。陪審の審理のように、容疑者の無実を前提にして、それが前提が間違っているかどうかを判断することから始まります。同様に、仮説検定は、「Null仮説」を立てて仮定することから始まり、次に、仮説が真であるか偽であるかを決定する。
重要な点は、妥当性について疑問があるため、帰無仮説を検証することです。記載された帰無仮説に反している情報はすべて、999代替仮説(H 999 1 999)に取り込まれている。
上記の例では、別の仮説があります:
- 学生は799に等しくない の平均をスコアします。ミューチュアルファンドの年間収益率は要約すると、代替仮説は、帰無仮説の直接の矛盾である。
- 審理の場合と同様に、陪審は容疑者の無実を仮定する(帰無仮説)。検察官は別の方法で証明しなければならない(代替案)。同様に、研究者は帰無仮説が真か偽かを証明しなければならない。検事が別の仮説を証明しなかった場合、陪審は "容疑者"を去らなければならない(帰無仮説に関する決定に基づく)。同様に、研究者が代替仮説を証明できない(または単に何もしない)場合、帰無仮説は真であると仮定される。
ステップ2:決定基準を設定する 意思決定基準は、データセットの特定のパラメータに基づいていなければならず、これは正規分布への接続が画像に入る場所です。 標本分布についての標準統計によると、「標本サイズnについては、標本が描かれた母集団Xが正規分布している場合、Xの標本分布は正常である。したがって、選択可能な他のすべての可能な標本手段の確率は、通常分配される確率である。 e。 g。 XYZ株式市場に上場している株式のうち、新年の頃の平均日次リターンが2%を超えているかどうかを判断する。仮説:平均= 2%999:代替仮説:平均> 2%(これは我々が証明したいものである)999:H 999:サンプル(50個のうち500個のサンプルを500個)を取り出し、サンプルの平均を計算します。正規分布の場合、95%の値は母集団平均の2標準偏差内にある。したがって、サンプルデータセットのこの正規分布および中心限界仮定により、有意水準として5%を確立することが可能になる。この仮定の下では、集団平均から2標準偏差を超える外れ値を得る確率は5%未満(100-95)である。データセットの性質に応じて、他の有意水準を1%、5%または10%で取ることができる。財務計算(ビヘイビアファイナンスを含む)の場合、一般に認められている限度は5%です。 通常の2標準偏差を超える計算が見つかった場合、帰無仮説を棄却するという外れ値の強いケースがあります。 標準偏差は、統計データを理解する上で非常に重要です。標準偏差に関するInvestopediaのビデオを見て、それらの詳細を学んでください。 上記の例では、サンプルの平均が2%よりもはるかに大きい場合(例えば3.5%)、帰無仮説を棄却します。代替仮説(平均> 2%)が受け入れられ、株式の平均1日のリターンが確かに2%を超えていることが確認されます。しかし、サンプルの平均が2%より有意に大きくない(と言えば約2.2%のままである)場合、帰無仮説を棄却することはできない。そのような近距離の場合をどう決定するかが課題です。選択されたサンプルおよび結果から結論を出すために、有意性のレベル が決定され、帰無仮説について結論を出すことができる。この代替仮説は、そのような近距離の場合を決定するための有意水準または「臨界値」概念を確立することを可能にする。標準定義によれば、「臨界値は、限界を定義するカットオフ値であり、上記の例では、臨界値を2.1%と定義した場合には、帰無仮説を棄却する決定を下すことになる。 <2・2%になると、帰無仮説を棄却することになる。重要な値は、受け入れまたは拒絶について明確な境界を定める
例を続ける - 最初に、いくつかの重要なステップと概念を見てみよう。 ステップ3:テスト統計量を計算する: このステップでは、選択したサンプルのテスト統計量(平均、zスコア、p値など)として知られる必要な数字を計算します。計算されるべき様々な値がカバーされる後の節で例を示します。 ステップ4:仮説について結論を出す 計算された値を用いて、帰無仮説を決定する。標本平均を得る確率が5%未満である場合、結論は帰無仮説を拒絶することである(999)。そうでなければ、
- を受け入れて帰無仮説を保持する。 意思決定におけるエラーの種類: サンプルベースの意思決定には、母集団全体への正しい適用性に関して、4つの可能な結果がある可能性がある:
- 保持決定 却下決定 > 間違った (TYPE 1エラー - a)
母集団全体に適用されない
間違った
(TYPE 2エラー - b)
「正解」のケースは、標本に対して行われた決定が母集団全体に本当に当てはまるケースです。サンプル計算に基づいて帰無仮説を保持(または拒否)することを決定すると、エラーのケースが発生しますが、その決定は実際には全人口に適用されるわけではありません。これらのケースは、上記の表に示すように、タイプ1(アルファ)とタイプ2(ベータ)のエラーを構成します。正しい臨界値を選択することにより、タイプ1のアルファエラーを排除するか、許容範囲内に制限することが可能になる。 Alphaは有意水準の誤差を表し、研究者によって決定される。確率計算の標準的な5%の有意性または信頼水準を維持するために、これは5%で保持されます。 該当する意思決定ベンチマークと定義に従う:
"この(アルファ)基準は通常0に設定される。05(a = 0.05)、α値をp値と比較する。タイプIの誤差の確率が5%未満である場合(p <0.05)、帰無仮説を棄却することになります。さもなければ、我々は帰無仮説を保持する。 "
この確率に使用される専門用語は p-value です。これは、帰無仮説に記載された値が真であると仮定すると、「標本結果を得る確率」として定義される。サンプル結果を得るためのp値は、有意水準と比較される。
タイプIIの誤差、すなわちベータ・エラーは、実際には母集団全体に適用されない場合に、帰無仮説を誤って保持する確率として定義される。 " この例や他の計算例をさらにいくつか示します。 例1.可変月収を約束する月額所得投資スキームが存在する。投資家は、平均180ドルの月収が保証されている場合にのみ投資します。彼は300ヶ月のリターンのサンプルを持っています。平均は190ドル、標準偏差は75ドルです。彼または彼女はこのスキームに投資する必要がありますか?
問題を設定しましょう。投資家は、希望の180ドルの平均収益が保証されていれば、このスキームに投資します。仮説:平均= 180 999:代替仮説:平均> 180 999方法1〜999クリティカルバリューアプローチ:帰納仮説を棄却するのに十分な、標本平均の臨界値X
L を同定する。 e。 H 999が与えられていると仮定すると、サンプル平均> =臨界値X 9 9 9 9 P(タイプIアルファエラーを識別する)= P(拒否H 999)真である)、サンプル平均が臨界限界を超えるときに達成される。 e。 α= 0.05(すなわち、5%の有意水準)、Z 999を取ることにより、α999 = P(H 999が真であると仮定すると)=α999である。 (Z-テーブルまたは正規分布テーブルから)999 = 1 + 645 = 180 + 1である。サンプル平均(190)が臨界値(187.12)よりも大きいので、帰無仮説は棄却され、平均月収は確かに$ 180よりも大きいので、投資家はこのスキームへの投資を検討することができます。方法2 - 標準化されたテスト統計を使用する :
標準化された値zを使用することもできる。 Z =(サンプル平均 - 母集団平均)/(標準偏差/ sqrt(サンプル数)、すなわち
5%の有意水準における本発明者らの拒絶領域は、Z> Z 999.0である.0.0599 = 1.645 999であるので、Z = 2.309はより大きいP値計算:P(サンプル平均> = 190、平均= 180)を特定することを目指す
以下の表は、P(Z> =(190-180)/(75 / sqrt(300))= P(Z> = 2.309)= 0.884 = p値の計算を推論すると、月平均収益率が180を超えるという確証が得られていると結論づけられます。推論 1%未満 代替仮説を支持する証拠
1%〜5%の間の証拠
強力な証拠
代替仮説を支持する
> 代替的仮説を支持する弱い証拠
10%を超える証拠がない代替仮説を支持する証拠がない 例2:新しい株式ブローカー(XYZ)クレーム彼の仲介手数料率はあなたの現在の株式ブローカー(ABC)のそれよりも低いと言います。独立した調査会社から入手可能なデータによると、すべてのABCブローカークライアントの平均と標準偏差はそれぞれ18ドルと6ドルです。 ABCの100人のクライアントのサンプルを取得し、XYZブローカーの新しいレートで仲介手数料を計算します。サンプルの平均が18ドルの場合。 75とstd-devが同じ($ 6)の場合、ABCとXYZブローカー間の平均仲介手形の差異について何らかの推論ができますか?拒絶領域:拒絶領域:拒絶領域:拒絶領域:拒絶領域:拒絶領域:拒絶領域:拒絶領域: Z≦-Z 9 2である。 Z 9 = Z 999である。 Z =(サンプル平均 - 平均)/(標準偏差/ sqrt(サンプル数))999 =(18%有意水準を仮定し、この計算されたZ値は、999-Z 999で定義される2つの限界の間にある(5999 = -1)これは、既存のブローカーと新しいブローカーとの間に差異があることを推測するには不十分な証拠があると結論づけられる。 p値= P(Z1.25)999 = 2 * 0.1056 = 0.2112 = 21.12%(0.05または5%より大きい)、同じ結論を導く。 仮説検定方法の批判ポイント: -
前提条件に基づく統計的方法
- アルファベットとベータ・エラーに関して詳細に記述されたエラー
- 通訳p値の曖昧さがあいまいで、結果が混乱する可能性がある。 |
結論 |
仮説テストでは、数学的モデルを使用してクレームやアイデアを検証することができます一定の信頼水準。しかし、統計ツールやモデルの大多数のように、これもいくつかの制限に縛られています。財務上の意思決定にこのモデルを使用するには、すべての依存関係を念頭に置いて重要性を考慮する必要があります。ベイジアン推論のような別の方法も同様の分析のために検討する価値がある。 |
|