こんにちは、ともです。
統計のお勉強の備忘録です。
→ ともの統計とStata講座 目次へ♡
題材は2012年11月前半のピグライフクエスト
ピーナッツクエストのレアクエスト切手率です。
Stataの使い方の基礎2・Stataともマニュアル
基礎統計量の意味と計算
■基本統計量の意味と基本統計表の作成
①基本統計量の意味
1)平均 mean
・データの中心がどのくらいかを示す。
・すべてのデータを合計し、標本数で割った値
2)中央値 median
・データの中央の値
2)偏差 deviation
・それぞれのデータが平均値からどれだけ離れているかの指標
・プラスとマイナスに離れているので合計すると打ち消しあってしまう。
3)偏差平方和 sum of squared deviation
・それぞれのデータが平均からどれだけ離れているかの指標合計
・偏差の二乗の合計値
・標本数が多くなると値が多くなって比較が難しい
4)分散 variance
・それぞれのデータの散らばり具合を示す指数
・偏差平方和を標本数で割る
(実際は n-1)
・比べたいもとの値の二乗になるので大きく感じ、解釈が難しい
5)標準偏差 standard deviation
・平均からの離れ具合を示す尺度
・分散の平方根
②Stataによる 基本統計表 の作成
1)統計量表示のオプションコマンド
・mean : 平均、 median または p50 : 中央値
・p数字 : 数字%の値、分位点
・count または n : 標本数(欠損値以外)
・max : 最大値、min : 最小値
・range : データ幅 = (最大値ー最小値)
・var : 分散、 sd : 標準偏差
・cv : 変動係数 = 標準偏差/平均
・skewness 尖度、 kurtosis 歪度
2)基本統計量表の作成
・使用コマンド tabstat (変数) if 条件, by(カテゴリー変数) stat(統計量)
・個別の変数について、自分の望む統計量を表示させることが出来る
・コマンド例:
tabstat ratio, stat(mean, median, min, max, sd)
表:ピーナッツレアクエ切手率の平均、中央値、最小値、最大値、標準偏差
③Stataによる おまかせ記述統計表 の作成
1)データセットのタイプをみる
・使用コマンド describe
2)記述統計表の作成
・使用コマンド summarize または summarize, detail
・変数すべてのデータ数、平均、標準偏差、最小、最大値を表示
・detail オプションで更に、分位点、分散、尖度、歪度も表示。
→ ともの統計とStata講座 目次へ♡
応援よろしくお願いします
↓↓↓ こちらと ↓↓↓ こちら


にほんブログ村 人気ブログランキングへ




朝食に食べたいのはフレンチトースト!!
決め手は しっとりさ かしら
ホットケーキも美味しいけど、焼き方によっては
パサパサになるでしょ
朝ってパサパサのもの食べにくいじゃん
その点、フレンチトーストだったら
ぜったいしっとりでしょ
だから朝はフレンチトーストに軍配かな
お昼だったら間違いなくホットケーキだけど (///∇//)