後期のプラン、簡単な例題

統計処理 01 クラス : 第11回目(09/28/99)

夏休みは有意義に過ごせたでしょうか? という今はもうすっかり秋ですね。

さて、前期を通して、データの電子化やおおまかな SAS のプログラミングについて 計算機を使ったデータ解析の基礎を紹介してきたつもりである。 また、レポート作成を通して多少は処理方法を習得してもらったつもりでもある。

今回は、後期の講義の進め方と提出されたレポートに付記された要望について応える。 その後、SAS の使い方を思い出してもらう意味を込めて、 身近なデータを使って簡単な計算をして、統計について再度考えてもらおう。

  1. 講義で取り扱うテーマ

  2. 後期の日程、進め方、予定
    11) 09/28 第11回目 後期のプラン、簡単な例題 <=== 必ず出席のこと
    12) 10/05 第12回目 二変量の関係、単回帰分析

    以下の日程と講義内容は案です。決定ではありません。

    13) 10/12 第13回目 重回帰分析
    14) 10/19 第14回目 主成分分析
    __) ??/?? 創立記念日??のため休講??
    15) 10/26 第15回目 因子分析
    16) 11/02 第16回目 分散分析
    17) 11/09 第17回目 レポート作成(自分のデータセットを使って) : 不登校日
    18) 11/16 第18回目 発表会 その1
    __) 11/23 勤労感謝の日
    19) 11/30 第19回目 いくつかのデータで実践 : 不登校日
    20) 12/07 第20回目 発表会 その2
    21) 12/14 第21回目 発表会 その3
    冬季休業
    22) 01/11 第22回目 発表会 その4
    23) 01/18 第23回目 レポート作成 : 不登校日

  3. 前期レポートの感想から :
    • 添付ファイルは絶対に避けてほしい : 少なくて助かった (^^;

    • レポートとして : まとめ方、SAS 出力の引用場所、人への説明、誤字
    • 「手」を動かすこと
    • 「メモ」の取り方

    • 講義のスピード : 前期と同じかやや速く、基本操作は習得済みのはず
    • 統計の理論
    • 休講が復習の時間に使える
    • SAS の利点と、Excel の優位性 : SAS の利用場面
    • ...

  4. 内閣閣僚の資産を評価してみよう : [例] 毎日新聞の記事(2000年8月4日)
    • 平均値は本当に代表値と言えるのか?
    • 「閣僚平均 2.5 億円」とあるが...。

    1. データ : kakuryou.prn
      • 第二次森内閣の資産公開資料(2000年8月5日に新聞掲載)。
        • 19名、6変量 : 内閣閣僚の資産データ
        • 土地・建物、預貯金・有価証券、家族分を含む総資産、本人の資産、貸付金、借入金
        • 変量「家族分を含む総資産」を中心に
      • J:\コンピュータによる統計処理01(林 篤裕)\kakuryou.prn」に置いておく。 J ドライブは講義の教材を配布するためのドライブ。 各自、ファイルを stat システムに転送して利用せよ。 なお、教室ごとに J ドライブの内容は異なるので、 転送だけは C ルームで行っておく必要がある。
      • ファイル転送ソフト WS_FTP32 は漢字のディレクトリを表示できないので、 J ドライブにあるファイルを直接転送するには困難を極めると思われる。 このような場合は、WinNT 側で、J ドライブから H ドライブに該当ファイルを コピーしてから、WS_FTP32 で転送すると混乱が少ないと思われる。
      • この転送の作業は「 第8回 」で実践済み。

    2. プログラム : les1101.sas : 漢字の入力方法が不明なので演習では漢字の入力は不要。例として紹介。
       /* Lesson 11-1 */
       /*    File Name = les1101.sas   09/28/00   */
      
      data kakuryou;
        infile 'kakuryou.prn';
        input name $ real_est savings tot_pro per_pro loan_som loan_Ban;
        LABEL real_est='土地・建物(real_estate)'             : 変量ラベル(説明)
              savings='預貯金・有価証券(Savings)'            :
              tot_pro='家族分を含む総資産(Total_Property)'   :
              per_pro='本人の資産(Persons_Property)'         :
              loan_som='貸付金(Loan_to_Someone)'             :
              loan_Ban='借入金(Loan_from_Banks)'             :
      ;                                                      :
                                                             :
      proc print data=kakuryou(obs=10);                      : 試しに出力
      run;                                                   :
                                                             :
      proc means data=kakuryou;                              : 平均
      run;                                                   :
                                                             :
      proc univariate data=kakuryou plot;                    : 基礎統計量
      run;                                                   :
                                                             :
      proc chart data=kakuryou;                              : 水平棒グラフ
        hbar real_est savings tot_pro per_pro loan_som loan_Ban;
      run;                                                   :
                                                             :
      proc sort data=kakuryou;                               : 並べ替え
        by descending tot_pro;                               : 逆順に(大きいものから)
      run;                                                   :
                                                             :
      proc print data=kakuryou;                              : 出力
      run;                                                   :
      
    3. 出力結果 : les1101.lst
                                    SAS システム                             1
                                           18:13 Wednesday, September 27, 2000
      
       OBS  NAME      REAL_EST  SAVINGS  TOT_PRO  PER_PRO  LOAN_SOM  LOAN_BAN
      
         1  Mori         8927     4011     12938     9892      0       11796
         2  Yasuoka         2     1600      1602        0      0           0
         3  Kouno      139961    13359    153320   153320      0       29147
         4  Miyazawa    13539     5605     19144    15551      0           0
         5  Ooshima      1284     2138      3422     1748      0        1000
         6  Tsushima    30792     3496     34288     3675      0       34010
         7  Tani        10177     5160     15337    12937      0           0
         8  Hiranuma     4470      223      4693     4470      0       12921
         9  Morita      15033     7427     22460    10885      0           0
        10  Hirabaya     1258     4076      5334     3806      0           0
      
                                    SAS システム                             2
                                           18:13 Wednesday, September 27, 2000
      
           Variable  Label                                N          Mean
           --------------------------------------------------------------
           REAL_EST  土地・建物(real_estate)             19      14477.58
           SAVINGS   預貯金・有価証券(Savings)           19      10841.11
           TOT_PRO   家族分を含む総資産(Total_Property)  19      25318.68
           PER_PRO   本人の資産(Persons_Property)        19      17966.37
           LOAN_SOM  貸付金(Loan_to_Someone)             19   481.8947368
           LOAN_BAN  借入金(Loan_from_Banks)             19      19935.58
           --------------------------------------------------------------
      
                                    SAS システム                             3
                                           18:13 Wednesday, September 27, 2000
      
      Variable  Label                                    Std Dev       Minimum
      ------------------------------------------------------------------------
      REAL_EST  土地・建物(real_estate)                 31401.93     2.0000000
      SAVINGS   預貯金・有価証券(Savings)               19430.47   223.0000000
      TOT_PRO   家族分を含む総資産(Total_Property)      37121.44       1602.00
      PER_PRO   本人の資産(Persons_Property)            37580.00             0
      LOAN_SOM  貸付金(Loan_to_Someone)                  1818.46             0
      LOAN_BAN  借入金(Loan_from_Banks)                 46473.47             0
      ------------------------------------------------------------------------
      
                                    SAS システム                             4
                                           18:13 Wednesday, September 27, 2000
      
             Variable  Label                                    Maximum
             ----------------------------------------------------------
             REAL_EST  土地・建物(real_estate)                139961.00
             SAVINGS   預貯金・有価証券(Savings)               86047.00
             TOT_PRO   家族分を含む総資産(Total_Property)     153320.00
             PER_PRO   本人の資産(Persons_Property)           153320.00
             LOAN_SOM  貸付金(Loan_to_Someone)                  7896.00
             LOAN_BAN  借入金(Loan_from_Banks)                204694.00
             ----------------------------------------------------------
      
      
                                    SAS システム                            15
                                           18:13 Wednesday, September 27, 2000
                                Univariate Procedure
      Variable=TOT_PRO       家族分を含む総資産(Total_Property)
      
                                      Moments
      
                      N                19  Sum Wgts         19
                      Mean       25318.68  Sum          481055
                      Std Dev    37121.44  Variance    1.378E9
                      Skewness   2.857102  Kurtosis   8.371769
                      USS        3.698E10  CSS         2.48E10
                      CV         146.6168  Std Mean   8516.243
                      T:Mean=0   2.972988  Pr>|T|       0.0081
                      Num ^= 0         19  Num > 0          19
                      M(Sign)         9.5  Pr>=|M|      0.0001
                      Sgn Rank         95  Pr>=|S|      0.0001
      
                                    SAS システム                            16
                                           18:13 Wednesday, September 27, 2000
                                Univariate Procedure
      Variable=TOT_PRO       家族分を含む総資産(Total_Property)
      
                                  Quantiles(Def=5)
      
                       100% Max    153320       99%    153320
                        75% Q3      22460       95%    153320
                        50% Med     15337       90%     94091
                        25% Q1       5334       10%      2079
                         0% Min      1602        5%      1602
                                                 1%      1602
                       Range       151718
                       Q3-Q1        17126
                       Mode          1602
      
                                    SAS システム                            17
                                           18:13 Wednesday, September 27, 2000
                                Univariate Procedure
      Variable=TOT_PRO       家族分を含む総資産(Total_Property)
      
                                      Extremes
      
                         Lowest    Obs     Highest    Obs
                           1602(       2)    22460(       9)
                           2079(      11)    28730(      14)
                           3422(       5)    34288(       6)
                           4693(       8)    94091(      17)
                           5334(      10)   153320(       3)
      
                                    SAS システム                            18
                                           18:13 Wednesday, September 27, 2000
                                Univariate Procedure
      Variable=TOT_PRO       家族分を含む総資産(Total_Property)
      
                  Stem Leaf                     #             Boxplot
                    14 3                        1                *
                    12
                    10
                     8 4                        1                *
                     6
                     4
                     2 0294                     4             +--+--+
                     0 2235563335669           13             *-----*
                       ----+----+----+----+
                   Multiply Stem.Leaf by 10**+4
      
                                    SAS システム                            19
                                           18:13 Wednesday, September 27, 2000
                                Univariate Procedure
      Variable=TOT_PRO       家族分を含む総資産(Total_Property)
      
                                   Normal Probability Plot
              150000+                                           *
                    |
                    |                                              +++++
                    |                                       *++++++
                    |                                   +++++
                    |                             ++++++
                    |                        +++++   * * *
               10000+       *   *  * * *+***+*** ***
                     +----+----+----+----+----+----+----+----+----+----+
                         -2        -1         0        +1        +2
      
      
                                    SAS システム                            35
                                           18:13 Wednesday, September 27, 2000
      
            REAL_EST                             Cum.              Cum.
            Midpoint                       Freq  Freq  Percent  Percent
                       |
               15000   |*****************    17    17    89.47    89.47
                       |
               45000   |*                     1    18     5.26    94.74
                       |
               75000   |                      0    18     0.00    94.74
                       |
              105000   |                      0    18     0.00    94.74
                       |
              135000   |*                     1    19     5.26   100.00
                       |
                       -----+----+----+--
                            5    10   15
                            Frequency
      
                                    SAS システム                            36
                                           18:13 Wednesday, September 27, 2000
      
       預貯金・有価証券(Savings)                      Cum.              Cum.
       Midpoint                                 Freq  Freq  Percent  Percent
                 |
             0   |****************************    14    14    73.68    73.68
                 |
         20000   |********                         4    18    21.05    94.74
                 |
         40000   |                                 0    18     0.00    94.74
                 |
         60000   |                                 0    18     0.00    94.74
                 |
         80000   |**                               1    19     5.26   100.00
                 |
                 ----+---+---+---+---+---+---+
                     2   4   6   8   10  12  14
                           Frequency
      
                                    SAS システム                            37
                                           18:13 Wednesday, September 27, 2000
      
            TOT_PRO                              Cum.              Cum.
            Midpoint                       Freq  Freq  Percent  Percent
                      |
                  0   |******************     9     9    47.37    47.37
              30000   |****************       8    17    42.11    89.47
              60000   |                       0    17     0.00    89.47
              90000   |**                     1    18     5.26    94.74
             120000   |                       0    18     0.00    94.74
             150000   |**                     1    19     5.26   100.00
                      |
                      ----+---+---+---+--
                          2   4   6   8
                           Frequency
      
                                    SAS システム                            38
                                           18:13 Wednesday, September 27, 2000
      
             PER_PRO                            Cum.              Cum.
             Midpoint                     Freq  Freq  Percent  Percent
                       |
                   0   |****************    16    16    84.21    84.21
               30000   |*                    1    17     5.26    89.47
               60000   |                     0    17     0.00    89.47
               90000   |*                    1    18     5.26    94.74
              120000   |                     0    18     0.00    94.74
              150000   |*                    1    19     5.26   100.00
                       |
                       -----+----+----+-
                            5    10   15
                           Frequency
      
                                    SAS システム                            39
                                           18:13 Wednesday, September 27, 2000
      
            LOAN_SOM                             Cum.              Cum.
            Midpoint                       Freq  Freq  Percent  Percent
                       |
                   0   |*****************    17    17    89.47    89.47
                1500   |*                     1    18     5.26    94.74
                3000   |                      0    18     0.00    94.74
                4500   |                      0    18     0.00    94.74
                6000   |                      0    18     0.00    94.74
                7500   |*                     1    19     5.26   100.00
                       |
                       -----+----+----+--
                            5    10   15
                            Frequency
      
                                    SAS システム                            40
                                           18:13 Wednesday, September 27, 2000
      
       借入金(Loan_from_Banks)                         Cum.              Cum.
       Midpoint                                  Freq  Freq  Percent  Percent
                  |
              0   |****************************    14    14    73.68    73.68
                  |
          50000   |********                         4    18    21.05    94.74
                  |
         100000   |                                 0    18     0.00    94.74
                  |
         150000   |                                 0    18     0.00    94.74
                  |
         200000   |**                               1    19     5.26   100.00
                  |
                  ----+---+---+---+---+---+---+
                      2   4   6   8   10  12  14
                            Frequency
      
                                    SAS システム                            41
                                           18:13 Wednesday, September 27, 2000
      
       OBS  NAME      REAL_EST  SAVINGS  TOT_PRO  PER_PRO  LOAN_SOM  LOAN_BAN
      
         1  Kouno      139961    13359    153320   153320       0      29147 
         2  Sakaiya      8044    86047     94091    84054       0          0 
         3  Tsushima    30792     3496     34288     3675       0      34010 
         4  Nakagawa     1927    26803     28730     2689       0          0 
         5  Morita      15033     7427     22460    10885       0          0 
         6  Oogi        18351     1200     19551     8913    7896      36000 
         7  Miyazawa    13539     5605     19144    15551       0          0 
         8  Kawaguch     1490    14937     16427     9906       0          0 
         9  Kuze          993    15015     16008     2953       0      25000 
        10  Tani        10177     5160     15337    12937       0          0 
        11  Nishida      3597     9778     13375     9544       0     204694 
        12  Mori         8927     4011     12938     9892       0      11796 
        13  Tsuduki     12390      342     12732     3950       0      11749 
        14  Torashim     1483     4041      5524     1359       0          0 
        15  Hirabaya     1258     4076      5334     3806       0          0 
        16  Hiranuma     4470      223      4693     4470       0      12921 
        17  Ooshima      1284     2138      3422     1748       0       1000 
        18  Yoshikaw     1356      723      2079     1709    1260      12459 
        19  Yasuoka         2     1600      1602        0       0          0 
      
    4. 結果の見方(考察) :

  5. 次回は、... : 10月5日 14:45

    • 多変量解析 : 二変量の関係、単回帰分析、...
[DIR]講義のホームページへ戻ります