基礎統計量(続き)

統計解析 02 クラス : 第05回 (05/19/05)

 前回は説明が 中途半端になってしまい理解し難かったと思う。 今回は、例を換えてまず解りやすい出力を紹介し、 その後別の例も紹介して、基礎統計量の見方を習得してもらう。
 なお、ファイル転送ソフト WinSCP の使い方についても訂正があるので、 改めて紹介する。

  1. 使用データ : 過去 11回の学生のアンケートデータ(all05a.prn)

  2. データ転送(送信) : WinSCP を使ったファイルの送受信
     第3回の第4節で WinSCP の使い方を説明したが、転送モードに関する説明が抜けていたので、 再度説明する。

    MNC では、ファイルの送受信ツールとして WinSCP を用意しているので、このソフトウェアの使い方を説明する。 なお、これはフリーソフトウェアであるので、自宅から使うような場合は 各自のパソコンにインストールしておくとよいであろう。

    1. 転送プログラム(WinSCP)の起動
      「スタート」→「プログラム(P)」→「stat システム」→ 「WinSCP」→選択欄のstat11(または stat12)をダブルクリックする。
    2. ユーザ名欄にユーザID、パスワード欄にパスワードを入力する。
    3. 「ログイン」をクリックする。
    4. 画面の左半分は Windows 側を、 右半分は stat システム側のファイルを表示している。
    5. 転送したいファイルを画面から選び反対側のドライブに ドラッグ & ドロップする。
      • 送信(アップロード) : Windows から stat システムへコピー
      • 受信(ダウンロード) : stat システムから Winodws へコピー
    6. 「コピー」と言うウインドウが開く。右下の「コピー」ボタンを押すと、 コピーされるのだが、これが曲者であり、 そのまま「コピー」ボタンを押すのは避けた方が良い。
    7. 中央下の「詳細(M)>>」ボタンを押して、 転送モードを細かく指定する画面を表示する。
    8. 「転送モード」が「自動」になっていると思うが、 転送モードはこちらから陽に指定する。 「解析用データ(*.prn)」や「SAS の出力(*.lst)」はテキスト形式と言って、 文字だけで構成されており、これらは「転送モード」に「テキスト」を 指定してやらないといけない。一方、「Excel ファイル(*.xls)」や 「圧縮されたファイル(*.exe, *.lha, *.zip 等)」は内部コードで記述されているので 「転送モード」に「バイナリ」を指定してやらないといけない。
      • テキストモード : 解析用データ(*.prn), SAS の出力(*.lst)等
      • バイナリモード : Excel ファイル(*.xls)等
    9. 転送モードを指定後、「コピー」ボタンを押して転送する。

    10. 終了は「セッション(Session)」→「切断(Disconnect)」をクリックし、 「閉じる」をクリックする。

     ・参考になるWebページ

    [Lesson 5-1] : ファイルの転送: Windows ===> stat システム(UNIX)

    [各自のファイル] : 上記に習って各自のファイルも転送しなおしておく

  3. 基礎統計量(学生データ) : 学生データの基礎統計量を計算させてみよう
    1. プログラム : Lesson 5-2 : les0502.sas
       /* Lesson 5-02 */
       /*    File Name = les0502.sas   05/19/05   */
      
      data gakusei;
        infile 'all05a.prn'                          : データファイルの指定
          firstobs=2;                                : 2行目からが実際のデータ
        input sex $ shintyou taijyuu kyoui           : 読み込む変量
              jitaku $ kodukai carryer $ tsuuwa;
      
      proc print data=gakusei(obs=5);
      run;
      proc means data=gakusei;                       : 平均を計算
      run;
      proc univariate data=gakusei plot;             : 基礎統計量を計算
        var shintyou taijyuu kyoui kodukai;          : 変量を指定
      run;
      

    2. 出力結果 : les0502.lst :
      • 各統計量がどこに表示されているか把握せよ。
      • 身長や体重等の平均は自分の感覚に合うか? 小遣い額は?
      • 各々の分布の特徴と違いを把握せよ。
      • 箱髭図が箱と髭になっているのが判るか。
      • 平均値だけでなく、最頻値、中央値が分布のどこに位置するかを調べよ。
      • ヒストグラムだけでなく、箱髭図や樹葉図からでも分布特性が把握できるようにせよ。
                                    SAS システム                             1
                                                 20:12 Wednesday, May 18, 2005
      
       OBS  SEX  SHINTYOU  TAIJYUU  KYOUI  JITAKU  KODUKAI  CARRYER   TSUUWA
      
         1   F     145.0      38       .     J      10000                 . 
         2   F     146.7      41      85     J      10000   Vodafone   6000 
         3   F     148.0      42       .     J      50000                 . 
         4   F     148.0      43      80     J      50000   DoCoMo     4000 
         5   F     148.9       .       .     J      60000                 . 
      
                                    SAS システム                             2
                                                 20:12 Wednesday, May 18, 2005
       Variable    N          Mean       Std Dev       Minimum       Maximum
       ---------------------------------------------------------------------
       SHINTYOU  313   167.6891374     8.2031934   145.0000000   186.0000000
       TAIJYUU   282    58.5638298     9.3640889    35.0000000   100.0000000
       KYOUI     104    86.4903846     7.6424913    56.0000000   112.0000000
       KODUKAI   302      48557.95      48920.34             0     300000.00
       TSUUWA    104       7101.42       4608.50   200.0000000      30000.00
       ---------------------------------------------------------------------
      
                                    SAS システム                             3
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=SHINTYOU
                                      Moments
      
                      N               313  Sum Wgts        313
                      Mean       167.6891  Sum         52486.7
                      Std Dev    8.203193  Variance   67.29238
                      Skewness   -0.33661  Kurtosis   -0.43031
                      USS         8822445  CSS        20995.22
                      CV         4.891905  Std Mean   0.463672
                      T:Mean=0   361.6547  Pr>|T|       0.0001
                      Num ^= 0        313  Num > 0         313
                      M(Sign)       156.5  Pr>=|M|      0.0001
                      Sgn Rank    24570.5  Pr>=|S|      0.0001
      
                                    SAS システム                             4
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=SHINTYOU
                                  Quantiles(Def=5)
      
                       100% Max       186       99%       183
                        75% Q3      173.5       95%       180
                        50% Med     168.6       90%       178
                        25% Q1        162       10%       156
                         0% Min       145        5%       153
                                                 1%       148
                       Range           41                    
                       Q3-Q1         11.5                    
                       Mode           170                    
      
                                    SAS システム                             5
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=SHINTYOU
                                      Extremes
      
                         Lowest    Obs     Highest    Obs
                            145(       1)      182(     309)
                          146.7(       2)      183(     310)
                            148(       4)      184(     311)
                            148(       3)      185(     312)
                          148.9(       5)      186(     313)
      
                                    SAS システム                             6
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=SHINTYOU
                              Missing Value         .
                              Count                15
                              % Count/Nobs       4.57
      
                                    SAS システム                             7
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=SHINTYOU
                             Histogram                       #         Boxplot
        187.5+*                                              2            |   
             .**********                                    19            |   
             .***********************                       45            |   
             .******************************************    83         +-----+
        167.5+*******************************               62         *--+--*
             .*************************                     49         +-----+
             .****************                              32            |   
             .********                                      15            |   
        147.5+***                                            6            |   
              ----+----+----+----+----+----+----+----+--              
              * may represent up to 2 counts                          
      
                                    SAS システム                             8
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=SHINTYOU
                                   Normal Probability Plot              
               187.5+                                               +++*
                    |                                        ******+*** 
                    |                                 ********          
                    |                          ********                 
               167.5+                     ******+                       
                    |                *****+                             
                    |          ******                                   
                    |    +******                                        
               147.5+**+**                                              
                     +----+----+----+----+----+----+----+----+----+----+
                         -2        -1         0        +1        +2     
      
                                    SAS システム                             9
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=TAIJYUU
                                      Moments
      
                      N               282  Sum Wgts        282
                      Mean       58.56383  Sum           16515
                      Std Dev    9.364089  Variance   87.68616
                      Skewness   0.708571  Kurtosis   1.887446
                      USS        991821.5  CSS        24639.81
                      CV         15.98954  Std Mean   0.557623
                      T:Mean=0    105.024  Pr>|T|       0.0001
                      Num ^= 0        282  Num > 0         282
                      M(Sign)         141  Pr>=|M|      0.0001
                      Sgn Rank    19951.5  Pr>=|S|      0.0001
      
                                    SAS システム                            10
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=TAIJYUU
                                  Quantiles(Def=5)
      
                       100% Max       100       99%        90
                        75% Q3         64       95%        74
                        50% Med        58       90%        70
                        25% Q1         52       10%        47
                         0% Min        35        5%        45
                                                 1%        41
                       Range           65                    
                       Q3-Q1           12                    
                       Mode            60                    
      
                                    SAS システム                            11
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=TAIJYUU
                                      Extremes
      
                         Lowest    Obs     Highest    Obs
                             35(      10)       82(     313)
                             38(       1)     88.5(     163)
                             41(      13)       90(     309)
                             41(       2)       95(     284)
                           41.5(       9)      100(     285)
      
                                    SAS システム                            12
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=TAIJYUU
                              Missing Value         .
                              Count                46
                              % Count/Nobs      14.02
      
                                    SAS システム                            13
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=TAIJYUU
                           Histogram                    #             Boxplot
           105+*                                        1                0   
              .*                                        2                0   
              .*                                        2                0   
              .*********                               25                |   
              .************************************   106             +-----+
              .**********************************     102             *--+--*
              .**************                          42                |   
            35+*                                        2                |   
               ----+----+----+----+----+----+----+-              
               * may represent up to 3 counts                    
      
                                    SAS システム                            14
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=TAIJYUU
                                   Normal Probability Plot              
                 105+                                                  *
                    |                                                 **
                    |                                              **+++
                    |                                      *******+*+   
                    |                         *************             
                    |               ***********+                        
                    | * ** **********                                   
                  35+*+++++                                             
                     +----+----+----+----+----+----+----+----+----+----+
                         -2        -1         0        +1        +2     
      
                                    SAS システム                            21
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KODUKAI
                                      Moments
      
                      N               302  Sum Wgts        302
                      Mean       48557.95  Sum        14664500
                      Std Dev    48920.34  Variance   2.3932E9
                      Skewness   1.739247  Kurtosis   4.291792
                      USS        1.432E12  CSS        7.204E11
                      CV         100.7463  Std Mean    2815.05
                      T:Mean=0   17.24941  Pr>|T|       0.0001
                      Num ^= 0        251  Num > 0         251
                      M(Sign)       125.5  Pr>=|M|      0.0001
                      Sgn Rank      15813  Pr>=|S|      0.0001
      
                                    SAS システム                            22
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KODUKAI
                                  Quantiles(Def=5)
      
                       100% Max    300000       99%    200000
                        75% Q3      65000       95%    150000
                        50% Med     30000       90%    120000
                        25% Q1      20000       10%         0
                         0% Min         0        5%         0
                                                 1%         0
                       Range       300000                    
                       Q3-Q1        45000                    
                       Mode             0                    
      
                                    SAS システム                            23
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KODUKAI
                                      Extremes
      
                         Lowest    Obs     Highest    Obs
                              0(     319)   180000(      22)
                              0(     313)   200000(      76)
                              0(     312)   200000(     225)
                              0(     307)   300000(     115)
                              0(     304)   300000(     287)
      
                                    SAS システム                            24
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KODUKAI
                              Missing Value         .
                              Count                26
                              % Count/Nobs       7.93
      
                                    SAS システム                            25
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KODUKAI
                               Histogram                         #     Boxplot
       325000+*                                                  2        *   
             .                                                                
             .*                                                  2        0   
       175000+*****                                             18        0   
             .********                                          32        |   
             .*****************                                 66     +-----+
        25000+**********************************************   182     *--+--*
              ----+----+----+----+----+----+----+----+----+-              
              * may represent up to 4 counts                              
      
                                    SAS システム                            26
                                                 20:12 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KODUKAI
                                   Normal Probability Plot              
              325000+                                                  *
                    |                                                   
                    |                                                ** 
              175000+                                        ********+++
                    |                                  ******++++++     
                    |                          ++*******+               
               25000+****************************                       
                     +----+----+----+----+----+----+----+----+----+----+
                         -2        -1         0        +1        +2     
      

    3. 知見 : 解析によって判ったこと & 解ったこと
      • 平均値の意味するところ : 対称分布の時だけイメージが一致する
      • 分布の偏り : 常にあると思ってよい : 最頻値や中央値が有効
      • 外れ値を把握するには箱髭図が有効である
      • (Mode の表示は少し注意が必要(SAS の場合))
      • 少数例

    4. [演習] ヒストグラムや箱髭図上での各統計量の位置を確認せよ。 他の変数も調べてみよ。

  4. 基礎統計量(得点失点データ) : プロ野球の得点失点データ

    1. プログラム : Lesson 5-3 : les0503.sas
       /* Lesson 5-03 */
       /*    File Name = les0503.sas   05/19/05   */
      
      data baseball;
        infile 'Baseball05.prn'
          firstobs=6;
         input  Lotte  Soft  Seibu  Ham   Orix  Raku 
               VLotte VSoft VSeibu VHam  VOrix VRaku 
                Cyu    Han   Yaku   Yoko  Hiro  Kyo 
               VCyu   VHan  VYaku  VYoko VHiro VKyo
      ;
      
      proc print data=baseball(obs=5);
      run;
      proc means data=baseball;
      run;
      proc univariate data=baseball plot;
        var Raku VRaku  Kyo VKyo;
      run;
      

    2. 出力結果 : les0503.lst :
      • チームによって得点、失点にばらつきがあるのが判るであろうか?
      • 外れ値は判るであろうか?
                                    SAS システム                             1
                                                 20:27 Wednesday, May 18, 2005
      
                               V    V
                 L    S        L V  S    V  V                   V V V
                 O S  E    O R O S  E V  O  R     Y  Y H    V V Y Y H V
              O  T O  I  H R A T O  I H  R  A C H A  O I K  C H A O I K
              B  T F  B  A I K T F  B A  I  K Y A K  K R Y  Y A K K R Y
              S  E T  U  M X U E T  U M  X  U U N U  O O O  U N U O O O
      
              1  1 3  3  1 2 3 3 1  2 3  3  1 4 1 6  0 4 2  0 6 1 4 2 4
              2 26 6 11  5 7 0 0 5  7 6 11 26 5 9 1  4 5 4  4 1 9 5 4 5
              3  2 6  1  0 5 1 5 1  0 1  2  6 6 9 5 14 8 7 14 5 9 6 7 8
              4  4 6  7 12 3 2 3 2 12 7  4  6 4 9 3  4 2 3  3 2 4 3 9 4
              5  3 8  3  4 2 0 2 0  4 3  3  8 4 9 3  7 4 8  3 4 4 8 9 7
      
                                    SAS システム                             2
                                                 20:27 Wednesday, May 18, 2005
      
        Variable   N          Mean       Std Dev       Minimum       Maximum
        --------------------------------------------------------------------
        LOTTE     28     6.3214286     5.1211513     1.0000000    26.0000000
        SOFT      31     4.6774194     2.9708259             0    12.0000000
        SEIBU     30     3.8333333     2.4506626             0    11.0000000
        HAM       28     5.1071429     4.0582726             0    15.0000000
        ORIX      28     4.2142857     3.1193202             0    11.0000000
        RAKU      29     3.2068966     3.5191244             0    16.0000000
        VLOTTE    28     2.7142857     2.2747754             0    10.0000000
        VSOFT     31     3.3548387     3.0281830             0    11.0000000
        VSEIBU    30     5.6000000     4.6874741             0    16.0000000
        VHAM      28     4.6785714     2.8421897     1.0000000    10.0000000
        VORIX     28     4.3928571     3.2011489             0    12.0000000
        VRAKU     29     6.5172414     4.3803187     1.0000000    26.0000000
        CYU       25     4.8400000     2.3572583     1.0000000    10.0000000
        HAN       26     4.6923077     3.5862987             0    11.0000000
        --------------------------------------------------------------------
      
                                    SAS システム                             3
                                                 20:27 Wednesday, May 18, 2005
      
        Variable   N          Mean       Std Dev       Minimum       Maximum
        --------------------------------------------------------------------
        YAKU      22     3.8181818     2.0618153             0     8.0000000
        YOKO      23     4.2608696     3.7805410             0    14.0000000
        HIRO      23     4.8695652     2.9588749             0    13.0000000
        KYO       25     4.5600000     2.8296054             0    12.0000000
        VCYU      25     4.3600000     3.6501142             0    14.0000000
        VHAN      26     3.9615385     2.7492656     1.0000000    10.0000000
        VYAKU     22     3.8636364     2.2529442     1.0000000     9.0000000
        VYOKO     23     4.2173913     2.3923462             0     9.0000000
        VHIRO     23     5.2608696     3.1939914             0    12.0000000
        VKYO      25     5.4400000     3.1764760             0    14.0000000
        --------------------------------------------------------------------
      
                                    SAS システム                             4
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=RAKU
                                      Moments
      
                      N                29  Sum Wgts         29
                      Mean       3.206897  Sum              93
                      Std Dev    3.519124  Variance   12.38424
                      Skewness   2.192105  Kurtosis   5.798479
                      USS             645  CSS        346.7586
                      CV         109.7361  Std Mean   0.653485
                      T:Mean=0   4.907376  Pr>|T|       0.0001
                      Num ^= 0         25  Num > 0          25
                      M(Sign)        12.5  Pr>=|M|      0.0001
                      Sgn Rank      162.5  Pr>=|S|      0.0001
      
                                    SAS システム                             5
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=RAKU
                                  Quantiles(Def=5)
      
                       100% Max        16       99%        16
                        75% Q3          4       95%        11
                        50% Med         3       90%         8
                        25% Q1          1       10%         0
                         0% Min         0        5%         0
                                                 1%         0
                       Range           16                    
                       Q3-Q1            3                    
                       Mode             1                    
      
                                    SAS システム                             6
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=RAKU
                                      Extremes
      
                         Lowest    Obs     Highest    Obs
                              0(      24)        5(      26)
                              0(      14)        6(      28)
                              0(       5)        8(      11)
                              0(       2)       11(      16)
                              1(      29)       16(       6)
      
                                    SAS システム                             7
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=RAKU
                              Missing Value         .
                              Count                 2
                              % Count/Nobs       6.45
      
                                    SAS システム                             8
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=RAKU
                  Stem Leaf                     #             Boxplot
                    16 0                        1                *   
                    14                                               
                    12                                               
                    10 0                        1                0   
                     8 0                        1                |   
                     6 0                        1                |   
                     4 00000                    5             +-----+
                     2 00000000                 8             *--+--*
                     0 000000000000            12             +-----+
                       ----+----+----+----+              
      
                                    SAS システム                             9
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=RAKU
                                   Normal Probability Plot              
                  17+                                             *     
                    |                                                   
                    |                                                  +
                    |                                         *   +++++ 
                   9+                                      *++++++      
                    |                                 ++++*+            
                    |                            ++**+**                
                    |                      +***+**                      
                   1+     *   *  ** *+*++*+*                            
                     +----+----+----+----+----+----+----+----+----+----+
                         -2        -1         0        +1        +2     
      
                                    SAS システム                            10
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=VRAKU
                                      Moments
      
                      N                29  Sum Wgts         29
                      Mean       6.517241  Sum             189
                      Std Dev    4.380319  Variance   19.18719
                      Skewness    3.30231  Kurtosis    14.3069
                      USS            1769  CSS        537.2414
                      CV         67.21124  Std Mean   0.813405
                      T:Mean=0   8.012298  Pr>|T|       0.0001
                      Num ^= 0         29  Num > 0          29
                      M(Sign)        14.5  Pr>=|M|      0.0001
                      Sgn Rank      217.5  Pr>=|S|      0.0001
      
                                    SAS システム                            11
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=VRAKU
                                  Quantiles(Def=5)
      
                       100% Max        26       99%        26
                        75% Q3          7       95%        12
                        50% Med         6       90%        10
                        25% Q1          5       10%         3
                         0% Min         1        5%         2
                                                 1%         1
                       Range           25                    
                       Q3-Q1            2                    
                       Mode             5                    
      
                                    SAS システム                            12
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=VRAKU
                                      Extremes
      
                         Lowest    Obs     Highest    Obs
                              1(       1)        8(      27)
                              2(      11)        9(      16)
                              3(       7)       10(      10)
                              4(      29)       12(      23)
                              4(      28)       26(       2)
      
                                    SAS システム                            13
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=VRAKU
                              Missing Value         .
                              Count                 2
                              % Count/Nobs       6.45
      
                                    SAS システム                            14
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=VRAKU
                  Stem Leaf                     #             Boxplot
                     2 6                        1                *   
                     2                                               
                     1                                               
                     1 02                       2                0   
                     0 5555556666667777889     19             +--+--+
                     0 1234444                  7                0   
                       ----+----+----+----+              
                   Multiply Stem.Leaf by 10**+1          
      
                                    SAS システム                            20
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=KYO
                  Stem Leaf                     #             Boxplot
                    12 0                        1                |   
                    10                                           |   
                     8 000                      3                |   
                     6 0000                     4             +-----+
                     4 0000000                  7             *--+--*
                     2 0000000                  7             +-----+
                     0 000                      3                |   
                       ----+----+----+----+              
      
                                    SAS システム                            26
                                                 20:27 Wednesday, May 18, 2005
                                Univariate Procedure
      Variable=VKYO
                  Stem Leaf                     #             Boxplot
                    14 0                        1                0   
                    12                                               
                    10 00                       2                |   
                     8 000                      3                |   
                     6 0000                     4             +-----+
                     4 000000000                9             *--+--*
                     2 0000                     4                |   
                     0 00                       2                |   
                       ----+----+----+----+              
      
      

    3. 知見
      • 外れ値によって、平均値が押し上げられているのが判るであろうか? 例えば、楽天の失点のひと試合平均値は 6.5 点と他のチームに比して 非常に高くなっているが、これは 26点を失点した 1試合があるからで、 これを除くと 5.8点とグッと下がる。平均値は極端な外れ値によって 変化することを知っておくべきである。
      • その点、中央値(Mode)や最頻値(Median)は外乱を受けにくいので、 極端な外れ値がある場合でも安定的な指標として使うことができる。

    4. [演習] 他のチームの得点、失点についてもその特徴を把握してみよ。

  5. 前回 の 1節 : 内閣の閣僚資産データについてもう一度読み取ってみよう

  6. 前回 の 2節 : 平均値の意味するものを考えてみよう

  7. 前々回 の 10節 : 漢字コードの取り扱い
    補足: 実際の事例

  8. 前回 の 3節 : レポートを作るには?

  9. レポート提出 : これまでの講義で紹介した SAS の手法(プロシジャー)を利用して、 統計解析を行ってみよ。解析結果だけでなく、データ自身の説明や、 どういうところに興味を持って対象に選んだかの理由等も報告する事。考察も大事。
    1. 対象データ : 以下の 1〜3 の中から 最低、2つ。
      1. 皆さんから収集したアンケートデータ(all05a.prn)
      2. 各自で収集した興味あるデータ(個人ごとに異なる) : 複数あるかも
      3. その他

    2. 提出期限 : 06月07日(火) 18:00 まで : 電子メールかワープロ(or エディタ)で。手書きは不可。

      注意1: 電子メールでの場合は、添付ファイルは使わないこと。 提出用メールアドレスは「hayashi@peter.rd.dnc.ac.jp」である。 また、提出日時はメールヘッダーから判断する。私からは受領確認メールを出すので、それを受け取った段階で提出作業完了とする。
      注意2: 紙で提出する場合は、事務所の受付終了時刻に注意すること。提出日は事務室の受領印で判断する。
      注意3: 連絡ページ に受領した者の学籍番号を掲載するので、確認に使ってほしい。

    3. 作業内容 : 以下の点に注意しながらレポートを作成しよう。
      1. 解析対象とするデータの数は、最低 2つであるが上限は設けない。 1つだけではダメ
      2. 解析結果だけでなく、データ自身の説明やどういうところに興味を持って 解析対象に選んだかの理由等も報告する事。 加えて、特に得られた知見からの考察は大事。
      3. レポートは他人への、もの事の説明のための文書である!!
      4. 手入力を少なくして SAS の出力を最大限有効利用せよ。 しかし、不要な部分はカットせよ。だらだらと引用しないこと。
      5. 興味を持つ点や得られた知見に対する考察は人によって個々異なるもので あるので、他人と相談することなく自分の力で解析しレポートを作成すること。

    4. 必要事項 : 以下に挙げるような項目を含めて作成すること。
      • 所属学部名、学籍番号、氏名
      • 使ったデータ内容の説明
      • どのような点に興味を持ったか
      • 自分の解析目的
      • 何を知りたいためにどのような手法を使ったのか
      • 得られた知見と考察
      • その他、気付いたこと

      • 講義の進め方や内容等について、感想や意見も。

  10. 次回、次々回は... : 05月26日, 06月02日

  11. 次々々回は、... : 06月09日 14:45
[DIR]講義のホームページへ戻ります