頻度集計、ヒストグラム、基礎統計量、分析結果のダウンロード

統計モデル解析特論I/II : 第11回 (01/08/19)

  明けましておめでとうございます。新しい気持ちで新年を迎えられたことと思います。 今回は統計処理をする場合に手始めに行うべき処理としての幾つかの方法を 理解してもらうと共に、出力結果の利用方法を紹介する。
  1. 前回の訂正・補足: 前回 第6節
    1. 講義時に配付した資料では、漢字コードがUTF-8の場合、 オプションの指定文字列を「utf-8」と紹介しましたが、これは正確な説明では ありませんでした。「utf8」とするか「'utf-8'」(クォーテーションで囲む)と 指定すべきであることが判明しましたので、上記の説明部分を修正しました。 申し訳ありませんでした。
    2. Mac のExcel で csvファイルを作成した場合の漢字コードは UTF-8 の ようですが、行末コードが何になるかが調べても正確には判りませんでした。 ただ、1例だけを挙げると「CR+LF」になっていましたので、 常時「CR」ではない可能性があります。今後も調べてみますが、 現状で判っていることをお知らせしておきます。

  2. [おさらい] 前回のプログラム例に含めたprocedure(処理コマンド)

  3. 手始めの集計 : 各変量の性質や分布特性の把握に役立つ統計量
     ドラゴンズの選手データを対象に算出してみよう。前回入力・実行したもの。
    1. プログラム : les1001.sas
       /* Lesson 10-01 */
       /*    File Name = les1001.sas  12/18/18   */
      
      options nocenter linesize=78 pagesize=30;             : 画面出力サイズ指定
      proc printto print = 'Kougi/les1001_results.txt' new; : 計算結果を直接ファイル出力
      
      data dragons;
        infile 'Kougi/Dragons18.csv'
          firstobs=6 dlm=',' dsd missover                   : ファイル特性
          encoding=sjis termstr=crlf;
        input No $ Name : $24. Pos $ DoBY DoBM DoBD         : 読み込む変数(項目)のリスト
              shintyou taijyuu tou $ da $ bikou $;          : 複数行にわたって
      
      proc print data=dragons(obs=20);          : 先頭20ケースを表示
      run;
      proc means data=dragons;                  : 平均値等を算出
      run;
      proc freq data=dragons;                   : 頻度を算出。個々&クロス集計
        table DoBY DoBM tou da tou*da;
      run;
      
      proc chart data=dragons;                  : ヒストグラムを描く
        hbar shintyou;                          : 水平棒グラフ。変量を指定(複数指定も可)。
        vbar shintyou;                          : 垂直棒グラフ。変量を指定(複数指定も可)。
        hbar DoBY;
        vbar DoBY;
      run;
      
      proc univariate data=dragons plot;        : 基礎統計量の算出。plot オプションを指定。
        var shintyou;                           : 指定した変量について
      run;
      

    2. 計算結果の保存
      • [結果タグ]に表示されている計算結果をhtml(左端のアイコン)やPDF(左から2番目のアイコン)に保存する。なお、「proc printto print」で指定した出力(テキストファイル形式)は既に指定したファイルに保存されている。

    3. 出力結果 :
      • html 形式: les1001-results.html
      • pdf 形式: les1001-results.pdf
      • [結果タグ]の印刷出力 pdf 形式: les1001_output.pdf
      • テキストファイル: les1001_results.txt. : 漢字コードがUTF-8で記述されているため、(ブラウザに依るが)そのままだと文字化けする 可能性がある。 このような場合は、複数の漢字コードに対応したエディタ(例: 秀丸エディタ (シェアウェア))で漢字コードを UTF-8 に指定してやると化けずに表示される。

      • [補足] テキストファイル形式で保存された計算結果には、一部で文字位置のズレが発生している。 これはSASシステムが漢字コードをうまくハンドリングできていないからで、 半角文字(英数字)のみの出力については問題ない(勿論計算結果も)。 ズレが気になるようなら、上述の html形式かpdf形式の出力を使えば良いのだが、 しかし、一部の計算結果はテキストファイル形式でしか表示されないものがあり、 悩ましいところである。
                                     2018年12月18日 火曜日 12時35分59秒  56
                                               s
                                               h   t
                                               i   a
                                               n   i            b
                      N              D   D  D  t   j            i
       O              a        P     o   o  o  y   y  t         k
       b N            m        o     B   B  B  o   u  o   d     o
       s o            e        s     Y   M  D  u   u  u   a     u
      
       1 80 森 繁和           監督 1954 11 18   .  .                 
       2 11 小笠原 慎之介     投手 1997 10  8 180 95 左 左         
       3 12 田島 慎二         投手 1989 12 21 181 84 右 右         
       4 13 岩瀬 仁紀         投手 1974 11 10 181 84 左 左         
       5 14 谷元 圭介         投手 1985  1 28 167 72 右 右         
       6 16 又吉 克樹         投手 1990 11  4 181 74 右 右         
       7 17 柳 裕也           投手 1994  4 22 180 85 右 右         
       8 18 鈴木 翔太         投手 1995  6 16 183 75 右 右         
       9 19 吉見 一起         投手 1984  9 19 182 90 右 右         
      10 21 岡田 俊哉         投手 1991 12  5 178 67 左 左         
      11 22 大野 雄大         投手 1988  9 26 183 83 左 左         
      12 24 福谷 浩司         投手 1991  1  9 183 90 右 右         
      13 25 佐藤 優           投手 1993  6 29 187 85 右 左         
      14 28 丸山 泰資         投手 1995  2  5 176 80 右 右         
      15 29 山井 大介         投手 1978  5 10 179 86 右 右         
      16 30 阿知羅 拓馬       投手 1992 11 20 190 95 右 右         
      17 33 祖父江 大輔       投手 1987  8 11 175 80 右 左         
      18 34 福 敬登           投手 1992  6 16 180 88 左 左 7/19 育
      19 40 石川 翔           投手 1999 12 14 179 81 右 左      
      20 41 浅尾 拓也         投手 1984 10 22 182 78 右 右      
      
                                     2018年12月18日 火曜日 12時35分59秒  58
      MEANS プロシジャ
      変数       N          平均    標準偏差       最小値       最大値
      ------------------------------------------------------------------------------
      DoBY        80         1990.13       6.6758112         1954.00         2000.00
      DoBM        80       6.7875000       3.3778645       1.0000000      12.0000000
      DoBD        80      14.4375000       8.3010503       1.0000000      31.0000000
      shintyou    79     180.7215190       5.6157670     167.0000000     201.0000000
      taijyuu     79      84.3797468       8.4963096      65.0000000     117.0000000
      ------------------------------------------------------------------------------
      
                                     2018年12月18日 火曜日 12時35分59秒  59
      FREQ プロシジャ
                                                 累積         累積
      DoBY        度数       パーセント          度数       パーセント
      ------------------------------------------------------------------
      1954           1          1.25                1          1.25     
      1974           1          1.25                2          2.50     
      1977           1          1.25                3          3.75     
      1978           1          1.25                4          5.00     
      1980           1          1.25                5          6.25     
      1981           2          2.50                7          8.75     
      1984           4          5.00               11         13.75     
      1985           3          3.75               14         17.50     
      1986           1          1.25               15         18.75     
      1987           4          5.00               19         23.75     
      1988           5          6.25               24         30.00     
      1989           7          8.75               31         38.75     
      1990           3          3.75               34         42.50     
      1991          10         12.50               44         55.00     
      1992           7          8.75               51         63.75     
      1993           5          6.25               56         70.00     
      1994           7          8.75               63         78.75     
      1995           5          6.25               68         85.00     
      1996           3          3.75               71         88.75     
      1997           2          2.50               73         91.25     
      1998           2          2.50               75         93.75     
      1999           3          3.75               78         97.50     
      2000           2          2.50               80        100.00     
      
                                                 累積         累積
      DoBM        度数       パーセント          度数       パーセント
      ------------------------------------------------------------------
         1           6          7.50                6          7.50     
         2           5          6.25               11         13.75     
         3           6          7.50               17         21.25     
         4           5          6.25               22         27.50     
         5           9         11.25               31         38.75     
         6           5          6.25               36         45.00     
         7           9         11.25               45         56.25     
         8           6          7.50               51         63.75     
         9           7          8.75               58         72.50     
        10           7          8.75               65         81.25     
        11          10         12.50               75         93.75     
        12           5          6.25               80        100.00     
      
                                     2018年12月18日 火曜日 12時35分59秒  61
      FREQ プロシジャ
                                               累積         累積
      tou       度数      パーセント           度数       パーセント
      -----------------------------------------------------------------
      右          64         81.01               64         81.01     
      左          15         18.99               79        100.00     
      
                            Frequency Missing = 1
      
                                               累積         累積
      da        度数      パーセント           度数       パーセント
      --------------------------------------------------------------------
      右          45         56.96               45         56.96     
      左          31         39.24               76         96.20     
      左右         3          3.80               79        100.00     
      
                             Frequency Missing = 1
      
                                     2018年12月18日 火曜日 12時35分59秒  62
      FREQ プロシジャ
      表 : tou * da
      tou             da
      度数           |
      パーセント     |
      行のパーセ     |
      列のパーセ     |右      |左      |左右    | 合計
      ---------------+--------+--------+--------+
      右             |     45 |     16 |      3 |     64
                     |  56.96 |  20.25 |   3.80 |  81.01
                     |  70.31 |  25.00 |   4.69 |
                     | 100.00 |  51.61 | 100.00 |
      ---------------+--------+--------+--------+
      左             |      0 |     15 |      0 |     15
                     |   0.00 |  18.99 |   0.00 |  18.99
                     |   0.00 | 100.00 |   0.00 |
                     |   0.00 |  48.39 |   0.00 |
      ---------------+--------+--------+--------+
      合計                 45       31        3       79
                        56.96    39.24     3.80   100.00
      
      Frequency Missing = 1
      
                                     2018年12月18日 火曜日 12時35分59秒  63
      shintyou                                 累積                    累積
      中間点                             度数  度数  パーセント   パーセント
                 |
         167.5   |*                      2       2     2.53             2.53
                 |
         172.5   |*****                  9      11    11.39            13.92
                 |
         177.5   |**********            19      30    24.05            37.97
                 |
         182.5   |****************      32      62    40.51            78.48
                 |
         187.5   |******                11      73    13.92            92.41
                 |
         192.5   |***                    5      78     6.33            98.73
                 |
         197.5   |                       0      78     0.00            98.73
                 |
         202.5   |*                      1      79     1.27           100.00
                 |
                 -----+----+----+-
                      10   20   30
                       度数
      
                                     2018年12月18日 火曜日 12時35分59秒  64
      度数
         |                           *****
      30 +                           *****
         |                           *****
         |                           *****
         |                           *****
         |                           *****
      20 +                   *****   *****
         |                   *****   *****
         |                   *****   *****
         |                   *****   *****
         |                   *****   *****   *****
      10 +           *****   *****   *****   *****
         |           *****   *****   *****   *****
         |           *****   *****   *****   *****   *****
         |           *****   *****   *****   *****   *****
         |   *****   *****   *****   *****   *****   *****           *****
         --------------------------------------------------------------------
             167.5   172.5   177.5   182.5   187.5   192.5   197.5   202.5
                                  shintyou 中間点
      
                                     2018年12月18日 火曜日 12時35分59秒  65
      DoBY                                    累積                     累積
      中間点                            度数  度数  パーセント      パーセント
             |
      1956   |*                          1       1     1.25             1.25
             |
      1962   |                           0       1     0.00             1.25
             |
      1968   |                           0       1     0.00             1.25
             |
      1974   |*                          1       2     1.25             2.50
             |
      1980   |***                        5       7     6.25             8.75
             |
      1986   |*********                 17      24    21.25            30.00
             |
      1992   |********************      39      63    48.75            78.75
             |
      1998   |*********                 17      80    21.25           100.00
             |
             -----+----+----+----+
                  10   20   30   40
                     度数
      
                                     2018年12月18日 火曜日 12時35分59秒  66
      度数
      40 +                                                   *****
         |                                                   *****
         |                                                   *****
         |                                                   *****
         |                                                   *****
      30 +                                                   *****
         |                                                   *****
         |                                                   *****
         |                                                   *****
         |                                                   *****
      20 +                                                   *****
         |                                           *****   *****   *****
         |                                           *****   *****   *****
         |                                           *****   *****   *****
         |                                           *****   *****   *****
      10 +                                           *****   *****   *****
         |                                           *****   *****   *****
         |                                   *****   *****   *****   *****
         |                                   *****   *****   *****   *****
         |   *****                   *****   *****   *****   *****   *****
         --------------------------------------------------------------------
              1956    1962    1968    1974    1980    1986    1992    1998
                                    DoBY 中間点
      
                                     2018年12月18日 火曜日 12時35分59秒  67
      UNIVARIATE プロシジャ
      変数 :  shintyou
                                  モーメント
      
      N                             79    重み変数の合計            79
      平均                180.721519    合計                        14277
      標準偏差          5.61576697      分散                   31.5368387
      歪度                0.30530917    尖度                   1.68822569
      無修正平方和       2582621        修正済平方和       2459.87342
      変動係数          3.10741466      平均の標準誤差    0.63182315
      
                         基本統計量
              位置                    ばらつき
      平均     180.7215     標準偏差          5.61577
      中央値   181.0000     分散              31.53684
      最頻値   183.0000     範囲              34.00000
                               四分位範囲      7.00000
      
                                     2018年12月18日 火曜日 12時35分59秒  68
      UNIVARIATE プロシジャ
      変数 :  shintyou
                      位置の検定 H0: Mu0=0
       
      検定                   -統計量-    ------p 値-------
      
      Student の t 検定     t  286.0318    Pr > |t|    <.0001
      符号検定              M      39.5    Pr >= |M|   <.0001
      符号付順位検定        S      1580    Pr >= |S|   <.0001
      
         分位点 (定義 5)
       
      水準            分位点
      
      100% 最大値             201
      99%                     201
      95%                     190
      90%                     187
      75% Q3                  184
      50% 中央値              181
      25% Q1                  177
      10%                     174
      5%                      172
      1%                      167
      0% 最小値               167
      
                                     2018年12月18日 火曜日 12時35分59秒  69
      UNIVARIATE プロシジャ
      変数 :  shintyou
                    極値
      --最小値--        --最大値--
       
       値      Obs         値      Obs
      
       167       28         190       33
       167        5         190       76
       170       60         190       79
       172       80         193       34
       172       70         201       67
      
                           欠損値
                                   ---パーセント---
      欠損値    カウント      全体    欠損値
      
              .               1        1.25       100.00
      
                                     2018年12月18日 火曜日 12時35分59秒  70
      UNIVARIATE プロシジャ
      変数 :  DoBY
                                  モーメント
      
      N                             80    重み変数の合計            80
      平均                    1990.125    合計                       159210
      標準偏差              6.67581124    分散                   44.5664557
      歪度                  -2.2732516    尖度                   10.0368832
      無修正平方和           316851322    修正済平方和              3520.75
      変動係数              0.33544683    平均の標準誤差         0.74637839
      
                         基本統計量
                位置                    ばらつき
      平均     1990.125     標準偏差           6.67581
      中央値   1991.000     分散              44.56646
      最頻値   1991.000     範囲              46.00000
                               四分位範囲      6.00000
      
                                     2018年12月18日 火曜日 12時35分59秒  71
      UNIVARIATE プロシジャ
      変数 :  DoBY
                      位置の検定 H0: Mu0=0
       
      検定                   -統計量-    ------p 値-------
      
      Student の t 検定     t  2666.375    Pr > |t|    <.0001
      符号検定              M        40    Pr >= |M|   <.0001
      符号付順位検定        S      1620    Pr >= |S|   <.0001
      
         分位点 (定義 5)
       
      水準            分位点
      
      100% 最大値            2000
      99%                    2000
      95%                    1999
      90%                    1997
      75% Q3                 1994
      50% 中央値             1991
      25% Q1                 1988
      10%                    1984
      5%                     1979
      1%                     1954
      0% 最小値              1954
      
                                     2018年12月18日 火曜日 12時35分59秒  72
      UNIVARIATE プロシジャ
      変数 :  DoBY
                     極値
      ---最小値--        ---最大値--
        値      Obs          値      Obs
      
       1954        1         1999       19
       1974        4         1999       24
       1977       45         1999       44
       1978       15         2000       28
       1980       36         2000       68
      
                                     2018年12月18日 火曜日 12時36分00秒  73
      UNIVARIATE プロシジャ
      変数 :  shintyou
                                  モーメント
      
      N                             79    重み変数の合計                 79
      平均                  180.721519    合計                        14277
      標準偏差              5.61576697    分散                   31.5368387
      歪度                  0.30530917    尖度                   1.68822569
      無修正平方和             2582621    修正済平方和           2459.87342
      変動係数              3.10741466    平均の標準誤差         0.63182315
      
                         基本統計量
                位置                    ばらつき
      平均      180.7215     標準偏差         5.61577
      中央値   181.0000     分散              31.53684
      最頻値   183.0000     範囲              34.00000
                               四分位範囲      7.00000
      
                                     2018年12月18日 火曜日 12時36分00秒  74
      UNIVARIATE プロシジャ
      変数 :  shintyou
                      位置の検定 H0: Mu0=0
      検定                   -統計量-    ------p 値-------
      
      Student の t 検定     t  286.0318    Pr > |t|    <.0001
      符号検定              M      39.5    Pr >= |M|   <.0001
      符号付順位検定        S      1580    Pr >= |S|   <.0001
      
         分位点 (定義 5)
       
      水準            分位点
      
      100% 最大値             201
      99%                     201
      95%                     190
      90%                     187
      75% Q3                  184
      50% 中央値              181
      25% Q1                  177
      10%                     174
      5%                      172
      1%                      167
      0% 最小値               167
      
                                     2018年12月18日 火曜日 12時36分00秒  75
      UNIVARIATE プロシジャ
      変数 :  shintyou
                    極値
      --最小値--        --最大値--
       
       値      Obs         値      Obs
      
       167       28         190       33
       167        5         190       76
       170       60         190       79
       172       80         193       34
       172       70         201       67
      
                           欠損値
                                   ---パーセント---
      欠損値    カウント      全体    欠損値
              .               1        1.25       100.00
      
                                     2018年12月18日 火曜日 12時36分00秒  76
      UNIVARIATE プロシジャ
      変数 :  shintyou
      
          幹 葉                      #  Boxplot
          200 0                        1     0
          198
          196
          194
          192 0                        1     |
          190 0000                     4     |
          188                                |
          186 000                      3     |
          184 000000000000            12  +-----+
          182 000000000000000         15  |     |
          180 0000000000000           13  *--+--*
          178 000000000                9  |     |
          176 00000000                 8  +-----+
          174 000000                   6     |
          172 0000                     4     |
          170 0                        1     |
          168                                |
          166 00                       2     |
              ----+----+----+----+
      
                                     2018年12月18日 火曜日 12時36分00秒  77
      UNIVARIATE プロシジャ
      変数 :  shintyou
                            正規確率プロット
           201+                                                 *
              |
              |
              |                                                 ++
              |                                             *+++
              |                                        ****++
              |                                      ++++
              |                                   ++***
              |                               *******
              |                          ******
              |                      *****+
              |                   ****+
              |                ****+
              |            ****+
              |        ****++
              |      +*++
              |   +++
           167++*+  *
               +----+----+----+----+----+----+----+----+----+----+
                   -2        -1         0        +1        +2
      
    4. 算出統計量の説明 : 分布形状を把握するのに利用
      • Variable : 変量名
      • N : サンプルサイズ、測定個数
      • Mean : 平均、μで示すことが多い
        • 加重和をサンプル数で割ったもの
      • Std Dev : 標準偏差(Standard Deviation)、σで示すことが多い
        • ばらつきを示す指標、正規分布の場合、3σにほぼ全数が含まれる(99.7%)。
      • Variance : 分散、標準偏差の二乗
        • σとならんで、ばらつきを示す指標
      • Minimum & Maximum : 最小値(Min)と最大値(Max)
      • Quantiles : 四分位数
        • 下位から、0%点(Q0、最小値)、25%点(Q1)、50%点(Q2、Median、中央値、中位数)、75%点(Q3)、100%点(Q4 最大値) .
      • 範囲(Range) : 最大値(Max)-最小値(Min)
      • 四分偏差 : Q3-Q1
      • Mode : 最頻値(SAS では、複数の最頻値がある場合はその中の最小値が表示される)
      • Extremes : 最上位と最下位の数サンプル
        • 端点、異常値の検出に使う
      • Stem Leaf : 樹葉図、Stem and Leaf
        • 頻度分布、樹木になぞらえて。頻度だけでなく構成値も解る
        • 時刻表にも似ている
      • Histogram : 度数分布。

      • Box Plot : 箱髭図
        • 分布形状を見る。異常値の検出にも。
        • 箱 : 下端、横線、上端は、それぞれ 25%点(Q1)、50%点(Q2、Median、中央値、中位数)、75%点(Q3)。
        • ひし形(◇) は平均値。
        • 髭 : 箱からの距離が、1.5x[四分偏差] の範囲内にあるサンプルまで伸ばされる。
        • 髭の外側にサンプルがある場合、o(3.0x[四分偏差] の範囲内) や *(それより外側) で表示。異常値の可能性。
      • Normal Probability Plot : 正規確率プロット
        • 分布が正規分布かどうかを確かめる
        • 斜め右上がりの直線が基準線、oが対象データ。ずれていると正規性が疑われる。

    5. [Lesson 11-1] Stem and Leaf や Histogram 上における各統計量の位置を確認せよ。

    6. 知見 : 解析によって判ったこと & 解ったこと
      • ドラゴンズ選手データにおける「身長」について観てみると、
        • 公表されている選手人数は80名である。
        • 167cmから 201cmの間に散らばっており、幅(Range)は 34cmである。
        • 四分位偏差(Interquartile Range)でみると 7cmである。
        • 平均値(Mean)は 181cm、中央値は 181cm、最頻値は 183cmである。
        • またばらつきの指標である標準偏差(Std Deviation)は 6cm である。
        • 頻度分布を見るとほぼ対称の分布になっていることが判る。
        • そのことは箱髭図や正規確率プロットからも判る。

        • Mode(最頻値) の表示は少し注意が必要 (SAS の場合)

  4. 「平均」とは? : 中間? 真ん中? 代表値? 大体の目安? ...

    貯蓄現在高 階級別世帯分布 (二人以上の世帯)
    グラフ 貯蓄現在高回級別世帯分布(二人以上の世帯) H18

    分布形状と統計量

  5. [おさらい] 計算結果を利用した報告書の作成手順
     報告書(レポート)を作成するような場合、いちいち書き移すようなことはせず、 SAS の「計算結果」を引用すると簡単でかつ間違いが減り好都合である。 そのためには、「計算結果」をファイルに保存した計算結果を 手元のPCにダウンロードして、編集するのが良いであろう。
     ただし、報告書には計算結果は全部を引用するのではなく、 必要部分だけを切り出し、それぞれに説明を付与する事によって完成するのが、 受け取った人に無駄な労力を払わせずに好印象を持たれると思う。

    1. データを電子化する : Excelで ===> 前回 第4節
    2. データファイルをSASに転送する(アップロード) ===> 前回 第5節
    3. データをファイルから読み込むように SAS プログラムを記述する ===> 前回 第6節
    4. 便利なコマンド ===> 前回 第7節
    5. これらを反映させたサンプルプログラム ===> 前回 第8節
    6. 計算結果の保存
      • [結果タグ]に表示されている計算結果をhtml(左端のアイコン)やPDF(左から2番目のアイコン)に保存する。なお、「proc printto print」で指定した出力(テキストファイル形式)は既に指定したファイルに保存されている。
    7. ファイルに保存された計算結果を手元のPCにダウンロードする。
      • データ転送と同様に、Navigation Pane(画面左側)で ダウンロードしたいファイルの存在するディレクトリを選択後、 ダウンロードしたいファイルの上で右クリックして「Download File」を選択すると、 手元のPCにファイルがダウンロードされる。
    8. SAS を終了する。
    9. ダウンロードした出力結果を参照しながらワープロやエディタを使って、 レポートを作成する。出力の必要部分だけを切り出して、報告書に引用する。 その際に、有効桁数等には注意して利用せよ。
       なお、PDF の一部を切り出すことが困難な場合は、別添資料として レポートの後ろに添付して下さい。
    10. 電子メール(メール本文に挿入。もしくは添付ファイル)で提出する。

  6. [演習1] 上記の例では頻度集計(freq)にtou やda等の 名義尺度変量(離散変量)を使って集計したが、 shintyou やtaijyuu等の連続変量(数値変量)を使っても実行できる。 その際の出力はどのようになるかを予想し、その後実際に実行してみよ。 出力結果は何を表現し、また、予想は正しかったか?
                                   2019年 1月 8日 火曜日 13時38分28秒  98
    FREQ プロシジャ
                                                   累積         累積
    shintyou        度数       パーセント          度数      パーセント
    ----------------------------------------------------------------------
         167           2          2.53                2          2.53     
         170           1          1.27                3          3.80     
         172           2          2.53                5          6.33     
         173           2          2.53                7          8.86     
         174           4          5.06               11         13.92     
         175           2          2.53               13         16.46     
         176           3          3.80               16         20.25     
         177           5          6.33               21         26.58     
         178           3          3.80               24         30.38     
         179           6          7.59               30         37.97     
         180           7          8.86               37         46.84     
         181           6          7.59               43         54.43     
         182           6          7.59               49         62.03     
         183           9         11.39               58         73.42     
         184           4          5.06               62         78.48     
         185           8         10.13               70         88.61     
         187           3          3.80               73         92.41     
         190           4          5.06               77         97.47     
         193           1          1.27               78         98.73     
         201           1          1.27               79        100.00     
    
                             Frequency Missing = 1
    

  7. 頻度集計(連続変量の場合) : 度数の把握、クロス表

    1. プログラム : Lesson 11-2 : les1102.sas
       /* Lesson 11-02 */
       /*    File Name = les1102.sas  01/08/19   */
      
      options nocenter linesize=78 pagesize=30;
      proc printto print = 'Kougi/les1102_results.txt' new;
      
      data dragons;
        infile 'Kougi/Dragons18.csv'
          firstobs=6 dlm=',' dsd missover 
          encoding=sjis termstr=crlf;
        input No $ Name : $24. Pos $ DoBY DoBM DoBD
              shintyou taijyuu tou $ da $ bikou $;
      
      proc format;                           : 階級を作る。class shintyou の意
        value clshint  low-<170='   -170'    : 階級の定義 1
                       170-<175='170-175'    :            2
                       175-<180='175-180'    :            3
                       180-<185='180-185'    :            4
                       185-<190='185-190'    :            5
                       190-<195='190-195'    :            6
                       195-<200='195-200'    :            7
                       200-high='200-   '    :            8
                       other   ='missing';   :            9
      run;                                   :
      
       <<< 中略 >>> 
      
      proc freq data=dragons;                :
        table shintyou;                      : 変量の指定(1変量の場合)
        table shintyou*tou;                  : 変量の指定(2変量の場合)
        format shintyou clshint.;            : 連続変量をグループ化することの指定
      run;                                   :
      

    2. 出力
                                     2019年 1月 8日 火曜日 13時58分44秒 240
      FREQ プロシジャ
                                                     累積         累積
      shintyou        度数       パーセント          度数      パーセント
      ----------------------------------------------------------------------
          -170           2          2.53                2          2.53     
       170-175           9         11.39               11         13.92     
       175-180          19         24.05               30         37.97     
       180-185          32         40.51               62         78.48     
       185-190          11         13.92               73         92.41     
       190-195           5          6.33               78         98.73     
       200-              1          1.27               79        100.00     
      
                               Frequency Missing = 1
      
                                     2019年 1月 8日 火曜日 13時58分44秒 241
      FREQ プロシジャ
      表 : shintyou * tou
      shintyou        tou
      度数           |
      パーセント     |
      行のパーセ     |
      列のパーセ     |右      |左      | 合計
      ---------------+--------+--------+
         -170        |      2 |      0 |      2
                     |   2.53 |   0.00 |   2.53
                     | 100.00 |   0.00 |
                     |   3.13 |   0.00 |
      ---------------+--------+--------+
      170-175        |      8 |      1 |      9
                     |  10.13 |   1.27 |  11.39
                     |  88.89 |  11.11 |
                     |  12.50 |   6.67 |
      ---------------+--------+--------+
      175-180        |     16 |      3 |     19
                     |  20.25 |   3.80 |  24.05
                     |  84.21 |  15.79 |
                     |  25.00 |  20.00 |
      ---------------+--------+--------+
      180-185        |     25 |      7 |     32
                     |  31.65 |   8.86 |  40.51
                     |  78.13 |  21.88 |
                     |  39.06 |  46.67 |
      ---------------+--------+--------+
      185-190        |      8 |      3 |     11
                     |  10.13 |   3.80 |  13.92
                     |  72.73 |  27.27 |
                     |  12.50 |  20.00 |
      ---------------+--------+--------+
      190-195        |      4 |      1 |      5
                     |   5.06 |   1.27 |   6.33
                     |  80.00 |  20.00 |
                     |   6.25 |   6.67 |
      ---------------+--------+--------+
      200-           |      1 |      0 |      1
                     |   1.27 |   0.00 |   1.27
                     | 100.00 |   0.00 |
                     |   1.56 |   0.00 |
      ---------------+--------+--------+
      合計                 64       15       79
                        81.01    18.99   100.00
      
      Frequency Missing = 1
      

  8. サンプルデータ: 学生のアンケートデータ(all08c_sjis.csv)

  9. [演習2] 前項で示したデータに対して、 幾つかの集計を試してみよ。

  10. 次回は、... : 01月15日 16:20
[DIR]講義のホームページへ戻ります