基礎統計量、分析結果のダウンロード、ヒストグラム、頻度集計

統計モデル解析特論I/II : 第11回 (12/21/21)

  前回は9節まで終えたので、今週はその続きを行う(節番号は振り直した)。 統計処理をする場合に手始めに行うべき処理としての幾つかの方法を 理解してもらうと共に、出力結果の利用方法を紹介する。 加えて、グループごとの集計方法を習得する。
  1. 先週のショート課題: 9名

  2. 今後のことを考えて3つの便利なコマンドを紹介しておく

  3. 基礎統計量

  4. 「平均」の意味するもの : 中間? 真ん中? 代表値? 大体の目安? ...

    貯蓄現在高 階級別世帯分布 (二人以上の世帯)
    グラフ 貯蓄現在高回級別世帯分布(二人以上の世帯) H18

    分布形状と統計量

  5. 計算結果を活用した報告書・レポートの作成手順
     報告書(レポート)を作成するような場合、いちいち画面を書き移すようなことはせず、 SAS の「計算結果」を引用すると簡単でかつ間違いが減り好都合である。 そのためには、「計算結果」をファイルに保存した計算結果を 手元のPCにダウンロードして、編集するのが良いであろう。
     ただし、報告書には計算結果は全部を引用するのではなく、 必要部分だけを切り出し、それぞれに説明を付与する事によって完成するのが、 受け取った人に無駄な労力を払わせずに好印象を持たれると思う。

    1. データを電子化する : Excelで ===> 前回 第7節
    2. データファイルをSASに転送する(アップロード) ===> 前回 第8節
    3. データをファイルから読み込むように SAS プログラムを記述する ===> 前回 第9節
    4. 便利なコマンド ===> 今回 第1節
    5. これらを反映させたサンプルプログラム ===> 今回 第2節
    6. 計算結果の保存
      • [結果タグ]に表示されている計算結果をhtml(左端のアイコン) に保存する。もしくは、PDFファイルに保存すべくプリンタのアイコン(左から5番目のアイコン)を用いて保存する。 また、プログラムの最初のところで指定した「proc printto print」による出力(テキストファイル形式)は、指定したファイルに保存されている。
    7. ファイルに保存された計算結果を手元のPCにダウンロードする。
      • データ転送の時と同様に、Navigation Pane(画面左側)で ダウンロードしたいファイルの存在するディレクトリを選択後、 ダウンロードしたいファイルの上で右クリックして「Download File」を選択すると、 手元のPCにファイルがダウンロードされる。 同様の作業はNavigation Pane上部の「下矢印アイコン」でも指定することが可能である。
    8. SAS を終了する。
    9. ダウンロードした出力結果を参照しながらワープロやエディタを使って、 レポートを作成する。出力の必要部分だけを切り出して、報告書に引用する。 その際に、有効桁数等には注意して利用せよ。
       なお、PDF の一部を切り出すことが困難な場合は、別添資料として レポートの後ろに添付して下さい。
    10. 完成したレポートのファイル(WordやPDF等)をMoodleから提出する。

  6. ヒストグラムと頻度集計

  7. [演習2] 上記の例では頻度集計(freq)にtou やda等の 名義尺度変量(離散変量)を使って集計したが、 shintyou やtaijyuu等の連続変量(数値変量)を使っても実行できる。 その際の出力はどのようになるかを予想し、その後実際に実行してみよ。 出力結果は何を表現し、また、予想は正しかったか?

  8. 頻度集計(連続変量の場合) : 度数の把握、クロス表

    1. プログラム : Lesson 11-4 : les1104.sas
       /* Lesson 11-04 */
       /*    File Name = les1104.sas  12/21/21   */
      
      options nocenter linesize=78 pagesize=30;
      options locale='en_US';
      /* options locale='ja_JP'; */
      proc printto print = 'StatM21/les1104-Results.txt' new;
      
      data dragons;
        infile 'StatM21/Dragons21.csv'
          firstobs=8 dlm=',' dsd missover 
          encoding=sjis termstr=crlf;
        input No $ Name : $24. Pos $ DoBY DoBM DoBD
              shintyou taijyuu tou $ da $ bikou $;
      
      proc format;                           : 階級を作る。class shintyou の意
        value cl_shin  low-<170='   -170'    : 階級の定義 1
                       170-<175='170-175'    :            2
                       175-<180='175-180'    :            3
                       180-<185='180-185'    :            4
                       185-<190='185-190'    :            5
                       190-<195='190-195'    :            6
                       195-<200='195-200'    :            7
                       200-high='200-   '    :            8
                       other   ='missing';   :            9
      run;                                   :
      
      proc freq data=dragons;                :
        table shintyou;                      : 変量の指定(1変量の場合)
        table shintyou*tou;                  : 変量の指定(2変量組み合わせの場合)
        format shintyou cl_shin.;            : 連続変量をグループ化することの指定
      run;                                   :
      
      

    2. 出力
      
       <<< 前略 >>> 
                                           Monday, December 20, 2021 07:15:51 PM  28
      The FREQ Procedure
                                           Cumulative    Cumulative
      shintyou    Frequency     Percent     Frequency      Percent
      -------------------------------------------------------------
          -170           2        2.56             2         2.56  
       170-175           3        3.85             5         6.41  
       175-180          26       33.33            31        39.74  
       180-185          32       41.03            63        80.77  
       185-190          12       15.38            75        96.15  
       190-195           3        3.85            78       100.00  
      
                                           Monday, December 20, 2021 07:15:51 PM  29
      The FREQ Procedure
      Table of shintyou by tou
      shintyou     tou
      Frequency|
      Percent  |
      Row Pct  |
      Col Pct  |右      |左      |  Total
      ---------+--------+--------+
         -170  |      2 |      0 |      2
               |   2.56 |   0.00 |   2.56
               | 100.00 |   0.00 |
               |   3.28 |   0.00 |
      ---------+--------+--------+
      170-175  |      3 |      0 |      3
               |   3.85 |   0.00 |   3.85
               | 100.00 |   0.00 |
               |   4.92 |   0.00 |
      ---------+--------+--------+
      Total          61       17       78
                  78.21    21.79   100.00
      (Continued)
      
                                           Monday, December 20, 2021 07:15:51 PM  30
      The FREQ Procedure
      Table of shintyou by tou
      shintyou     tou
      Frequency|
      Percent  |
      Row Pct  |
      Col Pct  |右      |左      |  Total
      ---------+--------+--------+
      175-180  |     19 |      7 |     26
               |  24.36 |   8.97 |  33.33
               |  73.08 |  26.92 |
               |  31.15 |  41.18 |
      ---------+--------+--------+
      180-185  |     25 |      7 |     32
               |  32.05 |   8.97 |  41.03
               |  78.13 |  21.88 |
               |  40.98 |  41.18 |
      ---------+--------+--------+
      Total          61       17       78
                  78.21    21.79   100.00
      (Continued)
      
                                           Monday, December 20, 2021 07:15:51 PM  31
      The FREQ Procedure
      Table of shintyou by tou
      shintyou     tou
      Frequency|
      Percent  |
      Row Pct  |
      Col Pct  |右      |左      |  Total
      ---------+--------+--------+
      185-190  |      9 |      3 |     12
               |  11.54 |   3.85 |  15.38
               |  75.00 |  25.00 |
               |  14.75 |  17.65 |
      ---------+--------+--------+
      190-195  |      3 |      0 |      3
               |   3.85 |   0.00 |   3.85
               | 100.00 |   0.00 |
               |   4.92 |   0.00 |
      ---------+--------+--------+
      Total          61       17       78
                  78.21    21.79   100.00
      

  9. [演習3] 上記の例では身長について、階級ごとの頻度を調べた。 では、これを参考に体重についても調べてみよ。

  10. ここまでに紹介したprocedure(処理コマンド)

  11. 今後は...

  12. [練習問題] 先週紹介した 都道府県の人口・面積・人口密度 を参考に、データを電子化(CSV化)後、ファイルから読み込んで分析(平均値等)してみよ。

  13. 今週のショート課題 & アンケート: 金曜日(24日)昼までに

  14. [再掲] 興味のあるデータを電子化して持参せよ。

  15. 次回は、... : 01月11日(火) 16:20-17:50 @2311教室【対面講義? or リモート講義?】


  16. 【発展】 皆さんの体格・小遣いデータを分析してみよう