データの転送とレポート作成

情報処理H : 第4回目(10/25/96)




  1. データ転送(送信)

    Lesson 4-1: ファイルの転送: Windows ===> stat システム(UNIX)
    • データはstat システムにある SAS で解析する
    • データがWindows(パソコン)側にある場合、stat システムに転送する必要がある
    • データはパソコンで入力する方が便利であろう : Excel 等を使う
    • Excel を使った場合、「テキストファイル(スペース区切り)で保存」すること
    • 表形式で入力。縦:ケース、横:変量

    1. セミナー用テキストのPage 6〜9を参照 : 「ftp stat-system」

    2. 転送するファイルは、皆さんのアンケートの一部: 性別、身長、体重、胸囲。

    3. [補足] データファイル中、ピリオドは欠測値(欠損値)を表わす。データ採取は難しい!!

  2. データが追加されたり、別クラスのデータを解析したくなったら??

    : データをファイルから読み込んで処理しよう

    Lesson 4-2: 皆さんの 性別、身長、体重、胸囲データ(gakusei1.dat) をファイルから読み込んで各変量の平均を求めよう

    1. 新しいプログラムを作る時にはまず消去

      プログラムウインドウのコマンド行で : [入力] clear

    2. プログラム : anke02.sas

       /* Lesson 4-2 */                              :
       /*    File Name = anke02.sas   10/25/96   */  :
                                                     :
      data gakusei;                                  :
        infile 'gakusei1.dat';                       : ファイル名の指定
        input seibetsu $ shintyou taijyuu kyoui;     : 変量名、型
                                                     :
      proc print data=gakusei;                       :
      run;                                           :
      proc means data=gakusei;                       : 平均、分散、最大最小値の算出
      run;                                           :
      
    3. 出力結果 : anke02.out

    4. プログラムの保存: プログラムウインドウのコマンド行で : [入力] file 'anke02.sas'

    5. 演習 : Lesson 4-3 : 上記データの基礎統計量を求めてみよう : プログラム : anke03.sas

  3. 特定の変数の解析 : 変量が多くて出力が多くなり過ぎるような場合

    [例] Lesson 4-4 : 変数群の中から身長のみを計算対象とする : プログラム : anke04.sas

    proc univariate data=gakusei;              : 基礎統計量の算出
       var shintyou;                           : 身長について
    run;                                       : 
    
  4. 性別ごとの分析 : 男性だけの、女性だけの。より性質がはっきりする。

      : ある特性ごとにグルーピングして解析
      : 身長について男女で差があるか?

    1. 上記プログラムを修正 : プログラム : Lesson 4-5 : anke05.sas

       /* Lesson 4-5 */
       /*    File Name = anke05.sas   10/25/96   */
      
      data gakusei;
        infile 'gakusei1.dat';
        input seibetsu $ shintyou taijyuu kyoui;
      
      proc print data=gakusei;
      run;
      proc means data=gakusei;                   : 平均、分散、最大最小値の算出
         var shintyou;                           : 身長について
      run;                                       :
      proc sort data=gakusei;                    : 並べ替え(ソート)
         by seibetsu;                            : 性別ごとに
      run;                                       : 
      proc means data=gakusei;                   : 平均、分散、最大最小値の算出
         var shintyou;                           : 身長について
         by seibetsu;                            : 性別ごとに
      run;                                       : 
      
    2. 出力結果 : anke05.out

    3. プログラムの保存: プログラムウインドウのコマンド行で : [入力] file 'anke05.sas'

    [テクニック] 層を分けて分析する場合は、事前に並べ替えが必要

  5. 出力結果の保存 : アウトプットウインドウの内容をファイルに保存

    解析結果を保存しておくため。印刷、レポート、...

    1. プログラムを実行(SUBmit)する前に、アウトプットウインドウの過去の記録を消去しておく

      : [入力] clear
      この処理をしておかないと、過去の全ての記録が全部保存される

    2. 出力結果の保存: アウトプットウインドウのコマンド行で : [入力] file 'anke05.out'
      プログラムの保存と同じコマンドだが、保存対象が異なる

  6. データ転送(受信)

    • 出力結果やプログラムを印刷したいが、stat システムのは印刷機能がない
    • 出力結果を取り込んで容易にレポートを書きたい
    • 画面に表示された結果を手で書き写して入力なんてヤダ!!

    Lesson 4-6: ファイルの転送: stat システム(UNIX) ===> Windows

    1. 出力結果を自分のパソコンに持ってくる(Lesson 4-1 の逆)

    2. 転送するファイルは、先ほどの出力結果ファイル anke05.out

      • 転送元 : 各自の stat システムのディレクトリにある anke05.out

      • 転送先 : H ドライブ(一時的な利用のためのドライブ。電源断とともに消える。

      • 転送モードは「ASCII」を選択

  7. パソコン(Windows)との連携 : レポート作成、印刷

    • 転送してきたファイルを Microsoft Word (利用ガイドのPage 29に簡単な紹介あり)に読み込んで、適宜説明を加えたり、考察を書いたり、体裁を整えたりする。
    • 保存の形式は Word 形式が後々便利。フォントサイズ等の体裁も保存されるから。
    • 印刷も行える。
    • データやレポートファイルを持って帰る : FD や MO が必要

  8. 演習 : データ数がある程度多い方が興味深い結果が得られやすいので。

    Lesson 4-7: ある大学の 性別、身長、体重、胸囲、小遣い額、自宅/下宿の別、大学コード データ(some.dat) について各変量の平均を求めよう

    Lesson 4-8: 各変量の平均等を、「性別による違い」、「自宅/下宿による違い」、について求め、おもしろい関係を見つけることができるか?

  9. 次回は、...
    • より細かなグルーピング : 男性で自宅生、女性で下宿生。より一層性質がはっきりする。
    • 分布形状の把握、...
    [DIR]講義のホームページへ戻ります