Chapter 2 Rとはなにか?

2.1 R?

  •  R は統計、データ分析、作図のためのインタープリタープログラミング言語

  • 統計やデータ分析を行うアプリ

    • 他にはSPSS, Stata
    • Pythonもよく使われる

2.2 Excelじゃだめなのか

  • Excel は表計算ソフトで多くの機能を有している

  • Excelでできること

    • 計算する
    • 図を描く
    • 基本的な統計分析
  • ではExcelではだめなのか?

    • Excelでも最低限のことはできますが、分析が複雑になっていくと手数も増えていきます。
    • 特に、Excelだと同じことをもう一度やる(データを変えて同じ分析をする、など)がやりにくく、ミスも起きやすくなります。
    • 本当に初歩の初歩ならエクセルで十分ですが、ある程度の実証分析をやろうと思うとRなどを学ぶほうが回り道のようで結局早い

2.3 Rのよいところ

  • 無料
  • 多くにプラットフォーム(MacOS, Windows, Linux)で使用可能
  • たくさんの資料がネット上に存在する
  • 分析結果をプレゼンテーションするツールが充実している
  • Rstudio: 統合開発環境(IDE)
  • 豊富なパッケージ
    • 多くのエンジニアや研究者が公開

2.4 例えばRでできること:図表

Rでは、柔軟に図表を描くことができます。例えば以下の図は、武蔵大学のウェブサイトに公開されている学生数のデータを描画したものです。少しやり方を学べば、以下のような図を簡単に作成することができます。

2.5 例えばRでできること:ウェブアプリ

Rではインタラクティブなウェブアプリも作ることができます。以下の例は、数値をユーザーが変えることで結果のグラフが変化して表示される簡単なウェブアプリです。

2.6 例えばRでできること:ウェブスクレイピング

2.7 地図の分析・活用

2.8 Rの欠点

  • Rは進化が速い
  • 処理が比較的遅い
    • 一般的なデータ分析をするのには問題がない
    • Excelよりは速い
    • ビッグデータや複雑な統計モデルを走らせると、遅かったりメモリ消費が激しい
  • CUIなので、最初の学習が難しい

2.9 CUIとGUI

  • CUI: Character User Interface
    • 命令を文字で行う(キーボードを使う)操作環境
  • GUI: Graphic User Interface
    • マウスでクリックしながら使う操作環境

2.9.1 GUIの方が楽?

  • GUIの方が楽では?
    • マウスで操作ができる方がよさそう?
  • CUIは記録ができる
    • 何度も同じ操作ができる
    • 人が書いた一連の操作(コード)をコピー・参考にできる
    • 柔軟性が高い
  • Rを使う統合環境であるRStudioは、CUIながらGUI的に作業を行える部分もある環境を提供する。

2.10 プログラミング

  • やることはプログラミング
  • PythonもJavaも、まずはプログラミングを理解すると学べるようになる
  • Rは比較的わかりやすい言語
  • ゼミでは基本的なデータ描画と統計分析をできるようになることが目標