R言語とは?
R言語は、データ処理や統計解析用のプログラム言語です。誰でも無料で利用できます。 wikiで調べるといろいろ詳しく書かれていますが、こちらで( R言語 あーるげんご(Hatena) )シンプルに説明されています。 R言語とは? データ処理、統計解析、可視化のための言語及び環境 オープンソースソフトウェア フリーソフトだが高機能 統計手法のほとんどを簡単なコマンドで利用できる 足りない機能はパッケージで容易に補完できる パッケージを自作することも可能 また、私自身がRを多用する理由としては、 大規模データもdata.tableやdplyr等のパッケージを利用することで高速に処理可能 であるためです。これらのパッケージの登場により、大容量のcsvファイルを以前の10倍以上の速度で読み込めたり、SQLのようなデータ処理が可能となりました。data.tableやdplyrについては、下記のサイトが参考になります。 大規模データの高速処理 ーdata.table、dplyrー SQLでお馴染みの外部結合等の簡単な例はこちらです。 R 外部結合(left join, right join) 大規模データの処理が求められる昨今、Rでデータ分析するにはdata.tableやdplyrが欠かせません。これらのパッケージを使いこなすことが、Rを実務で使う上で必須となりつつあります。そのため、様々な統計解析のコマンドを覚える前に、まずは、data.tableやdplyrをマスターすることが良いでしょう。 Rのインストールから外部結合を最短で体験したい方はこちらです。 【R:最速入門】インストールから外部結合までを30分以内で!?