ビッグデータの解析に欠かせないRとは

ビッグデータの解析に欠かせないRとは

ビッグデータの活用が人々の暮らしを豊かにする!として国を挙げてビッグデータの活用が目立ってきています。2016年度にはビッグデータに関する資格制度が創設される話題もあり、web開発者やアプリ開発者にとってもこの動きは無視できないものとなっています。そこで今回はビッグデータの解析に定評のある統計ソフト Rについて触れてみたいと思います。

目次
  1. ビッグデータの解析に欠かせないRとは
  2. Rとは
  3. Rとエクセル
  4. Rの導入方法
  5. R-tips
  6. まとめ

ビッグデータの解析に欠かせないRとは

Rとは

R とは統計ソフトの一種であり、ニュージーランドのオークランド大学の先生方によって開発され、1993年にリリースされています。
R は、エクセルや Google スプレッドシートと違って プログラミング言語 R を入力することによって統計結果を出力します。R 言語に限らず、C や C++、Java、.NET、Python などのプログラミング言語とも並行できることから、データ解析の上級者に活用されています。また JSON ファイルや SPSS ファイルなど読み込み可能なデータファイルが多いことも R の特徴といえます。
現在では100万行を超えるようなビッグデータの解析に、R は有効利用できるとして注目されています。

Rとエクセル

統計ソフトの代名詞「Excel」とRを比較して、それぞれのメリット・デメリットを確認したいと思います。

col 1 col 2 col 3
R Excel
統計実行方法 R 言語 関数制御
読込ファイル JSON、Excel など多数 Excel、xml
ライセンス GNU General Public License(無料) Trialware(有料)
処理速度 早い 普通
グラフィック性 高い 普通
操作性 ×
web・アプリとの連携
回帰分析
時系列分析
決定木分析 ×
階層クラスター ×

Rはスクリプトを実行することによって膨大なデータも瞬時に計算・アウトプットしてくれます。その特性からwebやアプリでビッグデータを活用する時に役立ちます。

Rを用いたサービスの一例

売り場面積別のニューヨーク州にあるスーパーの紹介 r-map

ZevRoss

Rの導入方法

Rを利用する方法は主に以下の3つのパターンがあります。
お勧めは、IDE 化されている RStudio でしょう。各サイトにアクセスし、ソフトをインストールすると無料で利用できます。
OS も Windows、OS X、Ubuntu に対応しています。

 

  • R

r-sample

https://www.r-project.org/ 62.3MB
R の公式ソフトウェア。

 

  • R Studio

rstudio

https://www.rstudio.com/ 73.9MB
RStudio 社によって開発された R 専用 IDE(総合開発環境)。$ 995 /年からのプロ版もあり。

 

R-tips

R学習で参考になるサイトをご紹介します。

まとめ

いかがでしたでしょうか?こうしてブログを書いている途中にも Microsoft 社がビッグデータ・ソフトを開発する Revolution Analytics 社を買収し、 Microsoft R Server をリリースすると発表しています。2016年はR、R言語が注目される年になるかもしれませんね。

オシママサラ
ライター
オシママサラ

関連記事