- 更新日: 2017年03月14日
- 公開日: 2016年02月18日
ビッグデータの解析に欠かせないRとは
ビッグデータの活用が人々の暮らしを豊かにする!として国を挙げてビッグデータの活用が目立ってきています。2016年度にはビッグデータに関する資格制度が創設される話題もあり、web開発者やアプリ開発者にとってもこの動きは無視できないものとなっています。そこで今回はビッグデータの解析に定評のある統計ソフト Rについて触れてみたいと思います。
ビッグデータの解析に欠かせないRとは
Rとは
R とは統計ソフトの一種であり、ニュージーランドのオークランド大学の先生方によって開発され、1993年にリリースされています。
R は、エクセルや Google スプレッドシートと違って プログラミング言語 R を入力することによって統計結果を出力します。R 言語に限らず、C や C++、Java、.NET、Python などのプログラミング言語とも並行できることから、データ解析の上級者に活用されています。また JSON ファイルや SPSS ファイルなど読み込み可能なデータファイルが多いことも R の特徴といえます。
現在では100万行を超えるようなビッグデータの解析に、R は有効利用できるとして注目されています。
Rとエクセル
統計ソフトの代名詞「Excel」とRを比較して、それぞれのメリット・デメリットを確認したいと思います。
col 1 | col 2 | col 3 |
---|---|---|
R | Excel | |
統計実行方法 | R 言語 | 関数制御 |
読込ファイル | JSON、Excel など多数 | Excel、xml |
ライセンス | GNU General Public License(無料) | Trialware(有料) |
処理速度 | 早い | 普通 |
グラフィック性 | 高い | 普通 |
操作性 | × | ○ |
web・アプリとの連携 | ○ | △ |
回帰分析 | ○ | ○ |
時系列分析 | ○ | △ |
決定木分析 | ○ | × |
階層クラスター | ○ | × |
Rはスクリプトを実行することによって膨大なデータも瞬時に計算・アウトプットしてくれます。その特性からwebやアプリでビッグデータを活用する時に役立ちます。
Rを用いたサービスの一例
売り場面積別のニューヨーク州にあるスーパーの紹介
Rの導入方法
Rを利用する方法は主に以下の3つのパターンがあります。
お勧めは、IDE 化されている RStudio でしょう。各サイトにアクセスし、ソフトをインストールすると無料で利用できます。
OS も Windows、OS X、Ubuntu に対応しています。
- R
https://www.r-project.org/ 62.3MB
R の公式ソフトウェア。
- R Studio
https://www.rstudio.com/ 73.9MB
RStudio 社によって開発された R 専用 IDE(総合開発環境)。$ 995 /年からのプロ版もあり。
- R Excel
photo:http://www26.atwiki.jp/rffbl22/pages/52.html
http://sunsite.univie.ac.at/rcom/ 4MB
Windows 向けのソフトで、Microsoft Excel へ R 機能を追加するソフト。ただし、Windows 10 ではセキュリティ上アプリが起動しない。
R-tips
R学習で参考になるサイトをご紹介します。
ドットインストール
Rについて動画で一通り学習することができます。30分でわかるRによるデータ分析
データアーティスト株式会社の代表山本さんがわかりやすくRを説明しています。シリウス先生の心理統計学
Rのテクニックが多数紹介されています。R-Tips
Rの基礎から各種分析手法までを紹介するサイトになります。R Project
Rの公式サイト。R Examples
Rのサンプル集。R Tutorial
数学博士のChiYauさんが紹介するRのテクニック&活用例集です。JSON ファイルを R で統計した例
上記でもご紹介したニューヨークのスーパーマップを、政府公開のデーターからRを使って、webに組み込む作業過程を紹介しています。データカタログサイト
総務省、金融庁など政府が公開しているビッグデータを紹介しています。
\AIエンジニアに必要なスキルが身に付く/
まとめ
いかがでしたでしょうか?こうしてブログを書いている途中にも Microsoft 社がビッグデータ・ソフトを開発する Revolution Analytics 社を買収し、 Microsoft R Server をリリースすると発表しています。2016年はR、R言語が注目される年になるかもしれませんね。
- この記事を書いた人
- オシママサラ