データ分析を行うビジネスマンはExcelから脱却して「R」を使おう。

スポンサーリンク

Excelは全てのビジネスマンに必須なスキルといえます。
優れた機能を持っていますが、制約が多く、複雑な分析には向かないことが多いです。

そこで、今回はExcelから脱却して、最近注目を浴びている統計ソフトウェア「R」を使ってみようというお話です。僕も使い初めて半年くらいなので紹介しきれないことが多いと思いますが、自身の備忘録も兼ねて紹介しようと思います。

Excelよりも格段に早い。

僕がRを使い始めた理由はこれです。
Excel(2010)は「1,048,576行×16,384列」しかデータを収容することができません。
Excelでは自分の経験でいうと、1万行を超えたあたりから、PCが一気に重くなり分析どころか他の作業(パワポ作成やメール返信など)にも影響を与えてしまいます。

一方Rは環境によって上限は異なるみたいですが、Rの処理速度はExcelに比べれば格段に早く、Excelよりも多くのデータも収容することができます。 また、Rでプログラムを実行しつつ、その間に他の作業を行うこともできます。

Rのデータ上限については以下に記載がありました。
初級Q&A アーカイブ(6) – RjpWiki

グラフ作成が楽

Excelの不満はヒストグラムや箱ひげ図が簡単に作れないことです。
バラつきを表したい時などはこういったグラフが有効ですが、Excelで作るのは一苦労です。
いつも以下のサイトのお世話になっていました。

一方Rではコマンド一発で作成可能です。
ヒストグラムは、

hist(x)

箱ひげ図は、

boxplot(x)

で終了です。もちろんラベルや色の変更などオプションも追加できます。

統計の勉強になる

最近の統計ブームで全てのビジネスマンに統計の大切さが叫ばれていますが、統計を本だけでは理解するのはなかなか難しいものです。

  • 仮説検定
  • 回帰分析

などは実際に自分で行ってみないとなかなかイメージが沸かないものだと思います。
ただこれらは、Rで遊んでいるうちになんとなくイメージがつかめてきます。例えば、仮説検定なんて最初はもちろん意味が全くわかりません。ただやっていくうちにRはあるデータの差をみて、これが本当に意味のある差なのか確かめてくれるということだけはなんとなく理解できるようになります。

この感覚を掴むと、その後で統計本を読んだ時の理解がいっそう深まります。

物事を学ぶには何事も「理論」と「実践」が大切です。
Rはわかりにくい統計を理解する上で「実践」面からサポートしてくれます。

非ウェブエンジニアにとってのプログラミング学習の入り口として

僕はプログラミングは全くの初心者で、プログラミングに触れたのはRが初めてでした。
一度Rでプログラミングの面白さを知ってしまうと他の言語にも興味を持ってきて現在いろいろと取り組んでいるところです。

僕の中でRは以下のような人におすすめです。

  • プログラミングには興味があるけれど、自分はWebエンジニアではない。
  • どうせプログラミングを覚えるなら普段の仕事の効率化を図りたい
  • 人が違うことをやって自分を差別化したい。
  • 統計を本で学ぶだけではなく実感を伴って勉強したい

まとめ

せっかくRの学習を始めたので勉強した内容をブログにもアップしていこうと思います。
Excelは優れたソフトウェアですが制約も多いということを念頭に入れて、Excelからの脱却、より柔軟性の高いRを使いこなせるようにしていきたいと思います。

スポンサーリンク
スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です