【R】データクレンジングに役立つテクニックまとめ

スポンサーリンク

今までExcelで行っていたデータ処理作業をRでできるようになると作業効率が10倍以上アップします。
そこで、Rでのデータクレンジングに関する情報を整理したかったのでまとめてみました。
紹介するのは以下の作業の方法です。

  • 欠損値への対応
  • 列の整理
    • クラス変更
    • 列名変更
  • 行のフィルター

欠損値を0にする

欠損値はXXX [is.na(XXX$xxx),] <- 0を使って対応します。

最近この方法でたまにエラーが起こるので、その時はXXX$xxx <- ifelse(is.na(XXX$xxx),0,XXX$xxx)として変換するのがいいと思います。

【R】で複数列の欠損値(NA)を0に変換する方法

2015.01.28

列要素のクラス変換

列要素のクラス変換はXXX$xxx <- as.Date(XXX$xxx)と覚えましょう。
as.numericなど変換したいクラスによって使い分けます。

【R】列要素のクラスを変換する方法

2015.01.28

列の名前変更

name(XXX)[2] <- "character"で変更可能です。
2列分変更したい場合は、name(XXX)[2:3] <- c("character", "variables" )とします。

【R】データフレーム中の列名の一部の名前を変更する方法

2015.01.29

欲しい行だけフィルター

行のフィルターはXXX <- XXX[XXX$xxx > 0,]のように部分集合[]を使って条件で絞ります。
またdplyrパッケージも直感的で使いやすいです。

【R】欲しい行だけフィルターする方法

2015.01.28

まとめ

Rでデータ処理作業をできるようになると、もうExcelに戻れなくなります。
今後はRでの統計処理についても記事にできたらと思います。

スポンサーリンク
スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です