統計ソフトウェア「R」を使って、CSVデータの読み込みからデータ結合し再びCSVデータとして吐き出す方法

スポンサーリンク

CSVデータの読み込みからデータ結合までの流れ

統計ソフトウェア「R」の備忘録としてdata.csvファイルとdata2.csvファイルをid(かつname)をキーとして結合する方法をまとめました。
また、revenueにNAのある行は削除し、advertisementのNAは0に置換できます。

ルートディレクトリへ移動

まずはデータがある場所へ移動します。

#Cドライブ直下にRフォルダがあると仮定
setwd(\"C:/R\")

ファイル名を調べる

dir()

csvファイル取り込み

#data.csvファイルを取り込む
data<-read.csv(\"data.csv\")

取り込んだデータのフィールドを調べる

head(data)

データ結合

#dataとdata2を結合
#キーが1つの場合
Data<-merge(data, data2, by.x=\"id\", by.y=\"id\", all=TRUE)

#キーが2つの場合
Data<-merge(data, data2, by.x=c(\"id\", \"name\"), by.y=c(\"id\",\"name\"), all = TRUE)

revenueにNAのある行を削除

Data<-Data[!is.na(Data$revenue),]

任意の列を抽出

Data<-Data[c(\"id\",\"name\",\"revenue\",\"lacation\",\"advertisement\")]

advertisement列のNAを0に変換する

Data$advertisement<-ifelse(is.na(Data$advertisement),0,(Data$advertisement))

CSVとして書き出し

write.csv(Data, file=\"Data.csv\", row.names=F)

以上です。

参考

\"\"飯島の雑記帳 – Rゼミ/R初心者ゼミ\"\"
\"\"Rでパネルデータ分析をやってみる: 椅子は硬いほうがいい\"\"
スポンサーリンク
スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です