R

カテゴリ別の相対度数をggplotで棒グラフにする

R

例えば qplot(color, data=diamonds, facets= ~cut) とやると、以下のように因子別の度数を出してくれる。しかし、度数ではなく相対度数が欲しかった(facet間で比べたいので)。 簡単そうだが、やり方見つけるのに半日かかった… d <- as.data.frame(prop.ta…

ggplot のx軸やy軸をテキストで指定

R

「for文でggplot回してファイルにまるっと出力させたいなあ・・・」てな時、"aes_string"が使える。 for(dim in names(diamonds)[c(3:4)]) { p = qplot(data=diamonds, facets= ~cut) + aes_string(x= dim) ggsave(file = paste(dim, ".jpeg", sep= ""), plo…

クロス集計等にN/Aの件数も出したい場合(因子にN/Aも要素として追加)

R

addNA(x) xtabs で N/Aの件数も出したい場合等に使える。 xtabs(~ addNA(x) + addNA(y), data= z) みたいな感じ。

Rでオブジェクトのサイズ確認

R

print(object.size(hoge), units = "auto")

axis.POSIXct が実行する順番によってうまく動かない

R

axis.POSIXct でちゃんと目盛が出ないので、なんでかな~とはまる。 2軸プロットにするためにグラフィックパラメータいじったり第二軸にラベルつけたり凡例つけたりしてたんだが、どうもコマンドを実行する順番を変えるとうまくいくらしい・・・ par(new=T)…

by と aggregate の違い

R

例えば、 date, hour, val1, val2 という形式のデータフレーム x があったとして、by(x[,c(3,4)], x$date, sum) とすると、val1+val2の総計が出る。aggreagete(x[,c(3,4)], x$date, sum)) とすると、val1、val2毎の合計が出る。

.RDataってlinuxとwindowsで共通仕様らしい

R

linuxで作った .RData ってそのままwindowsでも使えるんだ。 便利ー。と思ったが、データフレームのラベルなんかに日本語使ってると、文字コードの違いで文字化け起こしたりするので注意!

R:デンドログラムのプロット順を変更する方法

R

hc とした場合、 hc$order に数値ベクトルを上書きすると、要素を左から並べ替える順番を変えることができるぽい。例えば、要素の個数が30個だとして hc$order とすると、元のデータの行列の順番で要素が並べ替えされる。・・・しかし、やってみるとツリーが…

R起動時にスクリプトを実行させる

R

.Rprofile というファイルを作成し、その中にスクリプトを記述すればよい。 ファイルは作業ディレクトリに置くらしい。 (RDataファイルから起動する場合は、それと同じディレクトリに置けばよいし、「すべてのプログラム」とかから起動する場合は、デフォの…