Rの勉強
■基本的な事項
文字;を囲むのはダブルコーテーション [" "] でもシングルコーテーション [' '] でも良いようだ.
コマンドは 大文字小文字を区別する
20220812
RGui, Rstudio, VisualStudio など選択肢があり,これらはインストールしてあるが,シンプルな RGui から始めよう
統計ソフトRの使い方 を参考にする
■現在勉強中のRの作業フォルダはここにした.その設定方法は以下
>getwd() で現在の作業フォルダを確認
作業ディレクトリは
[ファイル]-[ディレクトリの変更で]
\\su2012r2\d$\suzukiy4i\Documents\Study.Statics\R.RGui
にした
>setwd("\\\\su2012r2/d$/suzukiy4i/Documents/Study.Statics/R.RGui")
も可.R
console 上では [\]は[バックスラッシュ]になる
■データの場所
予後調査のデータを使おう
場所は
\\su2012r2\d$\suzukiy4i\Documents\Study.Statics\腎データ\腎炎予後調査データ
DATA の抜粋(BUN-Cr)は作業ディレクトリに置いた.
■データの読み込みは → memo_データの読み込み
いくつも方法がありそうだが,今回は
> install.pakages('openxlsx') - 一度 install されていれば,二回目は不要
> library(openxlsx)
> data <-
read.xlsx('BUN-Cr.xlsx')
なら大丈夫
BUN, Cr とも NA なら 取り込まれない Excel では [0]
が入る
一方が NULL なら NA が入る
■この欠損値[0] をどうする...
data$BUN[data$BUN=="0"] <- NA
で置換できるが,ホントの 0 と区別できない...
読み込むときに NULL なら NA に出来ないかなぁ
■csvを読んでみる - これが吉 みたい
cvs は default で 使えるので
> data=read.csv("BUN-Cr.csv", header=TRUE)
で,データは入る
BUN, Cr とも NA でも NA として取り込まれる
■mean, max, min など見てみよう
> mean(data$BUN)
[1] NA
> mean(data$BUN) だと,
こうなってしまう.
> mean(data$BUN, na.rm = TRUE)
[1] 23.33538
> mean(data$BUN, na.rm = TRUE)
こうするのが吉♪
■NAをはじいて新たにデータを作るにはどうする?
■NAをはじいてヒストグラム作るにはどうする?