Rの勉強

■基本的な事項

文字;を囲むのはダブルコーテーション [" "] でもシングルコーテーション [' '] でも良いようだ.
コマンドは 大文字小文字を区別する

20220812

RGui, Rstudio, VisualStudio など選択肢があり,これらはインストールしてあるが,シンプルな RGui から始めよう

統計ソフトRの使い方 を参考にする

 

■現在勉強中のRの作業フォルダはここにした.その設定方法は以下

>getwd() で現在の作業フォルダを確認

作業ディレクトリは
[ファイル]-[ディレクトリの変更で]
\\su2012r2\d$\suzukiy4i\Documents\Study.Statics\R.RGui
にした

>setwd("\\\\su2012r2/d$/suzukiy4i/Documents/Study.Statics/R.RGui")
も可.R console 上では [\]は[バックスラッシュ]になる

 

■データの場所

予後調査のデータを使おう
場所は \\su2012r2\d$\suzukiy4i\Documents\Study.Statics\腎データ\腎炎予後調査データ

DATA の抜粋(BUN-Cr)は作業ディレクトリに置いた.

■データの読み込みは → memo_データの読み込み

いくつも方法がありそうだが,今回は

> install.pakages('openxlsx') - 一度 install されていれば,二回目は不要
> library(openxlsx)
> data <- read.xlsx('BUN-Cr.xlsx')

なら大丈夫
BUN, Cr とも NA なら 取り込まれない Excel では [0] が入る
一方が NULL なら NA が入る

■この欠損値[0] をどうする...

data$BUN[data$BUN=="0"] <- NA
で置換できるが,ホントの 0 と区別できない...

読み込むときに NULL なら NA に出来ないかなぁ

■csvを読んでみる - これが吉 みたい

cvs は default で 使えるので
> data=read.csv("BUN-Cr.csv", header=TRUE)

で,データは入る
BUN, Cr とも NA でも NA として取り込まれる

■mean, max, min など見てみよう

> mean(data$BUN)
[1] NA

> mean(data$BUN) だと,
こうなってしまう.

> mean(data$BUN, na.rm = TRUE)
[1] 23.33538

> mean(data$BUN, na.rm = TRUE)
こうするのが吉♪

■NAをはじいて新たにデータを作るにはどうする?
■NAをはじいてヒストグラム作るにはどうする?