読者です 読者をやめる 読者になる 読者になる

R言語による電子カルテデータの二次利用

~R言語初心者がデータ処理を楽しめるように基本的内容中心のサイトです~

R言語の導入と開発環境Rstudio

R言語のインストールは簡単です。

以下のサイトから自分のOSにあったファイルをインストールしてください。


R本体: https://cran.ism.ac.jp/

R言語単体で作業をするのは煩雑なので、Rstudioという開発環境を導入することをおすすめします。非常に便利です。

Rstudio(Rの開発環境) : www.rstudio.com



わからないことは検索サイト:seekRで。

seekr.jp



ちょっと発展。

開発環境は普段使うPCの起動ディスクにそのままインストールして使うことが多いですが、いろいろなWindowsマシンで使用したい場合は、USBメモリにRとRStudio環境をインストールして使用することも可能です。USBをそのままバックアップしておけば、環境が壊れた際に復旧も容易です。


文字化け
R言語を少し使い込んでくると日本語の処理で問題が出る場合があります。日本語を含むデータを、データベースから抽出したり、Webからスクレイピングしてきたり、違うOSで日本語入力したデータをもらったり、使用するデータの文字コードと使っている環境の文字コードが違うと壁にぶつかります。 f:id:r_beginner:20160207092413j:plain 文字化けに遭遇した場合は、まずRstudioのFile→Reopen with Encoding。文字コード変換を試してみます。 f:id:r_beginner:20160207092410j:plain

だめな場合は、別な逃げ道も作っておきましょう。
 WindowsマシンとMACがあれば両方の環境にRとRStudioをインストールするのが簡単です。難しい場合は、自作PCなら起動ディスクをもう一つ作り、UbuntuでR環境を構築する、もしくは外付け記憶媒体UbuntuをインストールしUSB起動する。2台のPCを使うのが面倒だったり、Windowsマシンの再起動の時間がもったいなければ、最近のPCスペックであれば仮想マシンを構築し、UbuntuにR環境を作成するのがベストかもしれません。
 Vagrant仮想マシンからUbuntu、R環境構築を自動化すれば、これば一番簡単かもしれません。パッケージのインストールまで自動化できますし、偉い先生が作った安定稼働する環境をそのまま再現することも可能です。
 ちょっと難しいかなという人は、下記サイトを参考に。そのまま実行すれば、あっと言う間にUbuntuでR環境構築できます。これは凄いです。

qiita.com