Rと日本語
以下の内容はもはや古典的情報でしかありません
このページでは、現在のR環境ではどこに日本語が使えて、どこに使えないのかという情報を扱います。
euc環境では変数の値には、日本語の文字列は問題なく扱うことができます。 sjis環境では、2バイト目が0x5cの物は(例 表 -> 表\ )となってしまいます。 日本語変数名パッチをあてれば、sjis環境でも変なエスケープはされなくなります。
変数名に日本語を使うには、日本語変数名パッチを適用したバージョンのRを使う必要があります。
Linux環境などでは、Rはターミナルエミュレータ(kterm, rxvt等)から利用するため、 日本語入力に対応したターミナルエミュレータがあれば日本語を入力・表示することが可能です。 Windows(Rguiプログラム利用)の場合は、入力はそのままでも可能ですが、表示が化けてしまいます。 環境設定のフォント設定欄に何らかの日本語フォント名を入力すると、エラーダイアログが1つ出ますがとりあえず日本語Windowsでは日本語が使えるようになります。 日本語化パッチではこのエラーを抑止します。
グラフでの日本語表示は、X11でもWinでもパッチをあてた物で表示が可能です。 Win9xでは、フォントにUnicodeの物を指定する必要があります。 Win9xではemfで出力した物をOfficeで張り付けると、文字化けしてしまいます。
日本語パッチをあてれば、PicTex (pixtex関数) , PostScript (postscript関数) の外部出力ファイルで日本語を扱えます。
Rの中には多くの正規表現がコーディングされているので、特にwindows環境では2byte目が \ (0x5c)の文字等が副作用を起こします。 これを解決するために、glibcの最新版からregex関係を持ってきてRに合うようにしたパッチを適用すると幸せになれます。
Rcmdrの利用に合わせて、tcl8.1以上ではコード変換しますし、8.0ではそのままで出力可能です。
tcltkパッチがあたっていればRcmdr-menu.txtを普通にSJISなりEUCで編集可能です。
win32,Vineの方は http://r.nakama.ne.jp を覗いて下さい。
Debian GNU/Linuxの方は、woody/sid対応のdebパッケージが、こちらに置いてあります。
色々\OS | *nix | Windows | Classic MacOS | MacOS X | 備考 |
パーサ | i18n 完了 | i18n 完了 | ? | ? | nice -20 |
正規表現 | i18n 90% | i18n 90% | ? | ? | nice 10 |
グラフ | i18n 90% | i18n 90% | ? | ? | nice 0 |
データエントリ | ? | i18n 90% | ? | ? | nice 10 |
PostScript | l10n 完了 | l10n 完了 | ? | ? | nice 0 |
xfig | i18n 完了(xfigのi18nに依存) | - | - | - | nice 19 |
? | ? | ? | ? | nice 19 | |
PicTeX | l10n 60% | l10n 60% | ? | ? | nice 5 |
gnome | ? | ? | ? | ? | nice 19 |
備考 | nice 0 | nice 5 | ? | ? |