Rと日本語

以下の内容はもはや古典的情報でしかありません

このページでは、現在のR環境ではどこに日本語が使えて、どこに使えないのかという情報を扱います。

変数の値

euc環境では変数の値には、日本語の文字列は問題なく扱うことができます。 sjis環境では、2バイト目が0x5cの物は(例 表 -> 表\ )となってしまいます。 日本語変数名パッチをあてれば、sjis環境でも変なエスケープはされなくなります。

変数名

変数名に日本語を使うには、日本語変数名パッチを適用したバージョンのRを使う必要があります。

コマンド入力画面での日本語の入力と表示

Linux環境などでは、Rはターミナルエミュレータ(kterm, rxvt等)から利用するため、 日本語入力に対応したターミナルエミュレータがあれば日本語を入力・表示することが可能です。 Windows(Rguiプログラム利用)の場合は、入力はそのままでも可能ですが、表示が化けてしまいます。 環境設定のフォント設定欄に何らかの日本語フォント名を入力すると、エラーダイアログが1つ出ますがとりあえず日本語Windowsでは日本語が使えるようになります。 日本語化パッチではこのエラーを抑止します。

グラフでの日本語の入力と表示

グラフでの日本語表示は、X11でもWinでもパッチをあてた物で表示が可能です。 Win9xでは、フォントにUnicodeの物を指定する必要があります。 Win9xではemfで出力した物をOfficeで張り付けると、文字化けしてしまいます。

外部出力形式での日本語の出力と表示

日本語パッチをあてれば、PicTex (pixtex関数) , PostScript (postscript関数) の外部出力ファイルで日本語を扱えます。

正規表現

Rの中には多くの正規表現がコーディングされているので、特にwindows環境では2byte目が \ (0x5c)の文字等が副作用を起こします。 これを解決するために、glibcの最新版からregex関係を持ってきてRに合うようにしたパッチを適用すると幸せになれます。

tcltk

Rcmdrの利用に合わせて、tcl8.1以上ではコード変換しますし、8.0ではそのままで出力可能です。

Rcommanderでの日本語利用

tcltkパッチがあたっていればRcmdr-menu.txtを普通にSJISなりEUCで編集可能です。

パッチ適用済みのバイナリが欲しい場合

win32,Vineの方は http://r.nakama.ne.jp を覗いて下さい。

Debian GNU/Linuxの方は、woody/sid対応のdebパッケージが、こちらに置いてあります。

TODO

作業メモ(R-1.8.0)

色々\OS*nixWindowsClassic MacOSMacOS X備考
パーサi18n 完了i18n 完了??nice -20
正規表現i18n 90%i18n 90%??nice 10
グラフi18n 90%i18n 90%??nice 0
データエントリ?i18n 90%??nice 10
PostScriptl10n 完了l10n 完了??nice 0
xfigi18n 完了(xfigのi18nに依存)---nice 19
PDF????nice 19
PicTeXl10n 60%l10n 60%??nice 5
gnome????nice 19
備考nice 0nice 5??

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2023-03-25 (土) 11:19:17