Rと日本語
の編集
http://www.okadajp.org/RWiki/?R%E3%81%A8%E6%97%A5%E6%9C%AC%E8%AA%9E
[
トップ
] [
編集
|
差分
|
バックアップ
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
(no template pages)
COLOR(red){SIZE(30){Rと日本語}} COLOR(red){以下の内容はもはや古典的情報でしかありません} このページでは、現在のR環境ではどこに日本語が使えて、どこに使えないのかという情報を扱います。 ** 変数の値 euc環境では変数の値には、日本語の文字列は問題なく扱うことができます。 sjis環境では、2バイト目が0x5cの物は(例 表 -> 表\ )となってしまいます。 日本語変数名パッチをあてれば、sjis環境でも変なエスケープはされなくなります。 ** 変数名 変数名に日本語を使うには、日本語変数名パッチを適用したバージョンのRを使う必要があります。 ** コマンド入力画面での日本語の入力と表示 Linux環境などでは、Rはターミナルエミュレータ(kterm, rxvt等)から利用するため、 日本語入力に対応したターミナルエミュレータがあれば日本語を入力・表示することが可能です。 Windows(Rguiプログラム利用)の場合は、入力はそのままでも可能ですが、表示が化けてしまいます。 環境設定のフォント設定欄に何らかの日本語フォント名を入力すると、エラーダイアログが1つ出ますがとりあえず日本語Windowsでは日本語が使えるようになります。 日本語化パッチではこのエラーを抑止します。 ** グラフでの日本語の入力と表示 グラフでの日本語表示は、X11でもWinでもパッチをあてた物で表示が可能です。 Win9xでは、フォントにUnicodeの物を指定する必要があります。 Win9xではemfで出力した物をOfficeで張り付けると、文字化けしてしまいます。 ** 外部出力形式での日本語の出力と表示 日本語パッチをあてれば、PicTex (pixtex関数) , PostScript (postscript関数) の外部出力ファイルで日本語を扱えます。 ** 正規表現 Rの中には多くの正規表現がコーディングされているので、特にwindows環境では2byte目が \ (0x5c)の文字等が副作用を起こします。 これを解決するために、glibcの最新版からregex関係を持ってきてRに合うようにしたパッチを適用すると幸せになれます。 ** tcltk Rcmdrの利用に合わせて、tcl8.1以上ではコード変換しますし、8.0ではそのままで出力可能です。 ** Rcommanderでの日本語利用 tcltkパッチがあたっていればRcmdr-menu.txtを普通にSJISなりEUCで編集可能です。 ** パッチ適用済みのバイナリが欲しい場合 win32,Vineの方は http://r.nakama.ne.jp を覗いて下さい。 Debian GNU/Linuxの方は、woody/sid対応のdebパッケージが、[[こちら:http://www.okada.jp.org/~mokada/R/]]に置いてあります。 * TODO **作業メモ(R-1.8.0) |色々\OS |*nix |Windows |Classic MacOS|MacOS X|備考 | |パーサ |i18n 完了 |i18n 完了 |? |? |nice -20| |正規表現 |i18n 90% |i18n 90% |? |? |nice 10 | |グラフ |i18n 90% |i18n 90% |? |? |nice 0 | |データエントリ|? |i18n 90% |? |? |nice 10 | |PostScript |l10n 完了 |l10n 完了 |? |? |nice 0 | |xfig |i18n 完了(xfigのi18nに依存)|-|- |- |nice 19 | |PDF |? |? |? |? |nice 19 | |PicTeX |l10n 60% |l10n 60% |? |? |nice 5 | |gnome |? |? |? |? |nice 19 | |備考 |nice 0 |nice 5 |? |? | |
タイムスタンプを変更しない
COLOR(red){SIZE(30){Rと日本語}} COLOR(red){以下の内容はもはや古典的情報でしかありません} このページでは、現在のR環境ではどこに日本語が使えて、どこに使えないのかという情報を扱います。 ** 変数の値 euc環境では変数の値には、日本語の文字列は問題なく扱うことができます。 sjis環境では、2バイト目が0x5cの物は(例 表 -> 表\ )となってしまいます。 日本語変数名パッチをあてれば、sjis環境でも変なエスケープはされなくなります。 ** 変数名 変数名に日本語を使うには、日本語変数名パッチを適用したバージョンのRを使う必要があります。 ** コマンド入力画面での日本語の入力と表示 Linux環境などでは、Rはターミナルエミュレータ(kterm, rxvt等)から利用するため、 日本語入力に対応したターミナルエミュレータがあれば日本語を入力・表示することが可能です。 Windows(Rguiプログラム利用)の場合は、入力はそのままでも可能ですが、表示が化けてしまいます。 環境設定のフォント設定欄に何らかの日本語フォント名を入力すると、エラーダイアログが1つ出ますがとりあえず日本語Windowsでは日本語が使えるようになります。 日本語化パッチではこのエラーを抑止します。 ** グラフでの日本語の入力と表示 グラフでの日本語表示は、X11でもWinでもパッチをあてた物で表示が可能です。 Win9xでは、フォントにUnicodeの物を指定する必要があります。 Win9xではemfで出力した物をOfficeで張り付けると、文字化けしてしまいます。 ** 外部出力形式での日本語の出力と表示 日本語パッチをあてれば、PicTex (pixtex関数) , PostScript (postscript関数) の外部出力ファイルで日本語を扱えます。 ** 正規表現 Rの中には多くの正規表現がコーディングされているので、特にwindows環境では2byte目が \ (0x5c)の文字等が副作用を起こします。 これを解決するために、glibcの最新版からregex関係を持ってきてRに合うようにしたパッチを適用すると幸せになれます。 ** tcltk Rcmdrの利用に合わせて、tcl8.1以上ではコード変換しますし、8.0ではそのままで出力可能です。 ** Rcommanderでの日本語利用 tcltkパッチがあたっていればRcmdr-menu.txtを普通にSJISなりEUCで編集可能です。 ** パッチ適用済みのバイナリが欲しい場合 win32,Vineの方は http://r.nakama.ne.jp を覗いて下さい。 Debian GNU/Linuxの方は、woody/sid対応のdebパッケージが、[[こちら:http://www.okada.jp.org/~mokada/R/]]に置いてあります。 * TODO **作業メモ(R-1.8.0) |色々\OS |*nix |Windows |Classic MacOS|MacOS X|備考 | |パーサ |i18n 完了 |i18n 完了 |? |? |nice -20| |正規表現 |i18n 90% |i18n 90% |? |? |nice 10 | |グラフ |i18n 90% |i18n 90% |? |? |nice 0 | |データエントリ|? |i18n 90% |? |? |nice 10 | |PostScript |l10n 完了 |l10n 完了 |? |? |nice 0 | |xfig |i18n 完了(xfigのi18nに依存)|-|- |- |nice 19 | |PDF |? |? |? |? |nice 19 | |PicTeX |l10n 60% |l10n 60% |? |? |nice 5 | |gnome |? |? |? |? |nice 19 | |備考 |nice 0 |nice 5 |? |? | |
テキスト整形のルールを表示する