Localization and Internationalization of R への日本語コメント
i18n_of_R への(日本語)コメントはこの頁にどうぞ。英語に自信のあるかた(ない方も)は英語用コメント頁 CommentsOnI18nOfR に挑戦してみて下さい。元頁自身には書き込みご遠慮下さい(私と苦労を分かち合いたいという奇特な方は別です)。(間瀬茂)
- 中間さん、最後の表の nice xx と言うのは進捗度を表すハッカー表現ですか? -- 間瀬 2003-07-26 (土) 11:28:26
- 岡田さん、ひょっとして英語得意だったりしてませんか? -- 間瀬 2003-07-26 (土) 11:29:38
- 林さん、出番ですよ。 -- 間瀬 2003-07-26 (土) 11:30:53
- man nice -- なかま 2003-07-26 (土) 11:41:29
- 作業優先度という意味ですね。ここではとったほうがよいかも。 -- 間瀬 2003-07-26 (土) 11:57:00
- 要約表中の - は何の意味ですか? -- 間瀬 2003-07-26 (土) 12:05:03
- 何も無いと言う事です。 -- なかま 2003-07-26 (土) 12:11:10
- データエントリー (de) は Spreadsheet Interface の事です。 -- なかま 2003-07-26 (土) 12:14:49
- 日本語は1to3bytesでよかった(3bytes使うのはJISX0212-1990?)と思います。euc-twは1to4bytesです。文字コードもややこしい話ですね。 -- なかま 2003-07-26 (土) 14:34:22
- 平仮名は違うかと。それだったらalpha,numeric,mark等にも全角があるし、混乱の元ですからこの場合は臥せておいたほうが。。。 -- なかま 2003-07-26 (土) 15:30:09
- どなたか存じませんが突如強力な助っ人登場。確認ですが、中国語環境で確認されたのでしょうか。それと X リソース ${R_HOME}/etc/R_X11.`echo $LANG` は使用フォントを並べたそういう名前のファイルを /usr/lib/R/etc (私の場合)に作れという意味ですか。 -- 間瀬 2003-07-26 (土) 16:09:42
- 8bitOn はそう書くだけで国際的に分かる人には分かる表現ですね。8bit clean という表現があったような気がしますが、同じこと? -- 間瀬 2003-07-26 (土) 16:13:31
- R_X11.<locale> を作れば出るはず。でもフォント名知りません。enable eight-bitとかの方がいいのかな。(^^; -- なかま2号 2003-07-26 (土) 16:20:08
- xfigのi18nの話は、http://wwwusr.obspm.fr/departement/demirm/xfig/japanese/i18n.html が参考になります。 -- なかま2号 2003-07-26 (土) 16:23:11
- 最近の r-help 記事に、中国人が中国語文字列は表示できるが、グラフィックスに使えないと中国語文字例入りの阿呆な投稿をし、Ripley 教授に怒られ(?)ていました。このページが早く公開されるといいですね。 -- 2003-07-26 (土) 21:26:38
- 出遅れました、英語は苦手というほどではないかな、というレベルです。ドキュメントの英文化は積極的にやっていきたいですね。来週半ばまではAirH"しか通じないところにいるので、レスポンス遅れるかもしれません... -- 岡田 昌史 2003-07-26 (土) 22:30:32
- 中間[1,2]号さん、ど素人で恐縮ですが、enable eight-bit (eigth-bit ?) というのは、OS レベルなのか各ソフトレベルの問題なのでしょうか。その気になればその場で切替えられるような話ですか。これは、文字コードを表すバイトの8番目のビット情報を考慮するかどうかという意味ですね(?) -- 間瀬 2003-07-27 (日) 10:26:56
- ソフトの話です。l10nなパッチも8bit目を通すように改良しただけで、EUCがどうこうと言うlocaleレベルでの対応をしたわけではないですから。 -- [[なかま[1,2]号]] 2003-07-27 (日) 11:07:51
- 外人さんにはlzhは一般的ではないのでは? ソースだけの方がよいかと思いますが、いかがでしょう。 -- なかま 2003-07-27 (日) 11:37:45
- 賛成
- 英語書くのはいまだにつかれますね。Windows binary は外人さんにはほとんど不要でしょうが、時々日本語を使いたがる外人もいますね。ついでに lha の宣伝もかねて、lha, LHarc Windows 版へのリンクを張っておくというのはどうでしょう。それから、これは慎重に考えるべき問題ですが、外国からの問い合わせが来る可能性が十分あります。特に、中間さん、岡田さんのウェッブページの URL が公開されることになりますから、お二人に直接メイルが来るようになると問題かも(ですよね、中間さん)。コメントページを一緒に設けて、個人的な問い合わせはするなと書いたらよいかと思いますが、いかがでしょうか。 -- 間瀬 2003-07-27 (日) 12:55:35
- うちのspamフィルターはiso-2022-jp以外はtrashへ。(だから、某教授のも)。日に50??200位来ますから。(^^; utf-8の掲示板があると便利かも。 -- なかま 2003-07-27 (日) 15:16:54
- 岡田さんの所のdebは、リソース化して無い頃の物では?。 -- なかま 2003-07-27 (日) 15:19:47
- とりあえず作業を終了。後は識者のチェック(内容、英語)をお待ちしています。正確さとともに、問題点もご指摘下さい。 -- 間瀬 2003-07-27 (日) 17:33:18
- R-KNOPPIX の件は触れないほうがいいでしょうか。面白不半分に 700MB を海外から多数ダウンロードされるとサーバーが困るかも。十分余裕がありそうなら、こういう可能性もあるよという例として是非紹介したいのですが。 -- 間瀬 2003-07-28 (月) 11:36:01
- EUC-KR 出ました。でも、何書いてあるのかわかりません。(笑汗) http://www.nakama.ne.jp/memo/cran-R/i18n/ko_KR/ 慣れない設定で、時間かかりました。 -- なかま 2003-07-28 (月) 12:02:29
- EUC-KR の件リンク張りました。ハングルのメイルが届いても知りませんよ。ところで Rの国際化 頁には xfig パッチを当てる例と当てない例の二つが記載してありますが、これは意図的ですか? -- 間瀬 2003-07-28 (月) 12:13:04
- xfigのi18nが、ja_JPとko_KRに限られているからです。 -- なかま 2003-07-28 (月) 12:16:11
- 8bitが通ると嬉しい例として、http://www.nakama.ne.jp/memo/cran-R/i18n/ru_RU.KOI8-R/ も作っておきました。 -- なかま 2003-07-28 (月) 18:00:03
- リンク張りました。ところでタイトルの韓国語、ロシア語の意味は無難なものですね。私も分からないから一寸気になりました。これで全世界およそ20億人が中間さんと岡田さんの恩恵を受けることになりますね(かなり暴論)。 -- 間瀬 2003-07-28 (月) 18:33:10
- 韓国語はxfigの例から。露西亜語はコード順なので、意味は無いと思います。 -- なかま 2003-07-28 (月) 18:39:29
- 念のため R statistic i18n で google 検索をかけてみましたが、関係ありそうなものは皆無。やはり世界(非英語圏)初ですね。 -- 間瀬 2003-07-29 (火) 08:41:44
- 「SJISやBIG5等の1byte目の状態に2byte目が依存する文字コードに対応するにはwchar_tなワイド文字関数fgetwc等に書き換えるのが適切ですが、そこまでまだ至っていません。また、各種メッセージをカタログ化して各国語化すれば、より多くの人にも使われるようになると思います。」(日本語からして変)みたいなのも付け加えたいなぁ。 -- 2003-07-30 (水) 17:57:40
- これは、patch に対する改善提案という意味ではなく、解説にそういう文章を加えたいという意味ですね。 -- 間瀬 2003-07-30 (水) 18:13:30
- 私がタコユーザーな事をお忘れなく。メッセージをカタログ化、とはどういう意味でしょうか。もう少し情報を。 -- 間瀬 2003-07-30 (水) 18:15:44
- 失礼しました。 http://home.catv.ne.jp/pp/ginoue/memo/gettext.html が参考になるかと思います。主にエラーメッセージ等の国際化に使われます。"Error: syntax error"が、"エラー: 構文誤り" 等となります。 -- 2003-07-30 (水) 18:51:26
- コメントがありましたが、どうしましょう。私としては、現在出来ている事を述べるだけにとどめておくのが、いらぬ期待を持たせぬという意味でよいかと思います。公開後、海外から関連コメントが来たら、話題という事で触れることにしたらどうでしょう。エラーメッセージの日本語化は確かにもし出来ればユーザーフレンドリーになりますね。 -- 間瀬 2003-07-30 (水) 20:24:17
- ぜひ、私の夢とでも題して。(笑) -- なかま 2003-07-30 (水) 21:28:42
- それと、これは決して R のバージョンアップにたいし、継続的なサポートを約束するものではない、と一行加えた方がよいかな。景気がよくなると、おそらく中間さんは時間を割いてくれる余裕がなくなる可能性も高そうだから。 -- 間瀬 2003-07-30 (水) 21:50:49
- 本家にマージ(たとえ部分的にでもたとえばX11_mb)してもらえれば、継続的作業と言うのはi18nでは無くなります。メッセージのカタログ化は大陸欧州圏の人がやってくれないかなぁ(マルチバイトとかあんまり関係無いし)。特にパーサ回りをもしi18nにした場合に、本家がマージしてくれるか?が重要な鍵かと(大元ですから)。マルチバイト圏の人がi18n化しないといけない(文字コードが解からないだろうから)物は, -- なかま 2003-07-31 (木) 09:15:32
- 沢山ありますから、もちっと協力者が現れると嬉しいです。 -- なかま 2003-07-31 (木) 09:17:46
- s/20030715/20030804/g と /1vl12/1vl13/g になりました。 -- なかま 2003-08-04 (月) 22:33:30
- とりあえず公開しましょうか。中間さんも落ちつかないと思いますから。中間さんのサイトにあるパッチは symbol フォントを使えるようにとりあえず変更されたと考えてよろしいですか。それと、谷村さん、岡田さん、特に R-KNOPPIX に触れた部分は省略無しでよろしいですか。今後変更・追加があれば随時書き換えることにしましょう。どれだけ反響があるか楽しみですね。英語圏の人は勝手にやってくれという反応が大勢と思いますが。非英語圏のユーザーも自分で自国語化するとなると二の足を踏む人がほとんどとは思いますが。 -- 間瀬 2003-08-04 (月) 23:01:06
- だれか、外人さんが、X11だけでも拾ってもらえるとうれしい。(笑) -- なかま 2003-08-05 (火) 00:02:57
- SYMBOL対応済です→R.i18n.x11_mb.20030804.patch -- 2003-08-05 (火) 00:26:05
- 明日にでも r-help ML にニュースを流したいと考えています。関係者の方よろしいでしょうか。この頁の内容は専用の日本語コメント頁を設けて、そこへ移します。それ以降のコメントはそこへどうぞ。トラブル等には出来るだけ迅速に対応したいと思います。ただ、私は八月最後の週いっぱい外国出張でその間は一切タッチ出来ない予定ですのであらかじめお断りしておきます。 -- 間瀬 2003-08-05 (火) 20:54:05
- i18n_of_R に関する r-help の反応記事二件。一つはロシアからで、彼らは今のままで、なんの問題もないとのコメントでした。キリル文字セットはアルファベットセットに完全に含められるからでしょうか。これは私もうかつで、ちょっとお手つき気味。一方 Ripley 教授からは来年にも Unicode 対応がされる計画とのコメントが早速あり。私には相変わらずわかりませんが、これがされれば、多くの問題が片付くのでしょうか。 -- 間瀬 2003-08-06 (水) 16:11:38
- 露西亜は例が悪かったですね。helvetica-bold-o とかあるし。まあ、変数名は通らないですから。UnicodeはMACもWinも一寸違ったり(多バイト文字だけ?)して,CSVファイルを読むのにUnicodeでないといけないとか、端末はunicode対応ttyでないといけないとかになるような気もします。(^^; -- なかま 2003-08-06 (水) 19:36:38
- そうすると MSW 派に一番メリットがあるということでしょうか。一年(+半)後にどうなっているか楽しみですね。ただ恐らく我々が期待するようには完全な日本語化はずいぶんと先のことになりそうですね。多言語化のことを開発チームが考えていてくれたらしいことがわかったのは嬉しいですね。 -- 間瀬 2003-08-06 (水) 20:44:11
- そういえば、readlineってアドホックなままじゃなかったでしょうか。窓有利かもしれませんね。iconvにCP932も追加されたらしいですから。 -- なかま 2003-08-07 (木) 20:28:03