練習用ページ
の編集
http://www.okadajp.org/RWiki/?%E7%B7%B4%E7%BF%92%E7%94%A8%E3%83%9A%E3%83%BC%E3%82%B8
[
トップ
] [
編集
|
差分
|
バックアップ
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
(no template pages)
[[RjpWiki]] [[RjpWiki]] [Q] UTF-8ファイルの読み込み時に文字化けしてしまい困っています。 非常にありがちな質問ですが、read.table()で読み込んだデータが「部分的に」文字化けしてしまい、困っています。 具体的には以下のような症状です。 以下のデータファイルを読み込みたいのですが、 >[data.tsv] > (TSV形式、UTF-8、BOMなし) >Age Group Class DBH_mean DBH_sd >31 すべて 全立木 17.9 4.34 31 すべて 生立木 17.9 4.34 31 すべて 残存木 17.9 4.34 36 すべて 全立木 20.0 4.92 36 すべて 生立木 20.0 4.92 36 すべて 残存木 20.0 4.92 41 すべて 全立木 21.9 5.59 41 すべて 生立木 21.9 5.56 41 すべて 残存木 21.9 5.56 data <- read.table("test.tsv",sep="\t",header=TRUE,skip=0, fileEncoding="UTF-8") head(data) とすると、 Age Group Class DBH_mean DBH_sd X 1 31 すべて \u5168\u7acb\u6728 17.9 4.34 NA 2 31 すべて \u751f\u7acb\u6728 17.9 4.34 NA 3 31 すべて \u6b8b\u5b58\u6728 17.9 4.34 NA 4 36 すべて \u5168\u7acb\u6728 20.0 4.92 NA 5 36 すべて \u751f\u7acb\u6728 20.0 4.92 NA 6 36 すべて \u6b8b\u5b58\u6728 20.0 4.92 NA ("\"はバックスラッシュ) となり、「Group」のカラムは文字化けしないのに、「Class」のカラムは文字化けしてしまいます。 完全に文字化けしているのならば文字コードの間違いだと納得できるのですが、このような中途半端な文字化けは、いろいろググって見たのですがさっぱり分かりません。 TSVをCSVにしたり、ファイル形式をShift-JISにして fileEncoding='Shift_JIS'としてみても、結果はほぼ同じで途方に暮れております。 おまじないにと,stringAsFactorsをTRUEにしたりFALSEにしても変わりません(変わるとも思えませんが)。 どなたか解決方法をご教示いただけましたら幸いです。何卒よろしくお願いします。
タイムスタンプを変更しない
[[RjpWiki]] [[RjpWiki]] [Q] UTF-8ファイルの読み込み時に文字化けしてしまい困っています。 非常にありがちな質問ですが、read.table()で読み込んだデータが「部分的に」文字化けしてしまい、困っています。 具体的には以下のような症状です。 以下のデータファイルを読み込みたいのですが、 >[data.tsv] > (TSV形式、UTF-8、BOMなし) >Age Group Class DBH_mean DBH_sd >31 すべて 全立木 17.9 4.34 31 すべて 生立木 17.9 4.34 31 すべて 残存木 17.9 4.34 36 すべて 全立木 20.0 4.92 36 すべて 生立木 20.0 4.92 36 すべて 残存木 20.0 4.92 41 すべて 全立木 21.9 5.59 41 すべて 生立木 21.9 5.56 41 すべて 残存木 21.9 5.56 data <- read.table("test.tsv",sep="\t",header=TRUE,skip=0, fileEncoding="UTF-8") head(data) とすると、 Age Group Class DBH_mean DBH_sd X 1 31 すべて \u5168\u7acb\u6728 17.9 4.34 NA 2 31 すべて \u751f\u7acb\u6728 17.9 4.34 NA 3 31 すべて \u6b8b\u5b58\u6728 17.9 4.34 NA 4 36 すべて \u5168\u7acb\u6728 20.0 4.92 NA 5 36 すべて \u751f\u7acb\u6728 20.0 4.92 NA 6 36 すべて \u6b8b\u5b58\u6728 20.0 4.92 NA ("\"はバックスラッシュ) となり、「Group」のカラムは文字化けしないのに、「Class」のカラムは文字化けしてしまいます。 完全に文字化けしているのならば文字コードの間違いだと納得できるのですが、このような中途半端な文字化けは、いろいろググって見たのですがさっぱり分かりません。 TSVをCSVにしたり、ファイル形式をShift-JISにして fileEncoding='Shift_JIS'としてみても、結果はほぼ同じで途方に暮れております。 おまじないにと,stringAsFactorsをTRUEにしたりFALSEにしても変わりません(変わるとも思えませんが)。 どなたか解決方法をご教示いただけましたら幸いです。何卒よろしくお願いします。
テキスト整形のルールを表示する