練習用ページ
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
開始行:
[[RjpWiki]]
[Q] UTF-8ファイルの読み込み時に文字化けしてしまい困っています。
非常にありがちな質問ですが、read.table()で読み込んだデータが「部分的に」文字化けしてしまい、困っています。
具体的には以下のような症状です。
以下のデータファイルを読み込みたいのですが、
>[data.tsv]
> (TSV形式、UTF-8、BOMなし)
>Age Group Class DBH_mean DBH_sd
>31 すべて 全立木 17.9 4.34
31 すべて 生立木 17.9 4.34
31 すべて 残存木 17.9 4.34
36 すべて 全立木 20.0 4.92
36 すべて 生立木 20.0 4.92
36 すべて 残存木 20.0 4.92
41 すべて 全立木 21.9 5.59
41 すべて 生立木 21.9 5.56
41 すべて 残存木 21.9 5.56
data <- read.table("test.tsv",sep="\t",header=TRUE,skip=0, fileEncoding="UTF-8")
head(data)
とすると、
Age Group Class DBH_mean DBH_sd X
1 31 すべて \u5168\u7acb\u6728 17.9 4.34 NA
2 31 すべて \u751f\u7acb\u6728 17.9 4.34 NA
3 31 すべて \u6b8b\u5b58\u6728 17.9 4.34 NA
4 36 すべて \u5168\u7acb\u6728 20.0 4.92 NA
5 36 すべて \u751f\u7acb\u6728 20.0 4.92 NA
6 36 すべて \u6b8b\u5b58\u6728 20.0 4.92 NA
("\"はバックスラッシュ)
となり、「Group」のカラムは文字化けしないのに、「Class」のカラムは文字化けしてしまいます。
完全に文字化けしているのならば文字コードの間違いだと納得できるのですが、このような中途半端な文字化けは、いろいろググって見たのですがさっぱり分かりません。
TSVをCSVにしたり、ファイル形式をShift-JISにして fileEncoding='Shift_JIS'としてみても、結果はほぼ同じで途方に暮れております。
おまじないにと,stringAsFactorsをTRUEにしたりFALSEにしても変わりません(変わるとも思えませんが)。
どなたか解決方法をご教示いただけましたら幸いです。何卒よろしくお願いします。
終了行:
[[RjpWiki]]
[Q] UTF-8ファイルの読み込み時に文字化けしてしまい困っています。
非常にありがちな質問ですが、read.table()で読み込んだデータが「部分的に」文字化けしてしまい、困っています。
具体的には以下のような症状です。
以下のデータファイルを読み込みたいのですが、
>[data.tsv]
> (TSV形式、UTF-8、BOMなし)
>Age Group Class DBH_mean DBH_sd
>31 すべて 全立木 17.9 4.34
31 すべて 生立木 17.9 4.34
31 すべて 残存木 17.9 4.34
36 すべて 全立木 20.0 4.92
36 すべて 生立木 20.0 4.92
36 すべて 残存木 20.0 4.92
41 すべて 全立木 21.9 5.59
41 すべて 生立木 21.9 5.56
41 すべて 残存木 21.9 5.56
data <- read.table("test.tsv",sep="\t",header=TRUE,skip=0, fileEncoding="UTF-8")
head(data)
とすると、
Age Group Class DBH_mean DBH_sd X
1 31 すべて \u5168\u7acb\u6728 17.9 4.34 NA
2 31 すべて \u751f\u7acb\u6728 17.9 4.34 NA
3 31 すべて \u6b8b\u5b58\u6728 17.9 4.34 NA
4 36 すべて \u5168\u7acb\u6728 20.0 4.92 NA
5 36 すべて \u751f\u7acb\u6728 20.0 4.92 NA
6 36 すべて \u6b8b\u5b58\u6728 20.0 4.92 NA
("\"はバックスラッシュ)
となり、「Group」のカラムは文字化けしないのに、「Class」のカラムは文字化けしてしまいます。
完全に文字化けしているのならば文字コードの間違いだと納得できるのですが、このような中途半端な文字化けは、いろいろググって見たのですがさっぱり分かりません。
TSVをCSVにしたり、ファイル形式をShift-JISにして fileEncoding='Shift_JIS'としてみても、結果はほぼ同じで途方に暮れております。
おまじないにと,stringAsFactorsをTRUEにしたりFALSEにしても変わりません(変わるとも思えませんが)。
どなたか解決方法をご教示いただけましたら幸いです。何卒よろしくお願いします。
ページ名: