RjpWiki [Q] UTF-8ファイルの読み込み時に文字化けしてしまい困っています。 非常にありがちな質問ですが、read.table()で読み込んだデータが「部分的に」文字化けしてしまい、困っています。 具体的には以下のような症状です。

以下のデータファイルを読み込みたいのですが、

[data.tsv]

(TSV形式、UTF-8、BOMなし)

Age Group Class DBH_mean DBH_sd

31 すべて 全立木 17.9 4.34 31 すべて 生立木 17.9 4.34 31 すべて 残存木 17.9 4.34 36 すべて 全立木 20.0 4.92 36 すべて 生立木 20.0 4.92 36 すべて 残存木 20.0 4.92 41 すべて 全立木 21.9 5.59 41 すべて 生立木 21.9 5.56 41 すべて 残存木 21.9 5.56

data <- read.table("test.tsv",sep="\t",header=TRUE,skip=0, fileEncoding="UTF-8") head(data)

とすると、

 Age  Group              Class DBH_mean DBH_sd  X

1 31 すべて \u5168\u7acb\u6728 17.9 4.34 NA 2 31 すべて \u751f\u7acb\u6728 17.9 4.34 NA 3 31 すべて \u6b8b\u5b58\u6728 17.9 4.34 NA 4 36 すべて \u5168\u7acb\u6728 20.0 4.92 NA 5 36 すべて \u751f\u7acb\u6728 20.0 4.92 NA 6 36 すべて \u6b8b\u5b58\u6728 20.0 4.92 NA ("\"はバックスラッシュ)

となり、「Group」のカラムは文字化けしないのに、「Class」のカラムは文字化けしてしまいます。 完全に文字化けしているのならば文字コードの間違いだと納得できるのですが、このような中途半端な文字化けは、いろいろググって見たのですがさっぱり分かりません。 TSVをCSVにしたり、ファイル形式をShift-JISにして fileEncoding='Shift_JIS'としてみても、結果はほぼ同じで途方に暮れております。 おまじないにと,stringAsFactorsをTRUEにしたりFALSEにしても変わりません(変わるとも思えませんが)。

どなたか解決方法をご教示いただけましたら幸いです。何卒よろしくお願いします。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2023-03-25 (土) 11:19:17