金魚亭日常

読書,ガジェット,競技プログラミング

R で NFD 濁点ファイル名読み込み

Mac つかってるっぽい人から「データ.csv」みたいなやつをもらって,Rで読もうとしたときファイルが無いと言われ,dir()してみると濁点が分解されちゃっていた場合.

結論

基本的なファイル操作は可能なので,file.copy() でコピー・リネームしてから扱うのがよい

見分け方

コマンドプロンプトdir すると見分けがつく. エクスプローラ上で見分けるには,ファイル名をBackSpace で消してみて,濁点だけ消せるかどうかを確認する.

入力方法

\U3099 を入力したい場合は,powershell[char]0x3099 とか打ってコピペする方法などがある ( http://d.hatena.ne.jp/miau/20110805/1312555736

メモ

  • ファイル操作は可能
 file.create("テ\U3099ータ.csv")
 file.copy("テ\U3099ータ.csv", "data.csv")
  • file.path()で結合は不可.paste() だと可
    • \U3099\U309B になっている気がする
    • 逆に,テ\U3099 をコピペしてRStudio で保存すると, になるっぽい
 a <- "dir"
 b <- "テ\U3099ータ.csv"
 
 file.exist(file.path(a, b)) # => FALSE
 file.exist(paste(a, b, sep="/")) # => TRUE
  • read.csv()write.csv() は可能
 write.csv("テ\U3099ータ.csv")
 read.csv("テ\U3099ータ.csv")