でーれーすげーげー

岐阜県岐阜市に在住です。ブログ名は、岐阜市近辺の方言で、とても感嘆したときに発する言葉です。

Rで読み取るファイルの形式でつまづいた・・・。

R言語の勉強を始めて、CSVファイルから一括でデータを読み込み、そこから必要な列だけ抜き出したりすることが出来るのを知った。

それはちょっと便利そうなので、さっそく実際にDBからダウンロードしたCSVを読ませてみようとした。

RStudioだと、Import Dataset という機能があったので、これで出来るのかな?と思って読ませてもエラーが出てしまう。データの先頭に 「があって何のことか分からん!」というエラーなのだが、さっぱり分からない。

いろいろ調べると、CSVやテキストファイルであっても、UTF-16形式だとBigEndianとLittleEndian の区別があり、先頭に をその区別通りに並べておいて、識別できるようにしているらしい。

んー、それぐらいなら RStudio でちゃんと識別して欲しいのだが・・・。

いろいろ、Import Dataset でやっていたがうまく読めない。ネットで検索すると、Read.Table だとパラメータも多そうでなんとかなりそうなのだが、Import Dataset は「Read.delim」というコマンドを使っているようだ。

何が違うのか・・・。

まあ、その違いを調べるのは R言語を使うための本質ではないので、Read.Table を使うなら、ステートメントを書かないとなぁ。ウイザードがプアなのかなぁ・・・。と思っているうちに時間切れ。

こういう細かいところのつまづきを超えたら、役に立つ道具になるのかなぁ。