CSVファイルとは?徹底的にわかりやすく解説

プログラミング

パソコンの初心者の人がCSVファイルについて用途、特徴、注意点がわかるように情報をまとめました。

最後まで見てもらえればあなたもCSVマスターです!!

概要

CSV(Comma-Separated Values)は拡張子に「csv」がついただけの、ただのテキストファイルです。

メモ帳などで作ったテキストファイルの拡張子を「csv」に手で変更するだけで作成することができます。

このように文字と文字の間をカンマ「,」で区切ることで、表として扱います。

名前,年齢,性別
太郎,88,男
花子,90,女

文字以外の情報(文字の色、サイズ、罫線など)を持たないため、データ量も軽量です。

構造がシンプルであるため、汎用性が高いことが特徴です。

例えばGmailに連絡先は1つずつ手入力しなくてもCSV形式の連絡先リストをアップロードすることで一括登録をすることができます。

また、他の用途で利用するためにCSVファイルをダウンロードすることもできます。

編集するためのソフト

Excel

Excelがインストール済みのパソコンでCSVファイルを開こうとすると、デフォルトでExcelになっています。

ダブルクリックして起動することでExcelを使った編集をすることができます。

ただし、文字の色、サイズ、罫線などの情報は保存後に失われてしまうため注意が必要です。

メモ帳

Windowsにデフォルトで入っているテキストエディタです。

テキストベースでの表示になるため、表構造がわかりにくい反面、Excelで開くだけではわからない情報も確認ができます。

例えばこのように値をダブルクォーテーションで囲って使用するパターンもありますが、Excelで開くと表示されません。

"名前","年齢","性別"
"太郎","88","男"
"花子","90","女"

Cassava Editor(フリーソフト)

テキストエディタとExcelの中間をとったようなソフトです。

文字の色やサイズを変更することはできませんが、動作が軽く表形式のままデータを編集できます。

後述しますがExcelを使ったときの悪い影響を受けずに表形式で編集できることが最大のメリットです。

【超重要】取扱の注意点

仕事で8年以上、様々なCSVを扱ってきましたが超重要な注意点があります。

ダブルクォーテーションで囲むべし

CSVには各値をダブルクォーテーション「”」で囲むパターンとそうでないパターンが存在します。

ダブルクォーテーションで囲むパターンを使いましょう!
※必ず半角を使います

場合によっては値の中に改行が含まれることがあります。ダブルクォーテーションで値を囲わない場合、値の中で改行があると「値の中に改行がある」とは判断されずに処理に失敗するリスクがあります。

また、値の中にカンマ「,」がある場合も1つの値を2つの値だと認識されて処理に失敗するリスクがあります。

Excelは閲覧専用として使うべし

ExcelでCSVを開くと表として表示され、編集の操作もわかりやすいためとても便利です。

…が、

値を勝手に別のものに変えてしまうクセものなので、あくまでも閲覧専用として使いましょう!

事象1
先頭の0が勝手に削除されます。

例1
090-XXXX-XXXX
→90-XXXX-XXXX

事象2
カッコ()の中に数字が入ってると勝手にマイナス記号付の数字にされます。

例2
(100)
→-100

事象3
日付が入っている値があると、勝手にフォーマットが変更されます。

例3
2022-04-25
→2022/4/25

最終行は改行が必須

テキストエディタで編集する場合はレコードの最後に改行は必須です。
「改行したほうがいい」ではありません。

テキストエディタで保存する場合は、最終行の末尾でEnterキーを押して改行したことを確認して保存するようにしてください。

これをやり忘れると、最終行が「行」として認識されません。

例えばGmailに連絡先をインポートするためのCSVを作ったとして、最終に改行がないとその行の連絡先は無視されるため取り込んでくれなくなってしまいます。

最終行の下にカーソルを置ける状態にしなければいけません。

文字コードは常に意識するべし

文字コードとは簡単に言うと1と0の電気信号を文字として表現するためのルールです。

大きく分けて2つあります。

  • Shift-JIS
  • UTF-8

システムに合った文字コードを使用するようにしてください。

そうしないと文字化けする恐れがあります。(主に日本語)

特に指定がない場合は、Windowsの標準であるShift-JISが良いと思います。

文字コードを確認する方法、変換する方法は色々ありますがメモ帳では画面右下から確認することができます。

UTF-8の例です。Shift-JISの場合は「ANSI」と表示されます。

また、保存する場合は「名前を付けて保存」をするときに文字コードを選択することができます。
※Shift-JISで保存する場合は、「ANSI」を選択します。

最後に

今回CSVのことについて記事にした理由は、CSVを使い続けていればあまりまえにわかる情報がググってもすぐに出てこなかったためです。

このページが検索の上位に上がってCSVの使い方がもっと認知されればと思っています。

コメント

タイトルとURLをコピーしました