CSVの文字化けとは
CSVの文字化けとは、本来は日本語や記号として表示されるはずの文字が、意味の分からない文字列として表示される状態です。
CSVは表形式のデータですが、中身はテキストファイルです。そのため、文字コードの扱いが合っていないと正しく表示できません。
主な原因は文字コードの違い
CSVの文字化けで特に多い原因は、UTF-8とShift_JISの違いです。
例えば、UTF-8で保存されたCSVをShift_JISとして開く、またはShift_JISのCSVをUTF-8として読み込むと、日本語が正しく表示されないことがあります。
UTF-8とShift_JISの違い
| 項目 | UTF-8 | Shift_JIS |
|---|---|---|
| よく使われる場面 | Web、API、最近のシステム | 古いWindows環境、業務システム |
| 日本語 | 扱える | 扱える |
| 絵文字や多言語 | 扱いやすい | 扱いにくい |
| CSVでの注意 | Excelで文字化けする場合がある | Web系システムで文字化けする場合がある |
ExcelでCSVが文字化けする理由
CSVをExcelで直接開くと、Excel側が文字コードを自動判定します。
この判定が意図した文字コードと違う場合、UTF-8のCSVを開いたときに日本語が文字化けすることがあります。特に古い環境や業務システム由来のCSVでは注意が必要です。
よくある対処法
CSVが文字化けした場合は、次の点を確認します。
- ファイルの文字コードを確認する
- UTF-8またはShift_JISとして開き直す
- Excelのデータ取り込み機能で文字コードを指定する
- 必要に応じてCSVを別の文字コードで保存し直す
- 元データの出力設定で文字コードを選べるか確認する
CSVを受け渡すときの注意点
CSVを他の人やシステムへ渡す場合は、文字コードも一緒に確認しておくとトラブルを減らせます。
特に業務システムでは「Shift_JISのCSVのみ対応」や「UTF-8でアップロード」など、指定が決まっていることがあります。
区切り文字や引用符も確認する
文字化けとは別に、カンマや引用符の扱いが原因でCSVが崩れて見えることもあります。
住所や説明文にカンマが含まれる場合は、引用符で囲まれているか確認しましょう。必要に応じて、CSV整形ツールやTSV⇄CSV変換も利用できます。
文字コードを確認する方法
文字コードが分からない場合は、まずCSVの文字コードを確認することが大切です。
当サイトの文字コード確認ツールでは、UTF-8やShift_JISなどの文字コード確認に役立ちます。CSVの形式を整えたい場合は、CSV整形ツールも利用できます。
まとめ
CSVの文字化けは、保存時と読み込み時の文字コードが合っていないときに起こりやすくなります。
UTF-8とShift_JISの違い、Excelでの開き方、システム側の指定を確認することで、多くの文字化けは防ぎやすくなります。