Excel(エクセル)で文字コードを確認するCODE関数/UNICODE関数
使用関数:CODE、UNICODE
文字コードとは?
文字には全て固有のコードが割り当てられています。
コンピューターでデータとして文字を処理するのに必要な識別番号で、文字コード体系は複数ありますが、エクセルのCODE関数で返るのは2バイト文字の日本語に対応しているJISコード、半角英数字・記号などに振られるASCII(アスキー)コードです。
UNICODE関数が返すUNICODE(ユニコード)は分かりやすく言うと、世界中の文字を一つにまとめるために設計されたコード体系です。
現在はまだ複数の文字コード間で切り替えながら処理していますが、UNICODE(ユニコード)に徐々に集約されていく流れです。Excelファイル(CSV)を開く時に文字化けが発生する事象も解消されるでしょう。
CODE/UNICODEで文字コードを確認し、CHARで使う
CODE/UNICODEは数式タブ→関数ライブラリ→文字列操作に格納されています。
同じ文字列操作のCHAR/UNICHARは文字コードを引数にして対応する文字を取得する関数です。
改行コードを取得して文字列をセル内で改行させる、改行を削除して1行文字列にするなど文字の置換でよく使われますが、この時、文字コードを確認するのにCODE/UNICODEを使います。
CODE/UNICODEの構成: =CODE(文字列) =UNICODE(文字列)
例えば、改行コードを調べたいなら、CODE/UNICODEの引数に「“」で囲った中でAltキー+Enterで改行すれば、対応する文字コードが返ります。
判りにくいかもしれませんが、下図のように入力されています。
セル参照で指定するなら、任意のセルに何か1文字入力して、カーソルをその文字の前に置いて改行します。
CODE/UNICODEはセル内の文字列の最初の文字のコードを返すので、改行コードが表示されます。
因みに、CODE/UNICODE共に改行コードは「10」です。このように異なる文字コード体系同士が同じ値を返すこともあります。
文字列の2文字目以降を指定して文字コードを確認する
CODE/UNICODEはセル内の文字列の先頭文字の文字コードを返しますが、2文字目、3文字目の文字コードを調べたいこともあります。
そうした時はMID関数で文字の位置情報を指定する式をCODE及びUNICODE関数に入れ子して求めます。ここではUNICODE関数の中にMID関数を入れました。
MID関数の指定は以下のようになります。
「MID(A2,3,1)」とは「A2セル内の文字列の3番目にある1文字」を指定したことになります。
入れ子した数式: =UNICODE(MID(A2,3,1))
特殊文字・機械依存文字の文字コード
特殊文字・機械依存文字の文字コードをCODEとUNICODEそれぞれで判定した一覧です。
CODE関数では①、全角スペース、ひし形(全角)には固有の文字コードが返りましたが、✓や♡の機械依存文字、絵文字は全て「63」という文字コードが返りました。
文字コード63をCHAR関数で調べると疑問符の「?」です。これは「判別できない文字」のコードとして返される値です。
比べて、UNICODE(ユニコード)では絵文字も含めて固有の文字コードが返されています。UNICODE(ユニコード)の拡張が進んでいるということで、文字コードの確認にはUNICODE関数を使う習慣をつけておいた方がいいかもしれません。
- Excel(エクセル)のCODE関数/UNICODE関数は文字から文字コードを確認します
- 文字コードとは文字に割り振られた識別番号で、幾つかのコード体系が存在します
- CODE関数で返るのは日本語にシフトしたJISコードと半角英数字にシフトしたASCIIコードです
- UNICODE(ユニコード)は文字コード体系を一つにまとめるために設計されたコードで、現在も拡張が続いています
- 制御文字の一つでよく使われる改行文字をCODE/UNICODEで指定する時は「”」で囲った中でAltキー+Enterで改行します
- CODE/UNICODEは指定した文字列の先頭の文字の文字コードを返します
- CODE関数では特殊文字・機械依存文字など未対応の文字を指定すると「判別できない文字」として疑問符の文字コード「63」が返ります
- UNICODE関数は既に絵文字も含めて特殊文字・機械依存文字にも固有の文字コードが割り振られています