スポンサードリンク
初級シスアド 文字コード
初級シスアドでは文字コードに関する問題がよく出題されている。
初級シスアドで出題される文字コードは以下のとおりである。
Point
- Unicode(ユニコード)
- ASCII(アスキー)コード
- EBCDIC(イービーシディック)
- JIS漢字符号
- シフトJISコード
- EUC
それぞれの文字コードの特徴を押さえて欲しい。特にPCでのデータ交換を容易にする目的で考案されたUnicodeは、必ず押さえておきたい。
文字コードとは
コンピューター内部では、すべてのデータを0と1の2進数という数字で処理される。文字に割り当てられた数字のことを文字コードという。文字コードにはいろいろな種類がありその特徴は以下のとおりである。
Unicode(ユニコード)
コンピューター間でデータのやり取りを行う上で、文字コードが違うと問題が生じる。この問題を解消するために考案されたのがUnicodeである。アルファベット、漢字、ひらがな、アラビア文字など各国の文字を1つのコード体系で表現できる文字コードセットである。Microsoft、アップル・コンピューター社、IBMなどが提唱した。現在は、ISOで規格化されている。日本もJIS X 0221として定められている。Unicodeでは1文字を4バイトで表す。
ASCII(アスキー)コード
ASCIIはAmerican Standard Code for Information Interchangeの略で、アメリカ規格協会(ANSI)が制定した文字コードである。1文字を7ビットで表し、誤り検出用に1ビットパリティビットを付加した8ビット表す。
EBCDIC(イービーシディック)
EBCDICは、extended binary decimal interchange codeの略で拡張2進化10進符号という。アメリカIBM社が開発した8ビットの文字コードである。大型コンピューター(メインフレーム)で使用される文字コードである。
JIS漢字符号
JIS X 0208で定められた漢字符号である。漢字1文字を2バイトで表す。
シフトJISコード
シフトJISコードは、2バイトで表現するJIS漢字符号(JIS X 0208)の文字を1バイトで表現するASCIIコードと混在させるためにマイクロソフト社が開発した文字コードである。
EUC
EUC(Extended UNIX Code)は、拡張UNIXコードともいう。UNIX上で漢字などを扱うためのマルチバイトコードのことである。EUCでは漢字だけでなく中国語や韓国語なども扱える。
JIS X 0201
7ビットおよび8ビットで文字を表現する。アルファベットや数字、半角カタカナを表現することができる。
スポンサードリンク