
해당 글은 [혼자 공부하는 컴퓨터구조 + 운영체제] 도서의 내용을 정리한 글입니다.
💡 개념 요약
- 비트는 0과 1로 표현할 수 있는 가장 작은 정보 단위입니다.
- 바이트(byte), 킬로바이트(kB), 메가바이트(MB), 기가바이트(GB), 테라바이트(TB)는 비트보다 더 큰 정보 단위입니다.
- 이진법은 1을 넘어가는 시정에 자리 올림을 하여 0과 1만으로 수를 표현하는 방법입니다
- 이진법에서 음수는 2의 보수로 표현할 수 있습니다.
- 십육진법은 15를 넘어가는 시점에 자리 올림하여 수를 표현하는 방법입니다.
💡 문자 집합과 인코딩
- 문자 집합 : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음입니다.
- 문자 인코딩 : 문자를 0과 1로 변환해야 비로소 컴퓨터가 이해할 수 있는데 이 변환 과정을 문자 인코딩이라고 합니다.
- 문자 디코딩 : 인코딩의 반대 과정, 즉 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정입니다.
💡 아스키코드
아스키는 문자 집합 중 하나로, 영어 알파벳과 아라비아 숫자, 그리고 일부 특수 문자를 포함합니다.

아스키코드는 매우 간단하게 인코딩 된다는 장점이 있지만, 단점도 있습니다. 한글을 표현할 수 없습니다.
한국을 포함한 영어권 외의 나라들은 자신들의 언어를 0과 1로 표현할 수 있는 고유한 문자 집합과 인코딩 방식이 필요했습니다. 이런 이유로 등장한 한글 인코딩 방식이 바로 EUC-KR입니다.
💡 EUC-KR
EUC-KR에서 한글 인코딩에는 두 가지 방식, 완성형(한글 완성형 인코딩)과 조합형(한글 조합형 인코딩)이 존재합니다.
- 완성형 인코딩 : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식입니다.
- 조합형 인코딩 : 은 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열을 할당하여 그것들의 조합으로 하나의 글자코드를 완성하는 인코딩 방식입니다.
EUC-KR 인코딩 덕분에 한국어를 코드로 표현할 수 있게 되었습니다. 하지만 모든 한글을 표현할 수 없다는 한계가 있었습니다.
💡 유니코드와 UTF-8
유니코드는 EUC-KR보다 훨씬 다양한 한글을 포함하며 대부분 나라의 문자, 특수문자, 화살표나 이모티콘까지도 코드로 표현할 수 있는 통일된 문자 집합입니다. 유니코드는 현대 문자를 표현할 때 가장 많이 사용되는 표준 문자 집합이며, 문자 인코딩 세계에서 매우 중요한 역할을 맡고 있습니다.
유키코드는 글자에 부여된 값 자체를 인코딩 된 값으로 삼지 않고 이 값을 다양한 방법으로 인코딩합니다.
크게 UTF-8, UTF-16, UTF-32 등이 있습니다.
'👩💻 CS > 컴퓨터구조' 카테고리의 다른 글
[컴퓨터구조] 컴퓨터 구조 시작하기 (0) | 2023.06.26 |
---|

해당 글은 [혼자 공부하는 컴퓨터구조 + 운영체제] 도서의 내용을 정리한 글입니다.
💡 개념 요약
- 비트는 0과 1로 표현할 수 있는 가장 작은 정보 단위입니다.
- 바이트(byte), 킬로바이트(kB), 메가바이트(MB), 기가바이트(GB), 테라바이트(TB)는 비트보다 더 큰 정보 단위입니다.
- 이진법은 1을 넘어가는 시정에 자리 올림을 하여 0과 1만으로 수를 표현하는 방법입니다
- 이진법에서 음수는 2의 보수로 표현할 수 있습니다.
- 십육진법은 15를 넘어가는 시점에 자리 올림하여 수를 표현하는 방법입니다.
💡 문자 집합과 인코딩
- 문자 집합 : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음입니다.
- 문자 인코딩 : 문자를 0과 1로 변환해야 비로소 컴퓨터가 이해할 수 있는데 이 변환 과정을 문자 인코딩이라고 합니다.
- 문자 디코딩 : 인코딩의 반대 과정, 즉 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정입니다.
💡 아스키코드
아스키는 문자 집합 중 하나로, 영어 알파벳과 아라비아 숫자, 그리고 일부 특수 문자를 포함합니다.

아스키코드는 매우 간단하게 인코딩 된다는 장점이 있지만, 단점도 있습니다. 한글을 표현할 수 없습니다.
한국을 포함한 영어권 외의 나라들은 자신들의 언어를 0과 1로 표현할 수 있는 고유한 문자 집합과 인코딩 방식이 필요했습니다. 이런 이유로 등장한 한글 인코딩 방식이 바로 EUC-KR입니다.
💡 EUC-KR
EUC-KR에서 한글 인코딩에는 두 가지 방식, 완성형(한글 완성형 인코딩)과 조합형(한글 조합형 인코딩)이 존재합니다.
- 완성형 인코딩 : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식입니다.
- 조합형 인코딩 : 은 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열을 할당하여 그것들의 조합으로 하나의 글자코드를 완성하는 인코딩 방식입니다.
EUC-KR 인코딩 덕분에 한국어를 코드로 표현할 수 있게 되었습니다. 하지만 모든 한글을 표현할 수 없다는 한계가 있었습니다.
💡 유니코드와 UTF-8
유니코드는 EUC-KR보다 훨씬 다양한 한글을 포함하며 대부분 나라의 문자, 특수문자, 화살표나 이모티콘까지도 코드로 표현할 수 있는 통일된 문자 집합입니다. 유니코드는 현대 문자를 표현할 때 가장 많이 사용되는 표준 문자 집합이며, 문자 인코딩 세계에서 매우 중요한 역할을 맡고 있습니다.
유키코드는 글자에 부여된 값 자체를 인코딩 된 값으로 삼지 않고 이 값을 다양한 방법으로 인코딩합니다.
크게 UTF-8, UTF-16, UTF-32 등이 있습니다.
'👩💻 CS > 컴퓨터구조' 카테고리의 다른 글
[컴퓨터구조] 컴퓨터 구조 시작하기 (0) | 2023.06.26 |
---|