제 목 | UTF-8(유니코드)란 무엇인가? | ||
---|---|---|---|
섬네일 | |||
내용 | 컴퓨터를 사용하면서 종종 UTF-8라는 단어를 들어봤을 것입니다. 하지만 검색을 해보면,복잡한 기술적인 용어가 많아서 오히려 무슨 말인지 이해하기 어렵다는 말을 자주 듣습니다. 이 자리에서는 UTF-8(유니코드)에 대해 가장 기본적인 개념에 대해 소개하도록 하겠습니다. 따라서,기술적이고 복잡한 것들은 최대한 제외하기 위해 노력하였습니다.
UTF-8은 전세계 모든 문자를 동시에 표현할 수 있도록 만들어진 규약입니다.
UTF-8은 흔히 유니코드라고도 불립니다. (UTF-8은 유니코드를 표현하기 위한 방식 중의 하나입니다.)
애초에 컴퓨터에서 문자를 표기할때 영어권 국가만 생각해서 만들었기 때문에, 전세계 각 나라들은 자기나라의 문자를 표현하기 위해 나름대로의 독자적인 꼼수를 사용해야 했습니다. 우리나라는 한글을 표기하기 위해 EUC-KR라는 인코딩을 사용하였고, 일본은 Shift-JIS,중국은 GB2312,대만은 Big5,우크라이나는 KOI8-U..등등 결국 지구상에는 수십종류의 인코딩이 생기게 되었습니다.
하지만,이렇게 제각각의 길을 걷다 보니 문제가 되는 경우가 많았습니다.
그래서 전세계의 수많은 기업들을 중심으로 이러한 문제와 혼란을 한큐에 해결하기 위한 노력이 진행되었습니다. 그리하여 탄생한 것이 유니코드(Unicode)입니다. 전세계 모든 글자들을 한곳에 몰아넣은 종합세트인 것이죠. 그 중에서 UTF-8이라는 방식이 가장 힘을 얻게 되었고,세계 표준으로 인정받고 있습니다.
UTF-8이 도입되면서 전세계 모든 문자를 동시에 표현할 수 있게 되었고,
또한,UTF-8은 현존하고 있는 모든 문자를 포함할 뿐만 아니라,학술용도를 위해 인류 역사상 존재했던 문자들을 담을 수 있습니다.
윈도우의 경우 이미 윈도우98부터 유니코드를 채택하여 사용하고 있고, 앞으로도 점점 유니코드가 널리 사용될 것입니다.
하지만 여전히 문제가 되는 곳이 웹페이지 입니다. 흔히 한글파일명으로 된 그림이 보이지 않을때 ‘URL을 항상 UTF-8로 보냄‘ 옵션을 해제하라는 설명을 자주 봅니다. 물론 필요할 경우는 어쩔 수 없겠지만,이 방법은 단지 임시방편일 뿐이라는 사실을 알고 있어야 합니다.
|
||
출처 | |||
참고URL | - | ||
작성일 | 2010-07-06 08:38 | 조회수 | 529 |