본문 바로가기
영상 후기/기타

영상 후기 - 문자 인코딩, 유니코드, UTF-8이 뭔가요?

by 올리브영 2023. 2. 26.
728x90
반응형

movie

  • 사람의 문자를 컴퓨터가 알아볼 수 있도록 바이너리 신호로 바꿔주는걸 문자 인코딩이라고 한다. 문자열 셋과 인코딩 방식을 서로 맞추지 않으면 글자들이 깨진다.
  • 유니코드는 모든 문자들을 하나의 표에 포함시킨것이다. UTF-8은 인코딩하는 방식이다. 
  • 유니코드란 문자열 set에 인코딩 방식에는 다양한것이 있다. 
  • UTF-8은 문자마다 적합한 바이트 수를 차지하도록 해서 다른 방식들보다 일반적으로 적은 용량만 쓰면서도 호환문제도 가장 덜 발생하는 UTF-8이 전세계적으로 가장 널리 사용된다. 
  • URL 인코딩은 웹사이트의 주소 뒤에 URL파라미터라는 걸 넣어서 서버에 인자를 넣어서 보내는데 URL에는 아스키코드의 문자집합만 사용할 있게되어있다. 때문에 이처럼 스페이스랑 한글 등을 포함한 문자열을 이처럼 약속된 방식으로 아스키로 치환해서 서버로 전송하도록 하는게 URL 인코딩이다. 즉 아스키가 아닌 것들을 URL에 집어넣을 수 있게 아스키로 바꿔주는 인코딩이다. 
728x90
반응형