1.임베딩이란? 컴퓨터는 자연어를 직접 처리할 수 없고 수치연산만 가능하기 때문에 자연어를 숫자나 벡터형태로 변환을 해야 합니다. 이런 일련과정을 자연어 처리 분야에서는 임베딩(embedding)이라고 합니다. 즉, 임베딩은 단어나 문장을 수치화해 벡터공간으로 표현하는 과정을 의미합니다. 2. 단어 임베딩 단어임베딩은 말뭉치에서 각각의 단어를 벡터로 변환하는 기법을 의미합니다. 토크나이징을 통해 추출된 토큰들을 어떻게 단어 임베딩하는지 알아 보겠습니다. 2.1 원-핫 인코딩 원-핫 인코딩(one-hot encoding)은 단어를 숫자 벡터로 변환하는 가장 기본적인 방법입니다. 명칭에서도 알 수 있듯이 요소들 중 단 하나의 값만 1이고 나머지 요소값은 0인 인코딩을 의미합니다.(단 하나의 값만 1이기 때문..