1. 가상환경 구축
conda create -n embedding python==3.12
2. 필수 라이브러리 설치
conda activate embedding
pip install sentence-transformers
- sentence-transformers : 문장 임베딩을 위한 Python 라이브러리. 임베딩, 유사도 계산 등이 가능함
3. 임베딩 결과 출력
from sentence_transformers import SentenceTransformer
# 모델 'all-MiniLM-L6-v2' 활용
model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
texts = ["안녕하세요"]
embeddings = model.encode(texts)
# 결과 출력
for i, embedding in enumerate(embeddings):
print(f"텍스트: {texts[i]}")
print(f"임베딩 벡터: {embedding}\n")
'''
[-4.78572100e-02 9.39660817e-02 1.48569271e-02 1.20851549e-03
-2.39895601e-02 -4.76870611e-02 8.75695199e-02 3.86789367e-02
-3.10388207e-02 -1.96185950e-02 9.75773484e-02 -1.59482919e-02
5.45545928e-02 -5.76084182e-02 5.46547808e-02 -3.65268178e-02
1.35871824e-02 -6.14569115e-04 -7.49759823e-02 -8.38320702e-02
3.91827151e-02 1.01609696e-02 2.58861445e-02 1.91922337e-02
-5.72421327e-02 4.63633332e-03 2.25055423e-02 3.14510353e-02
1.68353468e-01 -9.46640386e-04 6.30978728e-03 6.10972159e-02...
'''
- sentence-transformers에서 numpy버전에 대한 오류 발생시, numpy<2 설치
- 설치한 가상환경 내에서 정확히 실행해야 오류 없이 실행 가능