1. 가상환경 구축

conda create -n embedding python==3.12

2. 필수 라이브러리 설치

conda activate embedding
pip install sentence-transformers
  • sentence-transformers : 문장 임베딩을 위한 Python 라이브러리. 임베딩, 유사도 계산 등이 가능함

3. 임베딩 결과 출력

from sentence_transformers import SentenceTransformer

# 모델 'all-MiniLM-L6-v2' 활용
model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')

texts = ["안녕하세요"]
embeddings = model.encode(texts)

# 결과 출력
for i, embedding in enumerate(embeddings):
    print(f"텍스트: {texts[i]}")
    print(f"임베딩 벡터: {embedding}\n")
    
 
 
 '''
 [-4.78572100e-02  9.39660817e-02  1.48569271e-02  1.20851549e-03
 -2.39895601e-02 -4.76870611e-02  8.75695199e-02  3.86789367e-02
 -3.10388207e-02 -1.96185950e-02  9.75773484e-02 -1.59482919e-02
  5.45545928e-02 -5.76084182e-02  5.46547808e-02 -3.65268178e-02
  1.35871824e-02 -6.14569115e-04 -7.49759823e-02 -8.38320702e-02
  3.91827151e-02  1.01609696e-02  2.58861445e-02  1.91922337e-02
 -5.72421327e-02  4.63633332e-03  2.25055423e-02  3.14510353e-02
  1.68353468e-01 -9.46640386e-04  6.30978728e-03  6.10972159e-02...
 '''

  • sentence-transformers에서 numpy버전에 대한 오류 발생시, numpy<2 설치
  • 설치한 가상환경 내에서 정확히 실행해야 오류 없이 실행 가능

+ Recent posts