텍스트 임베딩 해보기

728x90

1. 가상환경 구축

conda create -n embedding python==3.12

2. 필수 라이브러리 설치

conda activate embedding
pip install sentence-transformers

sentence-transformers : 문장 임베딩을 위한 Python 라이브러리. 임베딩, 유사도 계산 등이 가능함

3. 임베딩 결과 출력

from sentence_transformers import SentenceTransformer

# 모델 'all-MiniLM-L6-v2' 활용
model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')

texts = ["안녕하세요"]
embeddings = model.encode(texts)

# 결과 출력
for i, embedding in enumerate(embeddings):
    print(f"텍스트: {texts[i]}")
    print(f"임베딩 벡터: {embedding}\n")
    
 
 
 '''
 [-4.78572100e-02  9.39660817e-02  1.48569271e-02  1.20851549e-03
 -2.39895601e-02 -4.76870611e-02  8.75695199e-02  3.86789367e-02
 -3.10388207e-02 -1.96185950e-02  9.75773484e-02 -1.59482919e-02
  5.45545928e-02 -5.76084182e-02  5.46547808e-02 -3.65268178e-02
  1.35871824e-02 -6.14569115e-04 -7.49759823e-02 -8.38320702e-02
  3.91827151e-02  1.01609696e-02  2.58861445e-02  1.91922337e-02
 -5.72421327e-02  4.63633332e-03  2.25055423e-02  3.14510353e-02
  1.68353468e-01 -9.46640386e-04  6.30978728e-03  6.10972159e-02...
 '''

sentence-transformers에서 numpy버전에 대한 오류 발생시, numpy<2 설치
설치한 가상환경 내에서 정확히 실행해야 오류 없이 실행 가능

저작자표시 (새창열림)

'ML_DL > 딥러닝 공부하기' 카테고리의 다른 글

[CV] Image Segmentation 이란? (1)	2025.01.20
Ollama 설치 및 Llama3.1 모델 사용 (0)	2024.08.14
validation set의 data augmentation (0)	2024.05.04
머신러닝 VS 딥러닝 (1)	2024.04.17
Word Embedding (0)	2024.01.08

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

텍스트 임베딩 해보기

1. 가상환경 구축

2. 필수 라이브러리 설치

3. 임베딩 결과 출력

'ML_DL > 딥러닝 공부하기' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역