텍스트 임베딩 해보기

2024. 8. 10. 17:59·ML_DL/딥러닝 공부하기
목차
  1. 1. 가상환경 구축
  2. 2. 필수 라이브러리 설치
  3. 3. 임베딩 결과 출력
728x90
반응형

1. 가상환경 구축

conda create -n embedding python==3.12

2. 필수 라이브러리 설치

conda activate embedding
pip install sentence-transformers
  • sentence-transformers : 문장 임베딩을 위한 Python 라이브러리. 임베딩, 유사도 계산 등이 가능함

3. 임베딩 결과 출력

from sentence_transformers import SentenceTransformer

# 모델 'all-MiniLM-L6-v2' 활용
model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')

texts = ["안녕하세요"]
embeddings = model.encode(texts)

# 결과 출력
for i, embedding in enumerate(embeddings):
    print(f"텍스트: {texts[i]}")
    print(f"임베딩 벡터: {embedding}\n")
    
 
 
 '''
 [-4.78572100e-02  9.39660817e-02  1.48569271e-02  1.20851549e-03
 -2.39895601e-02 -4.76870611e-02  8.75695199e-02  3.86789367e-02
 -3.10388207e-02 -1.96185950e-02  9.75773484e-02 -1.59482919e-02
  5.45545928e-02 -5.76084182e-02  5.46547808e-02 -3.65268178e-02
  1.35871824e-02 -6.14569115e-04 -7.49759823e-02 -8.38320702e-02
  3.91827151e-02  1.01609696e-02  2.58861445e-02  1.91922337e-02
 -5.72421327e-02  4.63633332e-03  2.25055423e-02  3.14510353e-02
  1.68353468e-01 -9.46640386e-04  6.30978728e-03  6.10972159e-02...
 '''

  • sentence-transformers에서 numpy버전에 대한 오류 발생시, numpy<2 설치
  • 설치한 가상환경 내에서 정확히 실행해야 오류 없이 실행 가능
저작자표시 (새창열림)

'ML_DL > 딥러닝 공부하기' 카테고리의 다른 글

[CV] Image Segmentation 이란?  (1) 2025.01.20
Ollama 설치 및 Llama3.1 모델 사용  (0) 2024.08.14
validation set의 data augmentation  (0) 2024.05.04
머신러닝 VS 딥러닝  (1) 2024.04.17
Word Embedding  (0) 2024.01.08
  1. 1. 가상환경 구축
  2. 2. 필수 라이브러리 설치
  3. 3. 임베딩 결과 출력
'ML_DL/딥러닝 공부하기' 카테고리의 다른 글
  • [CV] Image Segmentation 이란?
  • Ollama 설치 및 Llama3.1 모델 사용
  • validation set의 data augmentation
  • 머신러닝 VS 딥러닝
swwho
swwho
일상을 데이터화하다
  • swwho
    하루한장
    swwho
  • 전체
    오늘
    어제
    • 분류 전체보기 (188)
      • ML_DL (39)
        • MUJAKJUNG (무작정 시리즈) (18)
        • 딥러닝 공부하기 (21)
      • 데이터사이언스 (1)
        • EDA (1)
        • 데이터과학을 위한 통계 (0)
      • 데이터엔지니어링 (2)
      • 논문리뷰 (2)
        • Computer Vision (2)
      • Python 활용하기 (12)
      • 코딩테스트 (127)
        • Python (109)
        • MySQL (14)
      • Git (3)
      • MySQL 활용하기 (0)
      • 일상 이야기 (1)
  • 블로그 메뉴

    • 홈
    • 태그
  • 최근 글

  • 250x250
  • hELLO· Designed By정상우.v4.10.3
swwho
텍스트 임베딩 해보기
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.