임베딩이란
텍스트를 고차원 벡터로 변환하는 것. 의미적으로 유사한 텍스트는 벡터 공간에서 가까이 위치합니다.
구현
import openai
response = openai.Embedding.create(
model="text-embedding-3-small",
input="서버 모니터링 방법"
)
vector = response.data[0].embedding # 1536차원 벡터코사인 유사도
import numpy as np
def cosine_similarity(a, b):
return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
댓글 0