Embedding - OpenAI
基本介绍
OpenAI 向量嵌入器是 Eino Embedding 接口的一个实现,用于将文本转换为向量表示。该组件实现了 [🚧]Eino: Embedding 使用说明,主要用于以下场景:
- 需要将文本转换为高维向量表示
- 使用 OpenAI 的 embedding 模型
- 使用 Azure OpenAI Service 的 embedding 模型
使用方式
组件初始化
OpenAI 向量嵌入器通过 NewEmbedder
函数进行初始化,主要配置参数如下:
embedder, err := NewEmbedder(ctx, &EmbeddingConfig{
// OpenAI API 配置
APIKey: "your-api-key",
Model: "text-embedding-ada-002",
Timeout: 30 * time.Second,
// 可选:Azure OpenAI Service 配置
ByAzure: true,
BaseURL: "https://your-resource.openai.azure.com",
APIVersion: "2023-05-15",
// 可选:高级配置
EncodingFormat: &format, // 编码格式
Dimensions: &dimension, // 向量维度
User: &user, // 用户标识
})
生成向量嵌入
文本向量化通过 EmbedStrings
方法实现:
embeddings, err := embedder.EmbedStrings(ctx, []string{
"第一段文本",
"第二段文本",
})
完整使用示例
基本使用
package main
import (
"context"
"time"
"github.com/cloudwego/eino-ext/components/embedding/openai"
)
func main() {
ctx := context.Background()
// 初始化嵌入器
embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
APIKey: "your-api-key",
Model: "text-embedding-ada-002",
Timeout: 30 * time.Second,
})
if err != nil {
panic(err)
}
// 生成文本向量
texts := []string{
"这是第一段示例文本",
"这是第二段示例文本",
}
embeddings, err := embedder.EmbedStrings(ctx, texts)
if err != nil {
panic(err)
}
// 使用生成的向量
for i, embedding := range embeddings {
println("文本", i+1, "的向量维度:", len(embedding))
}
}
相关文档
最后修改
January 14, 2025
: Update release-v0_12_0.md (#1204) (5230605)