（ONNX）变形金刚 ((ONNX) Transformers) | Spring AI1.0.0-M2中文文档|Spring官方文档|SpringBoot 教程|Spring中文网

此版本仍在开发中，尚未被视为稳定版本。最新的快照版本请使用 Spring AI 1.0.0-SNAPSHOT！spring-doc.cn

请参阅 Dependency Management 部分，将 Spring AI BOM 添加到您的构建文件中。请参阅 Repositories 部分，将这些存储库添加到您的构建系统中。

财产	描述	违约
spring.ai.embedding.transformer.enabledspring-doc.cn	启用 Transformer Embedding 模型。spring-doc.cn	真spring-doc.cn
spring.ai.embedding.transformer.tokenizer.urispring-doc.cn	由 ONNX 引擎创建的预训练 HuggingFaceTokenizer 的 URI（例如 tokenizer.json）。spring-doc.cn	onnx/all-MiniLM-L6-v2/tokenizer.jsonspring-doc.cn
spring.ai.embedding.transformer.tokenizer.optionsspring-doc.cn	HuggingFaceTokenizer 选项，例如 'addSpecialTokens'、'modelMaxLength'、'truncation'、'padding'、'maxLength'、'stride'、'padToMultipleOf'。留空可回退到默认值。spring-doc.cn	空spring-doc.cn
spring.ai.embedding.transformer.cache.enabledspring-doc.cn	启用远程资源缓存。spring-doc.cn	真spring-doc.cn
spring.ai.embedding.transformer.cache.directoryspring-doc.cn	缓存远程资源（如 ONNX 模型）的目录路径spring-doc.cn	${java.io.tmpdir}/spring-ai-onnx-modelspring-doc.cn
spring.ai.embedding.transformer.onnx.modelUrispring-doc.cn	现有的预训练 ONNX 模型。spring-doc.cn	onnx/all-MiniLM-L6-v2/model.onnxspring-doc.cn
spring.ai.embedding.transformer.onnx.model输出名称spring-doc.cn	ONNX 模型的输出节点名称，我们将用于嵌入计算。spring-doc.cn	last_hidden_statespring-doc.cn
spring.ai.embedding.transformer.onnx.gpuDeviceIdspring-doc.cn	要执行的 GPU 设备 ID。仅当 >= 0 时适用。否则为 Ignored。（需要额外的 onnxruntime_gpu 依赖项）spring-doc.cn	-1spring-doc.cn
spring.ai.embedding.transformer.metadataModespring-doc.cn	指定 Documents 内容和元数据的哪些部分将用于计算嵌入。spring-doc.cn	没有spring-doc.cn

财产

描述

违约

spring.ai.embedding.transformer.enabledspring-doc.cn

启用 Transformer Embedding 模型。spring-doc.cn

真spring-doc.cn

spring.ai.embedding.transformer.tokenizer.urispring-doc.cn

由 ONNX 引擎创建的预训练 HuggingFaceTokenizer 的 URI（例如 tokenizer.json）。spring-doc.cn

onnx/all-MiniLM-L6-v2/tokenizer.jsonspring-doc.cn

spring.ai.embedding.transformer.tokenizer.optionsspring-doc.cn

HuggingFaceTokenizer 选项，例如 'addSpecialTokens'、'modelMaxLength'、'truncation'、'padding'、'maxLength'、'stride'、'padToMultipleOf'。留空可回退到默认值。spring-doc.cn

空spring-doc.cn

spring.ai.embedding.transformer.cache.enabledspring-doc.cn

启用远程资源缓存。spring-doc.cn

真spring-doc.cn

spring.ai.embedding.transformer.cache.directoryspring-doc.cn

缓存远程资源（如 ONNX 模型）的目录路径spring-doc.cn

${java.io.tmpdir}/spring-ai-onnx-modelspring-doc.cn

spring.ai.embedding.transformer.onnx.modelUrispring-doc.cn

现有的预训练 ONNX 模型。spring-doc.cn

onnx/all-MiniLM-L6-v2/model.onnxspring-doc.cn

spring.ai.embedding.transformer.onnx.model输出名称spring-doc.cn

ONNX 模型的输出节点名称，我们将用于嵌入计算。spring-doc.cn

last_hidden_statespring-doc.cn

spring.ai.embedding.transformer.onnx.gpuDeviceIdspring-doc.cn

要执行的 GPU 设备 ID。仅当 >= 0 时适用。否则为 Ignored。（需要额外的 onnxruntime_gpu 依赖项）spring-doc.cn

-1spring-doc.cn

spring.ai.embedding.transformer.metadataModespring-doc.cn

指定 Documents 内容和元数据的哪些部分将用于计算嵌入。spring-doc.cn

没有spring-doc.cn

如果您看到类似的错误，则还需要启用分词器填充，如下所示：Caused by: ai.onnxruntime.OrtException: Supplied array is ragged,..application.propertiesspring-doc.cn

spring.ai.embedding.transformer.tokenizer.options.padding=true

如果收到类似的错误，则需要根据模型将模型输出名称设置为正确的值。请考虑错误消息中列出的名称。例如：The generative output names don’t contain expected: last_hidden_state. Consider one of the available model outputs: token_embeddings, ….spring-doc.cn

spring.ai.embedding.transformer.onnx.modelOutputName=token_embeddings

如果您收到类似，这意味着您的模型大于 2GB，并序列化为两个文件：和 .ai.onnxruntime.OrtException: Error code - ORT_FAIL - message: Deserialize tensor onnx::MatMul_10319 failed.GetFileLength for ./model.onnx_data failed:Invalid fd was supplied: -1model.onnxmodel.onnx_dataspring-doc.cn

称为 External Data，应位于的同一目录下。model.onnx_datamodel.onnxspring-doc.cn

目前，唯一的解决方法是将 large 复制到运行 Boot 应用程序的文件夹中。model.onnx_dataspring-doc.cn

如果您收到类似，这意味着您使用的是 GPU parameters ，但缺少 onnxruntime_gpu 依赖项。ai.onnxruntime.OrtException: Error code - ORT_EP_FAIL - message: Failed to find CUDA shared providerspring.ai.embedding.transformer.onnx.gpuDeviceIdspring-doc.cn

<dependency>
    <groupId>com.microsoft.onnxruntime</groupId>
    <artifactId>onnxruntime_gpu</artifactId>
</dependency>

请根据 CUDA 版本（ONNX Java Runtime）选择合适的 onnxruntime_gpu 版本。spring-doc.cn

请参阅 Dependency Management 部分，将 Spring AI BOM 添加到您的构建文件中。

尺寸spring-doc.cn

384spring-doc.cn

平均性能spring-doc.cn

58.80spring-doc.cn

速度spring-doc.cn

14200 句/秒spring-doc.cn

大小spring-doc.cn

80兆字节spring-doc.cn

如果手动创建的实例，则必须在设置属性之后和使用客户端之前调用该方法。TransformersEmbeddingModelafterPropertiesSet()