watsonx.ai 聊天

借助 watsonx.ai 您可以在本地运行各种大型语言模型（LLM）并从中生成文本。 Spring AI watsonx.ai 支持使用WatsonxAiChatModel.spring-doc.cadn.net.cn

先决条件

您首先需要拥有 watsonx.ai 的 SaaS 实例（以及一个 IBM Cloud 帐户）。spring-doc.cadn.net.cn

请参阅免费试用以免费试用 watsonx.aispring-doc.cadn.net.cn

更多信息可以在这里找到

自动配置

Spring AI 为 watsonx.ai Chat 客户端提供 Spring Boot 自动配置。要启用它，请将以下依赖项添加到项目的 Maven 中pom.xml文件：spring-doc.cadn.net.cn

<dependency>
   <groupId>org.springframework.ai</groupId>
   <artifactId>spring-ai-watsonx-ai-spring-boot-starter</artifactId>
</dependency>

或发送到您的 Gradlebuild.gradlebuild 文件。spring-doc.cadn.net.cn

dependencies {
    implementation 'org.springframework.ai:spring-ai-watsonx-ai-spring-boot-starter'
}

聊天属性

连接属性

前缀spring.ai.watsonx.ai用作用于连接到 watsonx.ai 的属性前缀。spring-doc.cadn.net.cn

财产	描述	违约
spring.ai.watsonx.ai.base-urlspring-doc.cadn.net.cn	要连接到的 URLspring-doc.cadn.net.cn	us-south.ml.cloud.ibm.com spring-doc.cadn.net.cn
spring.ai.watsonx.ai.stream-endpointspring-doc.cadn.net.cn	流式处理终结点spring-doc.cadn.net.cn	ml/v1/text/generation_stream？version=2023-05-29spring-doc.cadn.net.cn
spring.ai.watsonx.ai.text-endpointspring-doc.cadn.net.cn	文本端点spring-doc.cadn.net.cn	ml/v1/text/generation？version=2023-05-29spring-doc.cadn.net.cn
spring.ai.watsonx.ai.project-idspring-doc.cadn.net.cn	项目 IDspring-doc.cadn.net.cn	-spring-doc.cadn.net.cn
spring.ai.watsonx.ai.iam-tokenspring-doc.cadn.net.cn	IBM Cloud 帐户 IAM 令牌spring-doc.cadn.net.cn	-spring-doc.cadn.net.cn

财产

描述

违约

spring.ai.watsonx.ai.base-urlspring-doc.cadn.net.cn

要连接到的 URLspring-doc.cadn.net.cn

us-south.ml.cloud.ibm.com spring-doc.cadn.net.cn

spring.ai.watsonx.ai.stream-endpointspring-doc.cadn.net.cn

流式处理终结点spring-doc.cadn.net.cn

ml/v1/text/generation_stream？version=2023-05-29spring-doc.cadn.net.cn

spring.ai.watsonx.ai.text-endpointspring-doc.cadn.net.cn

文本端点spring-doc.cadn.net.cn

ml/v1/text/generation？version=2023-05-29spring-doc.cadn.net.cn

spring.ai.watsonx.ai.project-idspring-doc.cadn.net.cn

项目 IDspring-doc.cadn.net.cn

-spring-doc.cadn.net.cn

spring.ai.watsonx.ai.iam-tokenspring-doc.cadn.net.cn

IBM Cloud 帐户 IAM 令牌spring-doc.cadn.net.cn

-spring-doc.cadn.net.cn

配置属性

前缀spring.ai.watsonx.ai.chat是允许您为 Watsonx.AI 配置聊天模型实施的属性前缀。spring-doc.cadn.net.cn

财产	描述	违约
spring.ai.watsonx.ai.chat.enabledspring-doc.cadn.net.cn	启用 Watsonx.AI 聊天模型。spring-doc.cadn.net.cn	真spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.temperaturespring-doc.cadn.net.cn	模型的温度。提高温度会使模型更有创意地回答。spring-doc.cadn.net.cn	0.7spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.top-pspring-doc.cadn.net.cn	与 top-k 一起使用。较高的值（例如 0.95）将导致文本更加多样化，而较低的值（例如 0.2）将生成更集中和保守的文本。spring-doc.cadn.net.cn	1.0spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.top-kspring-doc.cadn.net.cn	降低产生无意义的可能性。较高的值（例如 100）将给出更多样化的答案，而较低的值（例如 10）将更保守。spring-doc.cadn.net.cn	50spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.decoding-methodspring-doc.cadn.net.cn	解码是模型用于在生成的输出中选择标记的过程。spring-doc.cadn.net.cn	贪婪spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.max 新令牌spring-doc.cadn.net.cn	设置 LLM 遵循的令牌限制。spring-doc.cadn.net.cn	20spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.min-new-tokensspring-doc.cadn.net.cn	设置 LLM 必须生成的令牌数量。spring-doc.cadn.net.cn	0spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.stop-sequencesspring-doc.cadn.net.cn	设置 LLM 应停止的时间。（例如，[“\n\n\n”]），那么当 LLM 生成三个连续的换行符时，它将终止。在生成 Min tokens 参数中指定的令牌数之前，将忽略停止序列。spring-doc.cadn.net.cn	-spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.repetition-penaltyspring-doc.cadn.net.cn	设置对重复项的惩罚强度。较高的值（例如 1.8）将更强烈地惩罚重复，而较低的值（例如 1.1）将更宽松。spring-doc.cadn.net.cn	1.0spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.random-seedspring-doc.cadn.net.cn	产生可重复的结果，每次设置相同的随机种子值。spring-doc.cadn.net.cn	随机生成spring-doc.cadn.net.cn
spring.ai.watsonx.ai.chat.options.modelspring-doc.cadn.net.cn	Model 是要使用的 LLM 模型的标识符。spring-doc.cadn.net.cn	谷歌/flan-ul2spring-doc.cadn.net.cn

财产

描述

违约

spring.ai.watsonx.ai.chat.enabledspring-doc.cadn.net.cn

启用 Watsonx.AI 聊天模型。spring-doc.cadn.net.cn

真spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.temperaturespring-doc.cadn.net.cn

模型的温度。提高温度会使模型更有创意地回答。spring-doc.cadn.net.cn

0.7spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.top-pspring-doc.cadn.net.cn

与 top-k 一起使用。较高的值（例如 0.95）将导致文本更加多样化，而较低的值（例如 0.2）将生成更集中和保守的文本。spring-doc.cadn.net.cn

1.0spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.top-kspring-doc.cadn.net.cn

降低产生无意义的可能性。较高的值（例如 100）将给出更多样化的答案，而较低的值（例如 10）将更保守。spring-doc.cadn.net.cn

50spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.decoding-methodspring-doc.cadn.net.cn

解码是模型用于在生成的输出中选择标记的过程。spring-doc.cadn.net.cn

贪婪spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.max 新令牌spring-doc.cadn.net.cn

设置 LLM 遵循的令牌限制。spring-doc.cadn.net.cn

20spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.min-new-tokensspring-doc.cadn.net.cn

设置 LLM 必须生成的令牌数量。spring-doc.cadn.net.cn

0spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.stop-sequencesspring-doc.cadn.net.cn

设置 LLM 应停止的时间。（例如，[“\n\n\n”]），那么当 LLM 生成三个连续的换行符时，它将终止。在生成 Min tokens 参数中指定的令牌数之前，将忽略停止序列。spring-doc.cadn.net.cn

-spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.repetition-penaltyspring-doc.cadn.net.cn

设置对重复项的惩罚强度。较高的值（例如 1.8）将更强烈地惩罚重复，而较低的值（例如 1.1）将更宽松。spring-doc.cadn.net.cn

1.0spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.random-seedspring-doc.cadn.net.cn

产生可重复的结果，每次设置相同的随机种子值。spring-doc.cadn.net.cn

随机生成spring-doc.cadn.net.cn

spring.ai.watsonx.ai.chat.options.modelspring-doc.cadn.net.cn

Model 是要使用的 LLM 模型的标识符。spring-doc.cadn.net.cn

谷歌/flan-ul2spring-doc.cadn.net.cn

运行时选项

WatsonxAiChatOptions.java 提供模型配置，例如要使用的模型、温度、频率损失等。spring-doc.cadn.net.cn

启动时，可以使用WatsonxAiChatModel(api, options)constructor 或spring.ai.watsonxai.chat.options.*性能。spring-doc.cadn.net.cn

在运行时，您可以通过向Prompt叫。例如，要覆盖特定请求的默认模型和温度：spring-doc.cadn.net.cn

ChatResponse response = chatModel.call(
    new Prompt(
        "Generate the names of 5 famous pirates.",
        WatsonxAiChatOptions.builder()
            .temperature(0.4)
        .build()
    ));

除了特定于模型的WatsonxAiChatOptions.java您还可以使用使用 ChatOptionsBuilder#builder（）创建的可移植 ChatOptions 实例。

有关更多信息，请访问 watsonx-parameters-info

使用示例

public class MyClass {

    private static final String MODEL = "google/flan-ul2";
    private final WatsonxAiChatModel chatModel;

    @Autowired
    MyClass(WatsonxAiChatModel chatModel) {
        this.chatModel = chatModel;
    }

    public String generate(String userInput) {

        WatsonxAiChatOptions options = WatsonxAiChatOptions.builder()
            .model(MODEL)
            .decodingMethod("sample")
            .randomSeed(1)
            .build();

        Prompt prompt = new Prompt(new SystemMessage(userInput), options);

        var results = this.chatModel.call(prompt);

        var generatedText = results.getResult().getOutput().getContent();

        return generatedText;
    }

    public String generateStream(String userInput) {

        WatsonxAiChatOptions options = WatsonxAiChatOptions.builder()
            .model(MODEL)
            .decodingMethod("greedy")
            .randomSeed(2)
            .build();

        Prompt prompt = new Prompt(new SystemMessage(userInput), options);

        var results = this.chatModel.stream(prompt).collectList().block(); // wait till the stream is resolved (completed)

        var generatedText = results.stream()
            .map(generation -> generation.getResult().getOutput().getContent())
            .collect(Collectors.joining());

        return generatedText;
    }

}