任务

本节将更详细地介绍如何在 Spring Cloud Data Flow 上编排 Spring Cloud Task 应用程序。spring-doc.cn

如果您刚开始使用 Spring Cloud Data Flow,那么在深入研究本节之前,您可能应该阅读“Local”、“Cloud Foundry”或“Kubernetes”的入门指南。spring-doc.cn

25. 简介

任务应用程序的生存期很短,这意味着它会故意停止运行,可以按需运行或计划在以后运行。 一个用例可能是抓取网页并写入数据库。spring-doc.cn

Spring Cloud Task 框架基于 Spring Boot,并增加了 Boot 应用程序记录短期应用程序生命周期事件的能力,例如启动时间、结束时间和退出状态。 TaskExecution 文档显示了数据库中存储的信息。 Spring Cloud Task 应用程序中代码执行的入口点通常是 Boot 接口的实现,如本例所示。CommandLineRunnerspring-doc.cn

Spring Batch 项目可能是 Spring 开发人员编写短期应用程序时想到的。 Spring Batch 提供了比 Spring Cloud Task 更丰富的功能集,建议在处理大量数据时使用。 一个用例可能是读取许多 CSV 文件,转换每行数据,并将每个转换后的行写入数据库。 Spring Batch 提供了自己的数据库架构,其中包含有关 Spring Batch 作业执行的更丰富的信息集。 Spring Cloud 任务与 Spring Batch 集成,因此,如果 Spring Cloud 任务应用程序定义了 Spring Batch ,则会在 Spring Cloud 任务和 Spring Cloud Batch 执行表之间创建链接。Jobspring-doc.cn

在本地计算机上运行 Data Flow 时,任务将在单独的 JVM 中启动。 在 Cloud Foundry 上运行时,使用 Cloud Foundry 的 Task 功能启动任务。在 Kubernetes 上运行时,任务是使用 或 a 资源启动的。PodJobspring-doc.cn

26. 任务的生命周期

在深入研究创建 Task 的细节之前,您应该了解 Spring Cloud Data Flow 上下文中任务的典型生命周期:spring-doc.cn

26.1. 创建 Task 应用程序

虽然 Spring Cloud Task 确实提供了许多开箱即用的应用程序(在 spring-cloud-task-app-starters),但大多数任务应用程序都需要自定义开发。 要创建自定义任务应用程序:spring-doc.cn

  1. 使用 Spring Initializer 创建一个新项目,确保选择以下Starters:spring-doc.cn

    1. Cloud Task:此依赖项是 .spring-cloud-starter-taskspring-doc.cn

    2. JDBC:此依赖项是Starters。spring-jdbcspring-doc.cn

    3. 选择您的数据库依赖项:输入 Data Flow 当前使用的数据库依赖项。例如:。H2spring-doc.cn

  2. 在您的新项目中,创建一个新类作为您的主类,如下所示:spring-doc.cn

    @EnableTask
    @SpringBootApplication
    public class MyTask {
    
        public static void main(String[] args) {
    		SpringApplication.run(MyTask.class, args);
    	}
    }
  3. 使用此类,您需要应用程序中的一个或多个 OR 实现。您可以实现自己的方法,也可以使用 Spring Boot 提供的方法(例如,有一个用于运行批处理作业)。CommandLineRunnerApplicationRunnerspring-doc.cn

  4. 使用 Spring Boot 将应用程序打包到 über jar 中是通过标准 Spring Boot 约定完成的。 可以按如下所述注册和部署打包的应用程序。spring-doc.cn

26.1.1. 任务数据库配置

启动任务应用程序时,请确保 Spring Cloud Data Flow 正在使用的数据库驱动程序也是任务应用程序的依赖项。 例如,如果您的 Spring Cloud Data Flow 设置为使用 Postgresql,请确保任务应用程序也将 Postgresql 作为依赖项。
当您在外部(即从命令行)运行任务并希望 Spring Cloud Data Flow 在其 UI 中显示TaskExecutions时,请确保在它们之间共享通用数据源设置。 默认情况下,Spring Cloud Task 使用本地 H2 实例,并且执行记录到 Spring Cloud Data Flow 使用的数据库中。

26.2. 注册 Task 应用程序

您可以使用 Spring Cloud Data Flow Shell 命令向 App Registry 注册 Task 应用程序。 您必须提供唯一名称和可解析为应用程序构件的 URI。对于类型,请指定 。 下面的清单显示了三个示例:app registertaskspring-doc.cn

dataflow:>app register --name task1 --type task --uri maven://com.example:mytask:1.0.2

dataflow:>app register --name task2 --type task --uri file:///Users/example/mytask-1.0.2.jar

dataflow:>app register --name task3 --type task --uri https://example.com/mytask-1.0.2.jar

在为方案提供 URI 时,格式应符合以下条件:mavenspring-doc.cn

maven://<groupId>:<artifactId>[:<extension>[:<classifier>]]:<version>

如果要一次注册多个应用程序,可以将它们存储在属性文件中,其中键的格式为 URI,值为 URI。 例如,下面的清单将是一个有效的属性文件:<type>.<name>spring-doc.cn

task.cat=file:///tmp/cat-1.2.1.BUILD-SNAPSHOT.jar
task.hat=file:///tmp/hat-1.2.1.BUILD-SNAPSHOT.jar

然后,您可以使用该命令并使用选项提供属性文件的位置,如下所示:app import--urispring-doc.cn

app import --uri file:///tmp/task-apps.properties

例如,如果要在单个操作中注册 Data Flow 附带的所有任务应用程序,可以使用以下命令执行此操作:spring-doc.cn

dataflow:>app import --uri https://dataflow.spring.io/task-maven-latest

您还可以传递选项 (默认情况下) 来指示是否应在 shell 进程本身中解析属性文件位置。 如果应从 Data Flow Server 进程解析位置,请指定 .--localTRUE--local falsespring-doc.cn

使用 或 时,如果任务应用程序已注册到 提供的 name 和 version,默认情况下不会覆盖它。如果要覆盖 预先存在的 Task 应用程序,包括该选项。app registerapp importuriuri-metadata--forcespring-doc.cn

在某些情况下,资源在服务器端解析。 在其他情况下,URI 将传递到运行时容器实例,并在其中进行解析。 有关更多详细信息,请参阅每个 Data Flow Server 的特定文档。

26.3. 创建 Task 定义

您可以通过提供定义名称以及 应用于任务执行的属性。您可以通过以下方式创建任务定义 RESTful API 或 shell。要使用 shell 创建任务定义,请使用命令创建任务定义,如以下示例所示:task createspring-doc.cn

dataflow:>task create mytask --definition "timestamp --format=\"yyyy\""
Created new task 'mytask'

您可以通过 RESTful API 或 shell 获取当前任务定义的列表。 要使用 shell 获取任务定义列表,请使用命令。task listspring-doc.cn

26.3.1. 最大任务定义名称长度

任务定义名称的最大字符长度取决于平台。spring-doc.cn

有关资源命名的详细信息,请参阅平台文档。 本地平台将任务定义名称存储在最大大小为 255 的数据库列中。
表 1.按平台划分的最大任务定义名称字符长度
Kubernetes 裸 Pod Kubernetes 作业 云铸造 当地

63spring-doc.cn

52spring-doc.cn

63spring-doc.cn

255spring-doc.cn

26.3.2. 自动创建 Task 定义

从版本 2.3.0 开始,您可以通过设置为 来将数据流服务器配置为自动创建任务定义。 这不是默认行为,但是为了方便起见而提供的。 启用此属性后,任务启动请求可以将已注册的任务应用程序名称指定为任务名称。 如果任务应用程序已注册,则服务器将根据需要创建一个仅指定应用程序名称的基本任务定义。这消除了类似于以下内容的手动步骤:spring.cloud.dataflow.task.autocreate-task-definitionstruespring-doc.cn

dataflow:>task create mytask --definition "mytask"

您仍然可以为每个任务启动请求指定命令行参数和部署属性。spring-doc.cn

26.4. 启动任务

临时任务可以通过 RESTful API 或 shell 启动。 要通过 shell 启动临时任务,请使用以下命令,如以下示例所示:task launchspring-doc.cn

dataflow:>task launch mytask
Launched task 'mytask'

启动任务后,您可以设置在启动任务时需要作为命令行参数传递给任务应用程序的任何属性,如下所示:spring-doc.cn

dataflow:>task launch mytask --arguments "--server.port=8080 --custom=value"
参数需要作为空格分隔的值传递。

您可以使用 option 传入用于自身的其他属性。 此选项的格式是前缀为 的逗号分隔的属性字符串。 属性作为应用程序属性传递给。 由实现选择如何将这些传递到实际的任务应用程序中。 如果属性的前缀为 instead of ,则将其作为部署属性传递给,其含义可能特定于实现。TaskLauncher--propertiesapp.<task definition name>.<property>TaskLauncherdeployerappTaskLauncherTaskLauncherspring-doc.cn

dataflow:>task launch mytask --properties "deployer.timestamp.custom1=value1,app.timestamp.custom2=value2"

26.4.1. 应用程序属性

每个应用程序都使用属性来自定义其行为。例如,任务设置建立与默认值不同的输出格式。timestampformatspring-doc.cn

dataflow:> task create --definition "timestamp --format=\"yyyy\"" --name printTimeStamp

此属性实际上与时间戳应用程序指定的属性相同。 Data Flow 添加了使用速记形式而不是 . 您还可以指定普通版本,如以下示例所示:timestamptimestamp.formatformattimestamp.formatspring-doc.cn

dataflow:> task create --definition "timestamp --timestamp.format=\"yyyy\"" --name printTimeStamp

这种速记行为将在 Stream Application Properties 一节中详细讨论。 如果已注册应用程序属性元数据,则可以在键入后在 shell 中使用 Tab 键自动补全来获取候选属性名称的列表。--spring-doc.cn

shell 为应用程序属性提供 Tab 键自动补全。shell 命令为所有受支持的属性提供了其他文档。支持的任务为 。app info --name <appName> --type <appType><appType>taskspring-doc.cn

在 Kubernetes 上重新启动 Spring Batch 作业时,必须使用 或 的入口点。shellboot
Kubernetes 上包含敏感信息的应用程序属性

启动某些属性可能包含敏感信息的任务应用程序时,请使用 或 作为 .这是因为 (default) 将所有属性转换为命令行参数,因此,在某些环境中可能不安全。shellbootentryPointStyleexecspring-doc.cn

26.4.2. 通用应用程序属性

除了通过 DSL 进行配置之外,Spring Cloud Data Flow 还提供了一种机制,用于设置其启动的所有任务应用程序通用的属性。 您可以通过在启动服务器时添加前缀为 的属性来执行此操作。 然后,服务器将所有属性(不带前缀)传递给它启动的实例。spring.cloud.dataflow.applicationProperties.taskspring-doc.cn

例如,您可以通过使用以下选项启动 Data Flow 服务器,将所有启动的应用程序配置为使用 and 属性:prop1prop2spring-doc.cn

--spring.cloud.dataflow.applicationProperties.task.prop1=value1
--spring.cloud.dataflow.applicationProperties.task.prop2=value2

这会导致 and 属性传递给所有启动的应用程序。prop1=value1prop2=value2spring-doc.cn

使用此机制配置的属性的优先级低于任务部署属性。 如果在任务启动时指定了具有相同键的属性(例如,覆盖 common 属性),则会覆盖这些属性。app.trigger.prop2

26.5. 限制并发任务启动次数

Spring Cloud Data Flow 允许用户限制每个已配置平台的最大并发运行任务数,以防止 IaaS 或硬件资源饱和。 默认情况下,该限制设置为适用于所有支持的平台。如果平台实例上并发运行的任务数大于或等于限制,则下一个任务启动请求将失败,并通过 RESTful API、Shell 或 UI 返回错误消息。 您可以通过设置相应的 deployer 属性来为平台实例配置此限制,其中 是已配置的平台帐户的名称(如果未明确配置帐户)。 这是指当前支持的部署程序之一:或 .对于 ,属性为 。(区别在于已添加到路径中)。20spring.cloud.dataflow.task.platform.<platform-type>.accounts[<account-name>].maximumConcurrentTasks<account-name>default<platform-type>localkubernetescloudfoundryspring.cloud.dataflow.task.platform.<platform-type>.accounts[<account-name>].deployment.maximumConcurrentTasksdeploymentspring-doc.cn

如果可能,每个受支持平台的实现通过查询底层平台的运行时状态来确定当前正在运行的任务的数量。标识 的方法因平台而异。 例如,在本地主机上启动任务时,将使用 . 为每个启动请求运行一个进程,并在内存中跟踪这些进程。在这种情况下,我们不会查询底层操作系统,因为以这种方式识别任务是不切实际的。 对于 Cloud Foundry,任务是其部署模型支持的核心概念。所有任务的状态)可直接通过 API 获得。 这意味着账户的组织和空间中的每个正在运行的任务容器都包含在正在运行的执行计数中,无论它是通过使用 Spring Cloud Data Flow 还是直接调用来启动的。 对于 Kubernetes,如果成功,通过 启动任务将导致 Pod 运行,我们预计该 Pod 最终会完成或失败。 在这种环境中,通常没有简单的方法来识别与任务对应的 Pod。 因此,我们只计算由 . 由于任务Starters在 Pod 的元数据中提供标签,因此我们根据此标签的存在来筛选所有正在运行的 Pod。TaskLaunchertaskLocalTaskLauncherLocalTaskLauncherCloudFoundryTaskLauncherKubernetesTaskLauncherKubernetesTaskLaunchertask-namespring-doc.cn

26.6. 查看任务执行

启动任务后,任务的状态将存储在关系数据库中。状态 包括:spring-doc.cn

您可以通过 RESTful API 或 shell 检查任务执行的状态。 要通过 shell 显示最新的任务执行情况,请使用命令。task execution listspring-doc.cn

要仅获取一个任务定义的任务执行列表,请添加 和 任务定义名称 — 例如,.检索完整 details 中,请使用带有任务执行 ID 的命令, 例如。--nametask execution list --name footask execution statustask execution status --id 549spring-doc.cn

26.7. 销毁任务定义

销毁任务定义会从定义存储库中删除该定义。 这可以通过 RESTful API 或 shell 来完成。 要通过 shell 销毁任务,请使用命令,如以下示例所示:task destroyspring-doc.cn

dataflow:>task destroy mytask
Destroyed task 'mytask'

该命令还有一个选项,用于执行正在销毁的任务,如以下示例所示:task destroycleanupspring-doc.cn

dataflow:>task destroy mytask --cleanup
Destroyed task 'mytask'

默认情况下,该选项设置为 (即,默认情况下,销毁任务时不会清理任务执行)。cleanupfalsespring-doc.cn

要通过 shell 销毁所有任务,请使用以下示例中所示的命令:task all destroyspring-doc.cn

dataflow:>task all destroy
Really destroy all tasks? [y, n]: y
All tasks destroyed

如果需要,您可以使用 force 开关:spring-doc.cn

dataflow:>task all destroy --force
All tasks destroyed

之前为定义启动的任务的任务执行信息将保留在任务存储库中。spring-doc.cn

这不会停止此定义的任何当前正在运行的任务。相反,它会从数据库中删除任务定义。

task destroy <task-name>仅删除定义,而不删除在 Cloud Foundry 上部署的任务。 删除任务的唯一方法是通过 CLI 分两步完成:spring-doc.cn

+ .使用命令获取应用程序列表。 .确定需要删除的任务应用程序,然后执行命令。cf appscf delete <task-name>spring-doc.cn

26.8. 验证任务

有时,任务定义中包含的应用程序在其注册中具有无效的 URI。 这可能是由于在应用程序注册时输入了无效的 URI,或者从要从中提取应用程序的存储库中删除了应用程序。 要验证任务中包含的所有应用程序都是可解析的,请使用以下命令:validatespring-doc.cn

dataflow:>task validate time-stamp
╔══════════╤═══════════════╗
║Task Name │Task Definition║
╠══════════╪═══════════════╣
║time-stamp│timestamp      ║
╚══════════╧═══════════════╝


time-stamp is a valid task.
╔═══════════════╤═════════════════╗
║   App Name    │Validation Status║
╠═══════════════╪═════════════════╣
║task:timestamp │valid            ║
╚═══════════════╧═════════════════╝

在前面的示例中,用户验证了他们的时间戳任务。申请有效。 现在,我们可以看到,如果 Stream 定义包含具有无效 URI 的已注册应用程序,会发生什么情况:task:timestampspring-doc.cn

dataflow:>task validate bad-timestamp
╔═════════════╤═══════════════╗
║  Task Name  │Task Definition║
╠═════════════╪═══════════════╣
║bad-timestamp│badtimestamp   ║
╚═════════════╧═══════════════╝


bad-timestamp is an invalid task.
╔══════════════════╤═════════════════╗
║     App Name     │Validation Status║
╠══════════════════╪═════════════════╣
║task:badtimestamp │invalid          ║
╚══════════════════╧═════════════════╝

在这种情况下,Spring Cloud Data Flow 会指出该任务无效,因为 URI 无效。task:badtimestampspring-doc.cn

26.9. 停止任务执行

在某些情况下,由于平台或应用程序业务逻辑本身的问题,在平台上运行的任务可能不会停止。 对于此类情况, Spring Cloud Data Flow 提供了向平台发送请求以结束任务的功能。 为此,请为一组给定的任务执行提交一个,如下所示:task execution stopspring-doc.cn

task execution stop --ids 5

Request to stop the task execution with id(s): 5 has been submitted

使用上述命令,将停止执行的触发器提交到底层 Deployer 实现。因此,该操作将停止该任务。当我们查看任务执行的结果时,我们看到任务执行已完成,退出代码为 0:id=5spring-doc.cn

dataflow:>task execution list
╔══════════╤══╤════════════════════════════╤════════════════════════════╤═════════╗
║Task Name │ID│         Start Time         │          End Time          │Exit Code║
╠══════════╪══╪════════════════════════════╪════════════════════════════╪═════════╣
║batch-demo│5 │Mon Jul 15 13:58:41 EDT 2019│Mon Jul 15 13:58:55 EDT 2019│0        ║
║timestamp │1 │Mon Jul 15 09:26:41 EDT 2019│Mon Jul 15 09:26:41 EDT 2019│0        ║
╚══════════╧══╧════════════════════════════╧════════════════════════════╧═════════╝

如果您为具有关联的子任务执行的任务执行(例如组合任务)提交停止,则会为每个子任务执行发送停止请求。spring-doc.cn

当停止具有正在运行的 Spring Batch 作业的任务执行时,该作业的批处理状态为 。 请求停止时,每个受支持的平台都会向任务应用程序发送一个 SIG-INT。这允许 Spring Cloud Task 捕获应用程序的状态。但是, Spring Batch 不处理 SIG-INT,因此,作业会停止,但仍处于 STARTED 状态。STARTED

26.9.1. 停止在 Spring Cloud Data Flow 之外启动的任务执行

您可能希望停止已在 Spring Cloud Data Flow 之外启动的任务。这方面的一个例子是由远程批量分区应用程序启动的工作程序应用程序。 在这种情况下,远程批量分区应用程序会为每个工作程序应用程序存储 。但是,不会存储任何平台信息。 因此,当 Spring Cloud Data Flow 必须停止远程批量分区应用程序及其工作程序应用程序时,您需要指定平台名称,如下所示:external-execution-idspring-doc.cn

dataflow:>task execution stop --ids 1 --platform myplatform
Request to stop the task execution with id(s): 1 for platform myplatform has been submitted

27. 订阅 Task 和 Batch 事件

您还可以在启动任务时利用各种任务和批处理事件。 如果启用任务以生成任务或批处理事件(在 Kafka 作为 Binders 的情况下,具有 and 的其他依赖项),则会在任务生命周期内发布这些事件。 默认情况下,代理上那些已发布事件(Rabbit、Kafka 等)的目标名称是事件名称本身(例如:、 、 等)。spring-cloud-task-streamspring-cloud-stream-binder-kafkatask-eventsjob-execution-eventsspring-doc.cn

dataflow:>task create myTask --definition "myBatchJob"
dataflow:>stream create task-event-subscriber1 --definition ":task-events > log" --deploy
dataflow:>task launch myTask

您可以通过在启动任务时指定显式名称来控制这些事件的目标名称,如下所示:spring-doc.cn

dataflow:>stream create task-event-subscriber2 --definition ":myTaskEvents > log" --deploy
dataflow:>task launch myTask --properties "app.myBatchJob.spring.cloud.stream.bindings.task-events.destination=myTaskEvents"

下表列出了 Broker 上的默认任务和批处理事件以及目标名称:spring-doc.cn

表 2.Task 和 Batch 事件目标

事件spring-doc.cn

目的地spring-doc.cn

任务事件spring-doc.cn

task-eventsspring-doc.cn

任务执行事件spring-doc.cn

job-execution-eventsspring-doc.cn

步骤执行事件spring-doc.cn

step-execution-eventsspring-doc.cn

Item Read 事件spring-doc.cn

item-read-eventsspring-doc.cn

Item Process 事件spring-doc.cn

item-process-eventsspring-doc.cn

Item Write 事件spring-doc.cn

item-write-eventsspring-doc.cn

跳过事件spring-doc.cn

skip-eventsspring-doc.cn

28. 组合任务

Spring Cloud Data Flow 允许您创建有向图,其中图的每个节点都是一个任务应用程序。 这是通过使用 DSL 来完成组合任务的。 您可以通过 RESTful API、Spring Cloud Data Flow Shell 或 Spring Cloud Data Flow UI 创建组合任务。spring-doc.cn

28.1. 配置组合任务运行程序

组合任务通过称为 Composed Task Runner 的任务应用程序运行。spring-doc.cn

28.1.1. 注册组合任务运行程序

默认情况下,Spring Cloud Data Flow 从中检索组合任务运行程序应用程序 用于 Cloud Foundry 和本地部署的 Maven Central 以及用于 Kubernetes 的 DockerHub。它 在首次使用组合任务时检索组合任务运行程序。spring-doc.cn

如果无法访问给定 Spring Cloud 数据流的 Maven Central 或 DockerHub 部署中,您可以通过设置属性来指定一个新的 URI,从中检索组合的任务运行程序。spring.cloud.dataflow.task.composedtaskrunner.urispring-doc.cn

28.1.2. 配置组合任务运行程序

组合的任务运行程序应用程序具有用于验证和启动子任务的属性。 默认为 .如果运行分布式 Spring Cloud Data Flow 服务器,就像在 Cloud Foundry 或 Kubernetes 上部署服务器一样,则需要提供可用于访问服务器的 URI。 您可以通过在启动组合任务时为组合任务运行程序应用程序设置属性,或者在启动 Spring Cloud Data Flow 服务器时为 Spring Cloud Data Flow 服务器设置属性来提供此功能。 对于后一种情况,在启动组合任务时,会自动设置组合任务运行程序应用程序属性。dataflow-server-urilocalhost:9393dataflow-server-urispring.cloud.dataflow.server.uridataflow-server-urispring-doc.cn

配置选项

该任务具有以下选项:ComposedTaskRunnerspring-doc.cn

  • composed-task-arguments用于每个任务的命令行参数。(字符串,默认值:<none>)。spring-doc.cn

  • increment-instance-enabled允许重新运行单个实例,而无需更改参数。默认值为 ,这意味着实例只能使用一组给定的参数启动一次。如果可以重新启动。(布尔值,默认值:)。 ComposedTaskRunner 是使用 Spring Batch 构建的。因此,成功执行后,批处理作业被视为已完成。 要多次启动同一定义,必须为每次启动设置该属性或更改定义的参数。 使用此选项时,必须将其应用于所需应用程序的所有任务启动,包括首次启动。ComposedTaskRunnerfalseComposedTaskRunnertruefalseComposedTaskRunnerincrement-instance-enabledtruespring-doc.cn

  • interval-time-between-checks在数据库检查之间等待以查看任务是否已完成的时间(以毫秒为单位)。(整数,默认值:)。 使用 DataStore 来确定每个子任务的状态。此间隔指示它应检查其子任务状态的频率。ComposedTaskRunner10000ComposedTaskRunnerComposedTaskRunnerspring-doc.cn

  • max-wait-time在执行组合任务失败之前,单个步骤可以运行的最长时间(以毫秒为单位)(整数,默认值:0)。 确定在 CTR 以失败结束之前允许每个子任务运行的最长时间。默认值 of 表示没有超时。0spring-doc.cn

  • split-thread-allow-core-thread-timeout指定是否允许拆分核心线程超时。(布尔值,默认值:) 设置策略,该策略控制在保持活动时间内没有任务到达时,核心线程是否可以超时和终止,并在新任务到达时根据需要进行替换。falsespring-doc.cn

  • split-thread-core-pool-sizeSplit 的核心池大小。(整数,默认值:) 拆分中包含的每个子任务都需要一个线程才能执行。因此,例如,定义 需要 的 a of 。 这是因为最大的拆分包含三个子任务。计数 of 表示 和 将并行运行,但 CCC 将等到 either 或 finish 才能运行。 then 和 将并行运行。1<AAA || BBB || CCC> && <DDD || EEE>split-thread-core-pool-size32AAABBBAAABBBDDDEEEspring-doc.cn

  • split-thread-keep-alive-secondsSplit 的线程保持活动秒。(整数,默认值:) 如果池当前具有多个线程,则如果超出的线程空闲时间超过 .60corePoolSizekeepAliveTimespring-doc.cn

  • split-thread-max-pool-sizeSplit 的最大池大小。(整数,默认值:)。 确定线程池允许的最大线程数。Integer.MAX_VALUEspring-doc.cn

  • 拆分线程队列容量Split 的容量 .(Integer,默认值:BlockingQueueInteger.MAX_VALUE)spring-doc.cn

    • 如果正在运行的线程数少于线程数,则始终倾向于添加新线程而不是排队。corePoolSizeExecutorspring-doc.cn

    • 如果或多个线程正在运行,则始终倾向于将请求排队,而不是添加新线程。corePoolSizeExecutorspring-doc.cn

    • 如果请求无法排队,则创建一个新线程,除非这会超过 。在这种情况下,任务将被拒绝。maximumPoolSizespring-doc.cn

  • split-thread-wait-for-tasks-to-complete-on-shutdown是否等待计划任务在关闭时完成,而不是中断正在运行的任务并运行队列中的所有任务。(布尔值,默认值:false)spring-doc.cn

  • dataflow-server-uri接收任务启动请求的数据流服务器的 URI。(字符串,默认值:localhost:9393)spring-doc.cn

  • dataflow-server-username接收任务启动请求的数据流服务器的可选用户名。 用于使用基本身份验证访问数据流服务器。如果已设置,则不使用。dataflow-server-access-tokenspring-doc.cn

  • dataflow-server-password接收任务启动请求的数据流服务器的可选密码。 用于使用基本身份验证访问数据流服务器。如果已设置,则不使用。dataflow-server-access-tokenspring-doc.cn

  • dataflow-server-access-token此属性设置可选的 OAuth2 访问令牌。 通常,该值是使用当前登录用户的令牌(如果可用)自动设置的。 但是,对于特殊用例,也可以显式设置此值。spring-doc.cn

当您想要使用当前登录用户的访问令牌并将其传播到组合任务运行程序时,存在一个特殊的布尔属性 。此属性用于 由 Spring Cloud Data Flow 执行,如果设置为 ,则自动填充该属性。使用 时,必须为每个任务执行传递它。 在某些情况下,默认情况下,最好必须为每个组合任务启动传递用户的 s。 在这种情况下,请将 Spring Cloud Data Flow 属性设置为 。dataflow-server-use-user-access-tokentruedataflow-server-access-tokendataflow-server-use-user-access-tokendataflow-server-access-tokenspring.cloud.dataflow.task.useUserAccessTokentruespring-doc.cn

要为 Composed Task Runner 设置属性,您需要为该属性添加前缀。 例如,要设置属性,该属性将如下所示。app.composed-task-runner.dataflow-server-uriapp.composed-task-runner.dataflow-server-urispring-doc.cn

28.2. 组合任务的生命周期

组合任务的生命周期分为三个部分:spring-doc.cn

28.2.1. 创建组合任务

通过 task create 命令创建任务定义时,将使用组合任务的 DSL,如以下示例所示:spring-doc.cn

dataflow:> app register --name timestamp --type task --uri maven://org.springframework.cloud.task.app:timestamp-task:
dataflow:> app register --name mytaskapp --type task --uri file:///home/tasks/mytask.jar
dataflow:> task create my-composed-task --definition "mytaskapp && timestamp"
dataflow:> task launch my-composed-task

在前面的示例中,我们假设我们组合的任务要使用的应用程序尚未注册。 因此,在前两个步骤中,我们注册了两个任务应用程序。 然后,我们使用命令创建组合任务定义。 前面示例中的合成任务 DSL 在启动时运行,然后运行时间戳应用程序。task createmytaskappspring-doc.cn

但在我们启动定义之前,我们可以查看 Spring Cloud Data Flow 为我们生成的内容。 这可以通过使用 task list 命令来完成,如以下示例中所示(包括其输出):my-composed-taskspring-doc.cn

dataflow:>task list
╔══════════════════════════╤══════════════════════╤═══════════╗
║        Task Name         │   Task Definition    │Task Status║
╠══════════════════════════╪══════════════════════╪═══════════╣
║my-composed-task          │mytaskapp && timestamp│unknown    ║
║my-composed-task-mytaskapp│mytaskapp             │unknown    ║
║my-composed-task-timestamp│timestamp             │unknown    ║
╚══════════════════════════╧══════════════════════╧═══════════╝

在该示例中,Spring Cloud Data Flow 创建了三个任务定义,每个定义对应于构成组合任务 ( 和 ) 以及组合任务 () 定义的每个应用程序。 我们还看到,为子任务生成的每个名称都由组合任务的名称和应用程序的名称组成,由连字符分隔(如 my-composed-task mytaskapp)。my-composed-task-mytaskappmy-composed-task-timestampmy-composed-task--spring-doc.cn

任务应用程序参数

组成组合任务定义的任务应用程序也可以包含参数,如以下示例所示:spring-doc.cn

dataflow:> task create my-composed-task --definition "mytaskapp --displayMessage=hello && timestamp --format=YYYY"

28.2.2. 启动组合任务

启动组合任务的方式与启动独立任务的方式相同,如下所示:spring-doc.cn

task launch my-composed-task

启动任务后,假设所有任务都成功完成,您可以在运行 时看到三个任务执行,如以下示例所示:task execution listspring-doc.cn

dataflow:>task execution list
╔══════════════════════════╤═══╤════════════════════════════╤════════════════════════════╤═════════╗
║        Task Name         │ID │         Start Time         │          End Time          │Exit Code║
╠══════════════════════════╪═══╪════════════════════════════╪════════════════════════════╪═════════╣
║my-composed-task-timestamp│713│Wed Apr 12 16:43:07 EDT 2017│Wed Apr 12 16:43:07 EDT 2017│0        ║
║my-composed-task-mytaskapp│712│Wed Apr 12 16:42:57 EDT 2017│Wed Apr 12 16:42:57 EDT 2017│0        ║
║my-composed-task          │711│Wed Apr 12 16:42:55 EDT 2017│Wed Apr 12 16:43:15 EDT 2017│0        ║
╚══════════════════════════╧═══╧════════════════════════════╧════════════════════════════╧═════════╝

在前面的示例中,我们看到 launched 和其他任务也按顺序启动。 他们每个人都使用 as 成功运行。my-compose-taskExit Code0spring-doc.cn

将属性传递给子任务

要在任务启动时设置组合任务图中子任务的属性, 使用以下格式:。 以下清单显示了一个组合任务定义作为示例:app.<composed task definition name>.<child task app name>.<property>spring-doc.cn

dataflow:> task create my-composed-task --definition "mytaskapp  && mytimestamp"

要显示 'HELLO' 并将组合任务定义的时间戳格式设置为,请使用以下任务启动格式:mytaskappmytimestampYYYYspring-doc.cn

task launch my-composed-task --properties "app.my-composed-task.mytaskapp.displayMessage=HELLO,app.my-composed-task.mytimestamp.timestamp.format=YYYY"

与应用程序属性类似,您也可以使用以下格式设置子任务的属性:deployerdeployer.<composed task definition name>.<child task app name>.<deployer-property>spring-doc.cn

task launch my-composed-task --properties "deployer.my-composed-task.mytaskapp.memory=2048m,app.my-composed-task.mytimestamp.timestamp.format=HH:mm:ss"
Launched task 'a1'
将参数传递给组合任务运行程序

您可以使用以下选项为组合任务运行程序传递命令行参数:--argumentsspring-doc.cn

dataflow:>task create my-composed-task --definition "<aaa: timestamp || bbb: timestamp>"
Created new task 'my-composed-task'

dataflow:>task launch my-composed-task --arguments "--increment-instance-enabled=true --max-wait-time=50000 --split-thread-core-pool-size=4" --properties "app.my-composed-task.bbb.timestamp.format=dd/MM/yyyy HH:mm:ss"
Launched task 'my-composed-task'
使用自定义组合任务运行程序启动组合任务

在某些情况下,您需要使用组合任务运行程序的自定义版本来启动组合任务,而不是开箱即用的默认应用程序。 为此,您需要注册组合任务运行程序的自定义版本,然后指定要在任务启动时指向自定义应用程序的属性,如下所示:composedTaskRunnerNamespring-doc.cn

dataflow:>app register --name best-ctr --type task --uri maven://the.best.ctr.composed-task-runner:1.0.0.RELEASE

dataflow:>task create mycomposedtask --definition "te:timestamp &&  tr:timestamp"
Created new task 'mycomposedtask'

dataflow:>task launch --name mycomposedtask --composedTaskRunnerName best-ctr
指定的应用程序需要在 Application Registry 中注册的任务。composedTaskRunnerName
退出状态

以下列表显示了在执行每个步骤后,如何为组合任务中包含的每个步骤(任务)设置退出状态:spring-doc.cn

  • 如果 具有 ,则将其用作 .TaskExecutionExitMessageExitStatusspring-doc.cn

  • 如果不存在 no 且 the 设置为零,则步骤的 为 。ExitMessageExitCodeExitStatusCOMPLETEDspring-doc.cn

  • 如果不存在 no 且 the 设置为任何非零数字,则步骤的 为 。ExitMessageExitCodeExitStatusFAILEDspring-doc.cn

28.2.3. 销毁组合任务

用于销毁独立任务的命令与用于销毁组合任务的命令相同。 唯一的区别是,销毁组合任务也会销毁与其关联的子任务。 以下示例显示了使用该命令之前和之后的任务列表:destroyspring-doc.cn

dataflow:>task list
╔══════════════════════════╤══════════════════════╤═══════════╗
║        Task Name         │   Task Definition    │Task Status║
╠══════════════════════════╪══════════════════════╪═══════════╣
║my-composed-task          │mytaskapp && timestamp│COMPLETED  ║
║my-composed-task-mytaskapp│mytaskapp             │COMPLETED  ║
║my-composed-task-timestamp│timestamp             │COMPLETED  ║
╚══════════════════════════╧══════════════════════╧═══════════╝
...
dataflow:>task destroy my-composed-task
dataflow:>task list
╔═════════╤═══════════════╤═══════════╗
║Task Name│Task Definition│Task Status║
╚═════════╧═══════════════╧═══════════╝

28.2.4. 停止组合任务

如果需要停止组合任务执行,您可以通过以下方式执行此操作:spring-doc.cn

要通过控制面板停止组合任务,请选择 Jobs 选项卡,然后单击要停止的任务执行旁边的 *Stop() 按钮。spring-doc.cn

当当前正在运行的子任务完成时,组合任务运行将停止。 将标记与在组合任务停止时正在运行的子任务关联的步骤,以及组合任务作业执行。STOPPEDspring-doc.cn

28.2.5. 重启组合任务

如果组合任务在执行过程中失败,并且组合任务的状态为 ,则可以重新启动该任务。 您可以通过以下方式执行此操作:FAILEDspring-doc.cn

要通过 shell 重新启动组合任务,请使用相同的参数启动任务。 要通过控制面板重新启动组合任务,请选择 Jobs 选项卡,然后单击要重新启动的任务执行旁边的 Restart 按钮。spring-doc.cn

重新启动已停止的组合任务作业(通过 Spring Cloud Data Flow Dashboard 或 RESTful API)会重新启动子任务,然后按指定顺序启动其余(未启动的)子任务。STOPPED

29. 组合任务 DSL

组合任务可以通过三种方式运行:spring-doc.cn

29.1. 条件执行

条件执行使用双 & 符号 () 表示。 这允许序列中的每个任务仅在前一个任务 成功完成,如以下示例所示:&&spring-doc.cn

task create my-composed-task --definition "task1 && task2"

当调用的合成任务启动时,它会启动调用的任务,如果成功完成,则会启动调用的任务。 如果失败,则不启动。my-composed-tasktask1task1task2task1task2spring-doc.cn

您还可以使用 Spring Cloud Data Flow Dashboard 创建条件执行,方法是使用设计器拖放所需的应用程序并将它们连接在一起以创建有向图,如下图所示:spring-doc.cn

组合任务条件执行
图 2.条件执行

上图是使用 Spring Cloud Data Flow Dashboard 创建的定向图的屏幕截图。 您可以看到,图中的四个组件组成了一个条件执行:spring-doc.cn

  • Start icon:所有有向图形都从此元件开始。只有一个。spring-doc.cn

  • 任务图标:表示有向图中的每个任务。spring-doc.cn

  • End icon(结束图标):表示有向图的结束。spring-doc.cn

  • 实线箭头:表示以下之间的流程条件执行流程:spring-doc.cn

  • End icon(结束图标):所有有向图形都在此符号处结束。spring-doc.cn

您可以通过单击 Definitions (定义) 选项卡上组合任务定义旁边的 Detail (详细信息) 按钮来查看定向图的图表。

29.2. 过渡执行

DSL 支持对在执行有向图期间进行的转换进行精细控制。 通过提供基于上一个任务的退出状态的相等条件来指定过渡。 任务转换由以下符号表示 。->spring-doc.cn

29.2.1. 基本过渡

基本过渡如下所示:spring-doc.cn

task create my-transition-composed-task --definition "foo 'FAILED' -> bar 'COMPLETED' -> baz"

在前面的示例中,将启动,如果任务的退出状态为 ,则任务将启动。 如果 的退出状态为 ,则 将启动。 返回的所有其他状态均无效,任务将正常结束。fooFAILEDbarfooCOMPLETEDbazcatspring-doc.cn

使用 Spring Cloud Data Flow Dashboard 创建相同的“基本过渡”,如下图所示:spring-doc.cn

组合任务基本转换
图 3.基本过渡

上图是在 Spring Cloud Data Flow Dashboard 中创建的有向图的屏幕截图。 请注意,有两种不同类型的连接器:spring-doc.cn

  • 虚线:表示从应用程序到可能的目标应用程序之一的转换。spring-doc.cn

  • 实线:以条件执行或应用程序与控制节点之间的连接(开始或结束)连接应用程序。spring-doc.cn

要创建过渡连接器:spring-doc.cn

  1. 创建过渡时,使用连接器将应用程序链接到每个可能的目标。spring-doc.cn

  2. 完成后,转到每个连接并通过单击选择它。spring-doc.cn

  3. 此时将显示一个 bolt 图标。spring-doc.cn

  4. 单击该图标。spring-doc.cn

  5. 输入该连接器所需的退出状态。spring-doc.cn

  6. 该连接器的实线将变为虚线。spring-doc.cn

29.2.2. 使用通配符过渡

DSL 支持通配符进行转换,如以下示例所示:spring-doc.cn

task create my-transition-composed-task --definition "foo 'FAILED' -> bar '*' -> baz"

在前面的示例中,将启动,如果它的退出状态为 ,则任务将启动。 对于除 以外的任何退出状态,将启动。fooFAILEDbarcatFAILEDbazspring-doc.cn

使用 Spring Cloud Data Flow Dashboard 创建相同的“带通配符的过渡”将类似于下图:spring-doc.cn

使用通配符的组合任务基本转换
图 4.使用通配符的基本过渡

29.2.3. 使用以下条件执行进行过渡

转换后可以执行条件执行,只要通配符 ,如以下示例所示:spring-doc.cn

task create my-transition-conditional-execution-task --definition "foo 'FAILED' -> bar 'UNKNOWN' -> baz && qux && quux"

在前面的示例中,将启动,如果任务的退出状态为 ,则任务将启动。 如果退出状态为 ,则会启动。 对于除 或 以外的任何退出状态,将启动,成功完成后,将启动。fooFAILEDbarfooUNKNOWNbazfooFAILEDUNKNOWNquxquuxspring-doc.cn

使用 Spring Cloud Data Flow Dashboard 创建相同的“带条件执行的过渡”将类似于下图:spring-doc.cn

具有条件执行的组合任务转换
图 5.使用条件执行进行过渡
在此图中,虚线(过渡)将应用程序连接到目标应用程序,但实线连接 、 和 之间的条件执行。foofooquxquux

29.3. 拆分执行

拆分允许组合任务中的多个任务并行运行。 它通过使用尖括号 () 对要并行运行的任务和流进行分组来表示。 这些任务和流由双竖线符号分隔,如以下示例所示:<>||spring-doc.cn

task create my-split-task --definition "<foo || bar || baz>"

前面的示例并行启动 tasks 。foobarbazspring-doc.cn

使用 Spring Cloud Data Flow Dashboard 创建相同的“拆分执行”将类似于下图:spring-doc.cn

组合任务拆分
图 6.分裂

使用任务 DSL,您还可以连续运行多个拆分组,如以下示例所示:spring-doc.cn

task create my-split-task --definition "<foo || bar || baz> && <qux || quux>"

在前面的示例中,、 和 任务 是并行启动的。 一旦它们全部完成,则 和 任务将并行启动。 完成后,组合的任务将结束。 但是,如果 、 、 或 失败,则包含 和 的拆分不会启动。foobarbazquxquuxfoobarbazquxquuxspring-doc.cn

使用 Spring Cloud Data Flow Dashboard 创建相同的“split with multiple groups”将类似于下图:spring-doc.cn

组合任务拆分
图 7.作为条件执行的一部分进行拆分

请注意,设计器在 连接两个连续的分片。SYNCspring-doc.cn

拆分中使用的任务不应设置其 .设置 is only be used with transitions.ExitMessageExitMessage

29.3.1. 包含条件执行的 split

split 还可以在尖括号内具有条件执行,如以下示例所示:spring-doc.cn

task create my-split-task --definition "<foo && bar || baz>"

在前面的示例中,我们看到了 并并行启动。 但是,在成功完成之前不会启动。foobazbarfoospring-doc.cn

使用 Spring Cloud Data Flow Dashboard 创建相同的 “ ” 类似于下图:split containing conditional executionspring-doc.cn

使用条件执行的组合任务拆分
图 8.使用条件执行进行拆分

29.3.2. 为 split 建立正确的线程数

拆分中包含的每个子任务都需要一个线程才能运行。要正确设置此设置,您需要查看图表并找到子任务数量最多的拆分。该拆分中的子任务数是您需要的线程数。 要设置线程计数,请使用 (默认为 )。因此,例如,定义(如 require a of . 这是因为最大的拆分包含三个子任务。计数为 2 表示 和 将并行运行,但 CCC 将等待 one 或 finish 才能运行。 then 和 将并行运行。split-thread-core-pool-size property1<AAA || BBB || CCC> && <DDD || EEE>split-thread-core-pool-size3AAABBBAAABBBDDDEEEspring-doc.cn

30. 从 Stream 启动任务

您可以使用 task-launcher-dataflow 接收器从流启动任务。 接收器连接到数据流服务器,并使用其 REST API 启动任何定义的任务。 接收器接受表示 的 JSON 负载,该负载提供要启动的任务的名称,并且可能包括命令行参数和部署属性。task launch requestspring-doc.cn

app-starters-task-launch-request-common 组件与 Spring Cloud Stream 功能组合相结合,可以将任何源或处理器的输出转换为任务启动请求。spring-doc.cn

添加依赖项以自动配置实现,通过 Spring Cloud Function 注册为 .app-starters-task-launch-request-commonjava.util.function.FunctiontaskLaunchRequestspring-doc.cn

例如,您可以从时间源开始,添加以下依赖项,构建它,然后将其注册为自定义源。我们在此示例中称之为:time-tlrspring-doc.cn

<dependency>
    <groupId>org.springframework.cloud.stream.app</groupId>
    <artifactId>app-starters-task-launch-request-common</artifactId>
</dependency>
Spring Cloud Stream Initializr 为创建流应用程序提供了一个很好的起点。

接下来,注册 sink 并创建一个任务(我们使用提供的时间戳任务):task-launcher-dataflowspring-doc.cn

stream create --name task-every-minute --definition "time-tlr --trigger.fixed-delay=60 --spring.cloud.stream.function.definition=taskLaunchRequest --task.launch.request.task-name=timestamp-task | task-launcher-dataflow" --deploy

前面的流每分钟生成一个任务启动请求。该请求提供要启动的任务的名称:。{"name":"timestamp-task"}spring-doc.cn

以定义说明了命令行参数的用法。它生成消息,例如为任务提供命令行参数:{"args":["foo=bar","time=12/03/18 17:44:12"],"deploymentProps":{},"name":"timestamp-task"}spring-doc.cn

stream create --name task-every-second --definition "time-tlr --spring.cloud.stream.function.definition=taskLaunchRequest --task.launch.request.task-name=timestamp-task --task.launch.request.args=foo=bar --task.launch.request.arg-expressions=time=payload | task-launcher-dataflow" --deploy

请注意,使用 SPEL 表达式将每个消息有效负载以及静态参数 () 映射到命令行参数。timefoo=barspring-doc.cn

然后,您可以使用 shell 命令 查看任务执行列表,如以下示例中所示(及其输出):task execution listspring-doc.cn

dataflow:>task execution list
╔════════════════════╤══╤════════════════════════════╤════════════════════════════╤═════════╗
║     Task Name      │ID│         Start Time         │          End Time          │Exit Code║
╠════════════════════╪══╪════════════════════════════╪════════════════════════════╪═════════╣
║timestamp-task_26176│4 │Tue May 02 12:13:49 EDT 2017│Tue May 02 12:13:49 EDT 2017│0        ║
║timestamp-task_32996│3 │Tue May 02 12:12:49 EDT 2017│Tue May 02 12:12:49 EDT 2017│0        ║
║timestamp-task_58971│2 │Tue May 02 12:11:50 EDT 2017│Tue May 02 12:11:50 EDT 2017│0        ║
║timestamp-task_13467│1 │Tue May 02 12:10:50 EDT 2017│Tue May 02 12:10:50 EDT 2017│0        ║
╚════════════════════╧══╧════════════════════════════╧════════════════════════════╧═════════╝

在此示例中,我们展示了如何使用源以固定速率启动任务。 此模式可应用于任何源,以启动任务以响应任何事件。timespring-doc.cn

30.1. 从 Stream 启动组合任务

可以使用 sink 启动组合任务,如此所述。 由于我们直接使用 ,因此在创建组合任务启动流之前,我们需要为组合任务运行程序本身以及组合任务设置任务定义。 假设我们想要创建以下组合任务定义:。 第一步是创建任务定义,如以下示例所示:task-launcher-dataflowComposedTaskRunnerAAA && BBBspring-doc.cn

task create composed-task-runner --definition "composed-task-runner"
task create AAA --definition "timestamp"
task create BBB --definition "timestamp"
的版本可以在这里找到。ComposedTaskRunner

现在,组合任务定义所需的任务定义已准备就绪,我们需要创建一个启动 . 因此,在本例中,我们创建一个包含以下内容的流:ComposedTaskRunnerspring-doc.cn

流应类似于以下内容:spring-doc.cn

stream create ctr-stream --definition "time --fixed-delay=30 --task.launch.request.task-name=composed-task-launcher --task.launch.request.args=--graph=AAA&&BBB,--increment-instance-enabled=true | task-launcher-dataflow"

现在,我们专注于启动所需的配置:ComposedTaskRunnerspring-doc.cn

  • graph:这是要由 执行的图形。 在本例中为 。ComposedTaskRunnerAAA&&BBBspring-doc.cn

  • increment-instance-enabled:这使得 的每次执行都是唯一的。 是使用 Spring Batch 构建的。 因此,我们希望每次启动 . 为此,我们设置为 。ComposedTaskRunnerComposedTaskRunnerComposedTaskRunnerincrement-instance-enabledtruespring-doc.cn

31. 与任务共享 Spring Cloud Data Flow 的数据存储

Tasks 文档中所述,Spring Cloud Data Flow 允许您查看 Spring Cloud Task 应用程序执行情况。所以,在 本节将讨论任务应用程序和 Spring 所需的内容 Cloud Data Flow 共享任务执行信息。spring-doc.cn

31.1. 通用 DataStore 依赖项

Spring Cloud Data Flow 支持许多开箱即用的数据库、 因此,您通常需要做的就是声明环境变量 确定 Spring Cloud Data Flow 需要的数据存储。 无论您决定将哪个数据库用于 Spring Cloud Data Flow,请确保您的任务还 在其 OR 文件中包含该数据库依赖项。如果数据库依赖项 ,则任务应用程序 并且不会记录任务执行情况。spring_datasource_*pom.xmlgradle.buildspring-doc.cn

31.2. 通用数据存储

Spring Cloud Data Flow 和您的任务应用程序必须访问相同的数据存储实例。 这样,Spring Cloud Data Flow 就可以读取任务应用程序记录的任务执行,以便在 Shell 和 Dashboard 视图中列出它们。 此外,任务应用程序必须对 Spring Cloud Data Flow 使用的任务数据表具有读取和写入权限。spring-doc.cn

了解了 Task 应用程序和 Spring Cloud Data Flow 之间的数据源依赖关系后,您现在可以回顾如何在各种 Task 编排场景中应用它们。spring-doc.cn

31.2.1. 简单任务启动

从 Spring Cloud Data Flow 启动任务时,Data Flow 会添加其数据源 属性 (, , , ) 添加到正在启动的任务的应用程序属性中。因此,任务应用程序 将其任务执行信息记录到 Spring Cloud Data Flow 仓库中。spring.datasource.urlspring.datasource.driverClassNamespring.datasource.usernamespring.datasource.passwordspring-doc.cn

31.2.2. 组合任务运行程序

Spring Cloud Data Flow 允许您创建一个有向图,其中每个节点 的图表是一个任务应用程序。这是通过组合任务运行程序完成的。 在这种情况下,应用于简单任务启动或任务Starters接收器的规则也适用于组合任务运行程序。 所有子应用程序还必须有权访问组合任务运行程序正在使用的数据存储。 此外,所有子应用程序必须与其 or 文件中枚举的组合任务运行程序具有相同的数据库依赖关系。pom.xmlgradle.buildspring-doc.cn

31.2.3. 从 Spring Cloud Data Flow 外部启动任务

您可以使用其他方法(例如计划程序)启动 Spring Cloud 任务应用程序,但仍在 Spring Cloud Data Flow 中跟踪任务执行。 您可以这样做,前提是任务应用程序遵守此处此处指定的规则。spring-doc.cn

如果要使用 Spring Cloud Data Flow 查看 Spring Batch 作业,请确保 您的 Batch 应用程序使用注释并遵循此处此处列举的规则。 更多信息可在此处获得。@EnableTask

32. 调度任务

Spring Cloud Data Flow 允许您使用表达式计划任务的执行。 您可以通过 RESTful API 或 Spring Cloud Data Flow UI 创建计划。cronspring-doc.cn

32.1. 调度器

Spring Cloud Data Flow 通过云平台上提供的调度代理来调度其任务的执行。 使用 Cloud Foundry 平台时, Spring Cloud Data Flow 使用 PCF Scheduler。 使用 Kubernetes 时,将使用 CronJobspring-doc.cn

定时任务不实现持续部署功能。对 Spring Cloud Data Flow 中任务定义的应用程序版本或属性的任何更改都不会影响计划任务。
计划程序体系结构概述
图 9.架构概述

32.2. 启用 Scheduling

默认情况下,Spring Cloud Data Flow 会禁用调度功能。要启用计划功能,请将以下功能属性设置为:truespring-doc.cn

32.3. Schedule 的生命周期

计划的生命周期分为三个部分:spring-doc.cn

32.3.1. 调度任务执行

您可以通过以下方式安排任务执行:spring-doc.cn

32.3.2. 调度任务

要使用 shell 计划任务,请使用命令创建计划,如以下示例所示:task schedule createspring-doc.cn

dataflow:>task schedule create --definitionName mytask --name mytaskschedule --expression '*/1 * * * *'
Created schedule 'mytaskschedule'

在前面的示例中,我们创建了一个名为 的任务定义 的名为 的计划。此计划每分钟启动一次。mytaskschedulemytaskmytaskspring-doc.cn

如果使用 Cloud Foundry,则上面的表达式为:。这是因为 Cloud Foundry 使用 Quartz 表达式格式。cron*/1 * ? * *cron
计划名称的最大长度

计划名称的最大字符长度取决于平台。spring-doc.cn

表 3.按平台划分的最大计划名称字符长度
Kubernetes (简体中文) 云铸造 当地

52spring-doc.cn

63spring-doc.cn

不适用spring-doc.cn

32.3.3. 删除调度

您可以使用以下方法删除计划:spring-doc.cn

要使用 shell 删除任务计划,请使用以下命令,如以下示例所示:task schedule destroyspring-doc.cn

dataflow:>task schedule destroy --name mytaskschedule
Deleted task schedule 'mytaskschedule'

32.3.4. 上架时间表

您可以使用以下方法查看可用的计划:spring-doc.cn

要从 shell 查看计划,请使用命令,如以下示例所示:task schedule listspring-doc.cn

dataflow:>task schedule list
╔══════════════════════════╤════════════════════╤════════════════════════════════════════════════════╗
║      Schedule Name       │Task Definition Name│                     Properties                     ║
╠══════════════════════════╪════════════════════╪════════════════════════════════════════════════════╣
║mytaskschedule            │mytask              │spring.cloud.scheduler.cron.expression = */1 * * * *║
╚══════════════════════════╧════════════════════╧════════════════════════════════════════════════════╝
有关使用 Spring Cloud Data Flow UI 创建、删除和列出计划的说明,请参阅此处

33. 持续部署

随着任务应用程序的发展,您希望将更新用于生产。本节介绍 Spring Cloud Data Flow 提供的有关更新任务应用程序的功能。spring-doc.cn

注册任务应用程序时(请参阅注册任务应用程序),将有一个版本与之关联。任务应用程序可以有多个与之关联的版本,其中一个版本被选为默认版本。下图说明了具有多个关联版本的应用程序(请参阅时间戳条目)。spring-doc.cn

Task Application 版本

通过注册多个具有相同名称和坐标 (版本) 的应用程序来管理应用程序的版本。例如,如果要使用以下值注册应用程序,则会使用两个版本(2.1.0.RELEASE 和 2.1.1.RELEASE)注册一个应用程序:spring-doc.cn

除了具有多个版本之外, Spring Cloud Data Flow 还需要知道下次启动时要运行哪个版本。通过将版本设置为默认版本来表示这一点。无论将任务应用程序配置为默认版本,都将在下一个启动请求上运行的版本。您可以在 UI 中看到哪个版本是默认版本,如下图所示:spring-doc.cn

Task Application 默认版本

33.1. 任务启动生命周期

在早期版本的 Spring Cloud Data Flow 中,当收到启动任务的请求时, Spring Cloud Data Flow 将部署应用程序(如果需要)并运行它。如果应用程序在不需要每次都部署应用程序的平台上运行(例如 CloudFoundry),则使用以前部署的应用程序。此流程在 2.3 中已更改。下图显示了现在收到任务启动请求时会发生什么情况:spring-doc.cn

启动任务的流程

在上图中,有三个主要流程需要考虑。首次启动或不进行任何更改启动就是其中之一。另外两个是在有更改但应用程序当前没有时启动,以及在有更改且应用程序正在运行时启动。我们首先查看没有变化的流程。spring-doc.cn

33.1.1. 启动不做任何更改的任务

  1. Launch 请求进入 Data Flow。Data Flow 确定不需要升级,因为未更改任何内容(自上次执行以来未更改任何属性、部署属性或版本)。spring-doc.cn

  1. 在缓存已部署构件的平台(在撰写本文时为 CloudFoundry)上,Data Flow 会检查应用程序之前是否已部署。spring-doc.cn

  2. 如果需要部署应用程序,Data Flow 将部署任务应用程序。spring-doc.cn

  3. Data Flow 将启动应用程序。spring-doc.cn

此流是默认行为,如果未更改任何内容,则每次收到请求时都会发生。请注意,这是 Data Flow 始终用于启动任务的相同流。spring-doc.cn

33.1.2. 启动当前未运行的包含更改的任务

启动任务时要考虑的第二个流程是当任务未运行但任何任务应用程序版本、应用程序属性或部署属性发生更改时。在这种情况下,将执行以程:spring-doc.cn

  1. Launch 请求进入 Data Flow。Data Flow 确定需要升级,因为任务应用程序版本、应用程序属性或部署属性发生了更改。spring-doc.cn

  2. Data Flow 检查以查看任务定义的另一个实例当前是否正在运行。spring-doc.cn

  1. 如果当前没有正在运行的任务定义的其他实例,则会删除旧部署。spring-doc.cn

  2. 在缓存已部署构件的平台上(在撰写本文时为 CloudFoundry),Data Flow 会检查应用程序之前是否已部署(此检查在此流中评估为,因为旧部署已被删除)。falsespring-doc.cn

  3. Data Flow 使用更新的值(新的应用程序版本、新的合并属性和新的合并部署属性)来部署任务应用程序。spring-doc.cn

  4. Data Flow 将启动应用程序。spring-doc.cn

此流程从根本上支持 Spring Cloud Data Flow 的持续部署。spring-doc.cn

33.1.3. 在另一个实例运行时启动包含更改的任务

最后一个主流是当启动请求到达 Spring Cloud Data Flow 进行升级,但任务定义当前正在运行时。在这种情况下,由于需要删除当前应用程序,启动将被阻止。在某些平台(在撰写本文时为 CloudFoundry)上,删除应用程序会导致所有当前正在运行的应用程序关闭。此功能可以防止这种情况发生。以下过程描述了当任务发生更改而另一个实例正在运行时会发生什么情况:spring-doc.cn

  1. Launch 请求进入 Data Flow。Data Flow 确定需要升级,因为任务应用程序版本、应用程序属性或部署属性发生了更改。spring-doc.cn

  2. Data Flow 检查以查看任务定义的另一个实例当前是否正在运行。spring-doc.cn

  3. Data Flow 会阻止启动,因为任务定义的其他实例正在运行。spring-doc.cn

由于需要删除任何当前正在运行的任务,因此需要升级在请求时正在运行的任务定义的任何启动都将被阻止运行。