代码之家 › 专栏 › 技术社区 › André

聚合上使用了错误的序列化程序

apache-kafka-streams

André · 技术社区 · 7 年前

我在一个kafka流应用程序中工作,我在其中处理日志事件。在本例中,我希望将工作流输入类型聚合为工作流类型。我有问题让总的工作。

final KStream<String, WorkflowInput> filteredStream = someStream;
final KTable<String, Workflow> aggregatedWorkflows = filteredStream
    .peek((k, v) -> {
        if (!(v instanceof WorkflowInput)) {
            throw new AssertionError("Type not expected");
        }
    })
    .groupByKey()
    .<Workflow>aggregate(Workflow::new, (k, input, workflow) -> workflow.updateFrom(input),
            Materialized.<String, Workflow, KeyValueStore<Bytes, byte[]>>as("worflow-cache")
                .withKeySerde(Serdes.String())
                .withValueSerde(Serdes.serdeFrom(new JsonSerializer<Workflow>(), new JsonDeserializer<Workflow>(Workflow.class)));

org.apache.kafka.streams.errors.StreamsException: A serializer (key: org.apache.kafka.common.serialization.StringSerializer / value: org.apache.kafka.common.serialization.StringSerializer) is not compatible to the actual key or value type (key type: java.lang.String / value type: workflowauditstreamer.WorkflowInput).

需要注意两件事: *值序列化程序是StringSerializer,而我使用 withValueSerde . *实际值类型为 WorkflowInput 正如我所料 Workflow 因为那是我的聚合值类型。

我对卡夫卡流还不熟悉,所以我可能遗漏了一些显而易见的东西,但我想不出来。我错过了什么?

1 回复 | 直到 7 年前

Matthias J. Sax 7 年前

如果覆盖默认值 Serde 从配置中,它是在操作员就地覆盖。它不会传播到下游(Kafka2.0——有WIP可以改进这一点)。

因此,您需要通过 塞德 你用在 someStream = builder.stream(...) .groupByKey(Serialized.with(...)) 也是。

推荐文章

Stella · Kafka流处理期间处理数据时出现异常

7 年前

Stella · kafka流中的处理器节点

7 年前

mukesh210 · 卡夫卡流:Lib Rocks数据库上的UnsatifiedLinkError

7 年前

el323 · Kafka流:通过Json日志中的键进行分组

7 年前

Suchita · 如何使用Avro反序列化器和Avro序列化器为KafkaStreams编写Junit测试用例

7 年前

Cemo · 如何获得有关GlobalKTable状态存储更新的通知?

7 年前

px5x2 · Kafka将GlobalKTable同步流传输到应用程序

7 年前

Dth · 加工机为Kafka流中的单个任务多次调用init()

7 年前

nattyddubbs · Kafka Streams多实例设计含义

7 年前

dvlcis · 如何使用卡夫卡流窗口为烛台图生成创建一条记录

7 年前