议题 1:DLRover:蚂蚁大模型训练弹性容错与自动优化 讲师 王勤龙,蚂蚁集团技术专家,AI 系统工程师。 议题简介 介绍 DLRover 云上弹性容错的分布式训练架构。本次分享将介绍 DLRover 的容错如何提高大规模分布式训练的稳定性和训练的自动优化。同时还会介绍 DLRover 分布式训练的资源自动扩缩容功能如何降低分布式训练门槛,提升训练性能和集群效能。 听众受益 了解 DLRover 项目及架构 了解分布式训练弹性、容错和自动扩缩容的原理 了解分布式训练自动调优的原理与实现 议题 2:KubeSphere 平台整合多样化云原生网关的设计 讲师 魏泓舟,青云科技高级研发工程师。现主要负责 KubeSphere 团队微服务领域相关研发工作,主要涉及云原生网关、Service Mesh、Spring Cloud、应用等模块的集成。曾从事 Spring Cloud 微服务体系的 Java 应用研发与基于云平台落地实践。 议题简介 随着云原生网关越来越丰富多样化,我们的选择自然也更多。然而,在 KubeSphere 3.x 及之前版本中,只支持使用 Ingress-NGINX 作为云原生网关的实现,不支持其他网关,如 APISIX,Kong, Traefik 等。这在一定程度上限制了 KubeSphere 用户对网关的选择,并且存在耦合度较高、不易扩展改造等问题。 面对这些挑战,KubeSphere 作为平台工程是如何设计开放式的网关集成方式,以满足多样化的需求呢?这将是我们本次分享和讨论的主题。 议题大纲 云原生网关简介 KubeSphere 集成网关的演进过程 整合多样化云原生网关的设计 示例效果展示 听众受益 了解云原生网关 了解 KubeSphere 集成网关的思想 了解平台级项目整合多样化网关的设计思路 议题 3:KubeBlocks RSM:如何让数据库更好的跑在 K8s 上 讲师 吴学强,云猿生数据高级技术专家。原阿里云 PolarDB-X 云原生分布式数据库技术负责人之一,毕业于浙江大学计算机学院,兴趣广泛,对操作系统、密码学、分布式系统等均有涉猎。2017 年加入 PolarDB-X 团队进行高并发低延迟的 MySQL 分布式相关系统开发工作,负责 PolarDB-X 的云原生底座打造、生态系统连接、开源等开放生态构建工作。现为开源数据基础设施 KubeBlocks 核心开发者。 议题简介 K8s 中管理数据库这种有状态应用的组件是 StatefulSet,但其并不能很好的满足数据库的高可用要求: 数据库通常有读写节点和只读节点,StatefulSet 中该如何支持? 想增加一个只读节点到现有的集群,如何正确搭建复制关系? 发生了主备切换,对外服务的 Service 如何自动感知并切换? 想先升级备库,后升级主库,怎么办?想先将 Leader 切换到别的节点以降低系统不可用时长该怎么做? KubeBlocks 中设计了 StatefulSet 的增强版本 RSM 以解决上述问题,本次分享讲解 RSM 的核心设计思路和原理。 议题大纲 数据库的本质 角色抽象与定义 基于角色对外提供服务 基于角色的更新策略 角色探测与更新 成员管理 switchover 与 failover 数据副本准备 听众受益 理解数据库的状态复杂在哪里 理解数据库高可用该考虑哪些方面 了解 RSM 的核心设计思路和原理 了解 KubeBlocks 为什么更适合管理数据库 议题 4:KubeBlocks 简介及部署 AIGC 基础设施演示 讲师 刘东明,云猿生数据高级技术专家。2015 年加入阿里巴巴,先后从事阿里云云原生数据库 PolarDB-X 和 PolarDB-PostgreSQL 内核研发,负责 PolarDB-PostgreSQL 一写多读架构设计,以及缓冲区管理,查询优化等核心模块研发。现为 KubeBlocks 核心开发者。 议题简介 随着 Kubernetes(K8s) 越来越流行,越来越多的无状态应用运行在 K8s 上。然而,对于有状态应用,特别是数据基础设施如数据库服务,迁移到 K8s 上运行仍然是一件充满挑战的事。KubeBlocks 致力于让 K8s 上的数据基础设施管理就像搭乐高积木一样,既高效又有趣,帮助用户轻松构建容器化、声明式的关系型数据库、NoSQL、流计算和向量数据库服务。 此次分享将介绍 KubeBlocks 新版本的主要特性,包括核心 CRD,Controller,扩展机制以及高级运维特性。此外,还将演示如何使用 KubeBlocks 部署 AIGC 基础设施,展示 KubeBlocks 在实际应用中的强大能力。 议题大纲 KubeBlocks 简介 KubeBlocks 中的 “Block” KubeBlocks CRDs KubeBlocks Controllers KubeBlocks 扩展机制--Add-on KubeBlocks 高级运维特性 演示: 使用 KubeBlocks 部署 AIGC 基础设施 Jupyter Notebook 简单演示 KubeChat 听众受益 了解 KubeBlocks 核心功能 了解如何使用 KubeBlocks 了解如何基于 KubeBlocks 部署 AIGC 基础设置 议题 5:使用可插拔架构集成多个多集群解决方案 讲师 徐信钊,青云科技高级软件工程师,KubeSphere Maintainer。 议题简介 Kubernetes 中多集群领域的发展非常迅速,目前有很多多集群解决方案,如 karmada、ocm 和 kubefed 等。随着项目的发展,像我们这样的最终用户经常会遇到这样的情况:我们正在使用的多集群框架已经过时,我们必须切换到新的框架。在本次演讲中,KubeSphere 维护者将分享他们在如何从特定多集群框架解耦方面的经验,以及作为一个平台,我们如何整合不同的多集群解决方案以满足不同客户的需求。 议题大纲 KubeSphere 4.0 可插拔架构介绍 集成多个多集群方案 听众受益 了解 KubeSphere 4.0 可插拔架构 如何结合可插拔架构集成多个多集群方案以满足不同客户需求 议题 6:SOFABoot 4.0-迈向 JDK17 新时代 讲师 胡子杰,蚂蚁集团技术专家,SOFABoot Maintainer。 议题简介 本次分享将主要介绍 SOFABoot 4 新版本引入的新特性与变化,包括其设计理念与实现方式。再者就是介绍 SOFABoot 3 应用如何升级至 SOFABoot 4 版本,并展望 SOFABoot 未来的发展趋势。 听众受益 SOFABoot 4 的新特性与变化 已有应用如何升级至 SOFABoot 4 版本 一起探讨 SOFABoot 未来发展的趋势 此外, KubeSphere 社区将会在现场设置填问卷抽好礼活动,奖品为 KubeSphere 社区周边礼品,如背包、T 恤、马克杯等以及最高奖品(唯一一个)为 CKA 考试卷。
Saturday, November 4, 2023
6:00 AM – 10:00 AM UTC