# 简介 Skylab 核心组件包括云原生分布式数据库 OushuDB、自动化机器学习平台 LittleBoy、对话式数据分析平台 Kepler、数据资产管理平台 Orbit、数据开发 与调度平台 Flow、数据工厂 Wasp 和系统管理软件 Lava。 ● OushuDB 是由偶数科技自主研发的云原生分布式数据库,具有高性能、高并发、高可用的技术优势。OushuDB 兼容国产软硬件平台,符合国家信创标准。新 一代执行器显著提升批处理和按需即席查询效率,面向 PB 级大数据的复杂查询,OushuDB 相比传统 MPP 和 SQL-on-Hadoop 快一个数量级。采用计算存储分 离架构深度优化数据库的扩展能力,支持腾讯云、阿里云、华为云、金山云、微软 Azure、AWS 等主流云平台,充分满足云端应用高度弹性、无限扩容的要求。 ● LittleBoy 自动化机器学习平台提供完整的 MLOps 链路,集成数据清洗、特征工程、深度学习、AutoML、模型管理和AI服务。其可视化交互可通过拖拽、 对话引导等方式帮助用户清晰直观建模。LittleBoy 同时支持有监督学习和无监督学习,近百种内置算法满足不同场景建模需求。结合 OushuDB 高性能读写速度, LittleBoy 相比同类产品大幅提升模型收敛效率,帮助分析师和数据科学家将机器学习快速转化为业务价值。 ● Kepler 是偶数基于全球首个分析领域大模型而研发的对话式数据分析平台。Kepler率先实现了AI原生自然语言对话能力,让用户可以通过对话交互进行数据 分析,无论是数据查询、图表生成,还是指标分析、归因分析,都可以通过简单的对话实现。针对数据分析场景中用户的主要痛点,如业务用户门槛高、需求排队 时间长、分析性能和时效差,Kepler一站解决全部问题。Kepler赋能用户降本增效,学习成本降低约200倍,取数效率提升约1500倍,响应和延迟小于1秒。 ● Orbit 数据资产管理平台为用户提供可视化的数据资产图谱、自动化的数据资产分类、多维度的数据血缘分析,以及可持续的数据标准贯彻实施。通过对存量和 新增的数据资产、元数据和业务数据进行全方位的规划管理,为企业搭建领先的数据运营体系,减少数据污染和治理成本,提高数据可见性、数据使用效率和数据资 产价值。 ● Flow 是一款拥有强大Web界面交互能力的数据开发与调度平台,为Skylab平台提供任务调度能力。Flow不仅支持丰富的任务类型,还拥有百万级任务节点的前 端交互能力,灵活实现大规模集群任务的调度服务。 ● Wasp 数据工厂可以轻松对接多种数据源,灵活可扩展。支持存量和增量同步、离线和实时持续同步、自动和定时同步、数据容错和断点续传。用户可以通过零代 码可视化操作进行一套任务的批流数据加工,Wasp 在保证数据一致性的同时,为用户提供高性能、高吞吐的数据加工和同步。 ● Lava 负责 Skylab 平台集群管理、监控运维、用户管理、认证、审计、权限、消息等基础服务。通过灵活可扩展的技术架构、云中立的技术路线,为用户提供 简单易用、安全可靠、性能稳定的系统管理服务,降低运维成本,提高管理效率。 除了完整的生态组件,偶数 Skylab 平台还率先实现了 ANCHOR 标准六大特性。 ● All Disparate Data 多源异构数据:支持关系表、文本、图像、视频等结构化数据和非结构化数据存储。 ● Native on Cloud 云原生:适合云环境,自由增减计算和存储资源,按用量计费,节约成本。 ● Consistency 数据一致性:通过完善的事务机制,保障不同用户同时查询和更新同一份数据时的一致性。 ● High Concurrency 超高并发:支持数十万用户使用复杂分析查询并发访问同一份数据。 ● One Copy of Data 一份数据:所有用户(BI 用户、数据科学家等)可以共享同一份数据,避免数据孤岛。 ● Real-time 实时 T+0:通过全量数据 T+0 的流处理和实时按需查询,保障企业实时决策和分析。 通过 ANCHOR 六大特性,Skylab 真正在数据和查询层面形成一体化架构,彻底解决集群规模和并发受限、非结构化数据无法整合、建模路径冗长、数据一致 性弱、性能和时效瓶颈等问题,从而帮助用户彻底规避数据孤岛,优化数据供给能效,有效降低 IT 运维成本和数据管理技术门槛,让企业在数字化转型过程中 赢得先机。