Release Notes#

LittleBoy 5.0.3.0 (发布日期2023年10月)#

  • 适配了Skylab 5.4.0.0

LittleBoy 5.0.0.0 RC2 (发布日期2022年11月)#

  • 支持了MultiMaster

  • UI全新升级

  • 新增时序数据建模支持,增加机器学习时序算法Lasso、Prophet,深度学习算法RNN

  • 新增数十种不同图、表类型的数据可视化算子

  • 修复了复制画布连接,合并,SQL算子异常的问题

  • 修复了并发训练模型相关问题

LittleBoy 4.2.0.0 (发布日期2022年02月)#

  • 新增分布式随机森林、孤立森林等机器学习算法

  • 优化AutoML算法的使用体验,允许保存AutoML过程中的多个模型,并在这些模型之间自由切换

  • 新增部分机器学习模型的训练记录展示,包括训练过程中的损失函数折线图,特征重要性柱状图,P-R曲线,Gain-Lift曲线等等

  • 新增决策树类算法的可视化展示,包括分布式随机森林、XGBoost、孤立森林及AutoML中的所有决策树类模型

  • 在分布式随机森林模型、XGBoost模型预测结果中,添加模型可解释性SHAP值输出

  • 优化模型管理页面的展示结构,添加按照目录结构展示的组织形式,便于模型的版本控制

  • 新增可视化建模任务一键导入导出功能

  • 添加数据抽样算子,允许随机抽样及分层抽样等抽样方法

  • 优化数据分割算子,支持按照选定的标签列进行分层分割

  • 优化目标表算子,允许将目标表作为数据对象添加到数据集中,允许切换“覆写”和“追加”两种数据写入方式

  • 优化特征工程算子的使用逻辑,添加批量处理特征的开关

  • LittleBoy平台全面适配ARM架构

LittleBoy 4.1.0.0 (发布日期:2021年12月)#

  • 重构可视化建模执行器,提升了画布运行速度,减少任务和节点的启动延迟,规范了不同数据源之间的数据类型

  • 新增“我的资源”页面,使用图形化展示当前用户的计算资源使用情况,允许对资源进行统一管理

  • 新增对计算集群的运行监控和日志展示

  • 可视化建模页面中,新增对运行时间和运行历史的展示

  • 数据处理流程中新增“统计”节点,提供空值、平均数、分位数、异常值、离散类别数等常用信息的一键统计,便于快速地掌握数据分布情况

  • 数据处理流程中新增“类型转换”节点

  • 新增AutoML训练算子,自动从线性回归、随机森林、梯度提升树、XGBoost、神经网络等算法中自动选择模型结构,进行超参调优并获得最优模型。支持输出模型参数细节、支持模型进行批量预测与发布服务

  • 新增DeepLearning训练算子,支持自定义隐藏层参数、支持自适应学习率

  • 升级了XGBoost等算子,丰富了可配置的参数项,提升了建模表现、运行速度和稳定性

  • 机器学习评估算子中新增一键导出评估报告功能

LittleBoy 4.0.2.0 (发布日期:2021年8月)#

  • 可视化建模新增数据清洗算子,支持十余种通用的数据清洗动作,包括字符串长度填充、指定位置填充字符串、搜索并填充字符串等填充操作,字符串替换操作,删除指定位数、搜索并删除子串、搜索并删除指定位数、修剪前后缀等删除操作,空值填充、指定数值转空值操作,列重命名操作,日期类型、时间戳类型、数值类型和日期字符串类型之间的转换和格式化操作,英文字母全部转换大写、全部转换小写、单词首字母转大写等操作

  • 可视化建模新增数据脱敏算子,包含数据模糊化、替换固定值、增补前后缀、数据裁切、MD5字段加密等多种脱敏操作

  • 可视化建模升级字段衍生算子,新增按位取子字符串、正则匹配子字符串、生成固定字段、字段对比、拆分多列、合并多列等操作,也支持添加自定义SQL语句的衍生列

  • 可视化建模支持XGBoost算法框架,支持用XGBoost算法训练机器学习模型,使用XGBoost模型批量预测和发布服务

LittleBoy 4.0.1.0 (发布日期:2021年6月)#

  • 可视化建模新增自定义SQL算子

  • 优化流计算对断点续传的支持

  • 提升了模型训练、上线服务的稳定性

LittleBoy 4.0.0.0 (发布日期:2021年5月)#

  • 升级可视化建模架构,新增特征工程、机器学习建模流程,添加对流计算的支持

  • 可视化建模中新增“独热编码”、“标准化”、”主成分分析”等特征工程算子

  • 新增分类、回归、聚类、关联规则等领域的机器学习算子,及机器学习模型的预测和评估算子

  • 新增“折线图”、“饼状图”、“热力图”、“树状图”、“桑基图”等几十种数据可视化算子

  • 支持读取和解析流式数据,新增流数据的数据处理算子

  • 优化可视化建模的使用体验,提供智能推荐下游算子的方法

  • 升级数据集功能,支持MySQL等更多数据库/文件系统的来源数据

  • 新增分配计算资源,管理资源队列的功能

LittleBoy 3.3.2.0 (发布日期:2021年2月)#

  • 新增可视化建模(数据集处理算子)

  • 移植原数据工厂的“筛选”、“合并”、“连接”、“衍生”、“去重”、“分组”、“排序‘、”分割“等算子

  • 新增数据集功能

LittleBoy 3.0.0.0 (发布日期:2020年4月)#

  • 新增Notebook功能和配合其使用的“littleboy” Python库,可以实现数据探索、自定义训练模型等功能

  • 新增可配置的Spark机器学习算法:Logistic Regression、Naive Bayes、Decision Tree、RandomForest、Gradient Boosted Tree、KMeans、GMM

  • 新增训练流程中的特征重要性算法

  • 优化了预测结果、混淆矩阵的展示

LittleBoy 2.1.0.1 (发布日期:2020年2月)#

  • 针对⼤数据量的预测任务,优化了分布式预测

LittleBoy 2.1.0.0 (发布日期:2019年9月)#

  • 新增模型导入导出功能

  • 新增将模型发布成AI服务,并可为服务一键切换不同模型。

LittleBoy 2.0.0.0 (发布日期:2019年2月)#

  • 以Wizard引导方式创建AI模型的训练流程(替代AI Studio形式)

  • 新增可配置深度学习算法:Oushu Neural Network、Wide And Deep Neural Network

  • 新增可配置传统机器学习算法:Random Forest、Decision Tree、Boosted Tree、SVM、K-Means

  • 升级AutoML算法

  • 新增调参助手功能

  • 将模型评估、模型预测功能从原1.0的AI Studio移至模型管理中

  • 新增训练过程中的进度提示

  • 新增模型细节展示,包括模型超参、训练时长、模型大小、训练及评估数据等

  • 新增Precision/Recall阈值调整功能(查全率及查准率调节)

LittleBoy 1.0.0.0 试用版 (发布日期:2018年8月)#

  • 基于Azure的自动部署LittleBoy 1.0 训练集群(公有云)。

  • 以AI Studio形式创建AI流程。

  • 支持AutoML进行深度学习训练(分类、回归)

  • 模型评估

  • 批量预测

  • REST API预测