Release Notes
本页目录
Release Notes#
LittleBoy 5.0.3.0 (发布日期2023年10月)#
适配了Skylab 5.4.0.0
LittleBoy 5.0.0.0 RC2 (发布日期2022年11月)#
支持了MultiMaster
UI全新升级
新增时序数据建模支持,增加机器学习时序算法Lasso、Prophet,深度学习算法RNN
新增数十种不同图、表类型的数据可视化算子
修复了复制画布连接,合并,SQL算子异常的问题
修复了并发训练模型相关问题
LittleBoy 4.2.0.0 (发布日期2022年02月)#
新增分布式随机森林、孤立森林等机器学习算法
优化AutoML算法的使用体验,允许保存AutoML过程中的多个模型,并在这些模型之间自由切换
新增部分机器学习模型的训练记录展示,包括训练过程中的损失函数折线图,特征重要性柱状图,P-R曲线,Gain-Lift曲线等等
新增决策树类算法的可视化展示,包括分布式随机森林、XGBoost、孤立森林及AutoML中的所有决策树类模型
在分布式随机森林模型、XGBoost模型预测结果中,添加模型可解释性SHAP值输出
优化模型管理页面的展示结构,添加按照目录结构展示的组织形式,便于模型的版本控制
新增可视化建模任务一键导入导出功能
添加数据抽样算子,允许随机抽样及分层抽样等抽样方法
优化数据分割算子,支持按照选定的标签列进行分层分割
优化目标表算子,允许将目标表作为数据对象添加到数据集中,允许切换“覆写”和“追加”两种数据写入方式
优化特征工程算子的使用逻辑,添加批量处理特征的开关
LittleBoy平台全面适配ARM架构
LittleBoy 4.1.0.0 (发布日期:2021年12月)#
重构可视化建模执行器,提升了画布运行速度,减少任务和节点的启动延迟,规范了不同数据源之间的数据类型
新增“我的资源”页面,使用图形化展示当前用户的计算资源使用情况,允许对资源进行统一管理
新增对计算集群的运行监控和日志展示
可视化建模页面中,新增对运行时间和运行历史的展示
数据处理流程中新增“统计”节点,提供空值、平均数、分位数、异常值、离散类别数等常用信息的一键统计,便于快速地掌握数据分布情况
数据处理流程中新增“类型转换”节点
新增AutoML训练算子,自动从线性回归、随机森林、梯度提升树、XGBoost、神经网络等算法中自动选择模型结构,进行超参调优并获得最优模型。支持输出模型参数细节、支持模型进行批量预测与发布服务
新增DeepLearning训练算子,支持自定义隐藏层参数、支持自适应学习率
升级了XGBoost等算子,丰富了可配置的参数项,提升了建模表现、运行速度和稳定性
机器学习评估算子中新增一键导出评估报告功能
LittleBoy 4.0.2.0 (发布日期:2021年8月)#
可视化建模新增数据清洗算子,支持十余种通用的数据清洗动作,包括字符串长度填充、指定位置填充字符串、搜索并填充字符串等填充操作,字符串替换操作,删除指定位数、搜索并删除子串、搜索并删除指定位数、修剪前后缀等删除操作,空值填充、指定数值转空值操作,列重命名操作,日期类型、时间戳类型、数值类型和日期字符串类型之间的转换和格式化操作,英文字母全部转换大写、全部转换小写、单词首字母转大写等操作
可视化建模新增数据脱敏算子,包含数据模糊化、替换固定值、增补前后缀、数据裁切、MD5字段加密等多种脱敏操作
可视化建模升级字段衍生算子,新增按位取子字符串、正则匹配子字符串、生成固定字段、字段对比、拆分多列、合并多列等操作,也支持添加自定义SQL语句的衍生列
可视化建模支持XGBoost算法框架,支持用XGBoost算法训练机器学习模型,使用XGBoost模型批量预测和发布服务
LittleBoy 4.0.1.0 (发布日期:2021年6月)#
可视化建模新增自定义SQL算子
优化流计算对断点续传的支持
提升了模型训练、上线服务的稳定性
LittleBoy 4.0.0.0 (发布日期:2021年5月)#
升级可视化建模架构,新增特征工程、机器学习建模流程,添加对流计算的支持
可视化建模中新增“独热编码”、“标准化”、”主成分分析”等特征工程算子
新增分类、回归、聚类、关联规则等领域的机器学习算子,及机器学习模型的预测和评估算子
新增“折线图”、“饼状图”、“热力图”、“树状图”、“桑基图”等几十种数据可视化算子
支持读取和解析流式数据,新增流数据的数据处理算子
优化可视化建模的使用体验,提供智能推荐下游算子的方法
升级数据集功能,支持MySQL等更多数据库/文件系统的来源数据
新增分配计算资源,管理资源队列的功能
LittleBoy 3.3.2.0 (发布日期:2021年2月)#
新增可视化建模(数据集处理算子)
移植原数据工厂的“筛选”、“合并”、“连接”、“衍生”、“去重”、“分组”、“排序‘、”分割“等算子
新增数据集功能
LittleBoy 3.0.0.0 (发布日期:2020年4月)#
新增Notebook功能和配合其使用的“littleboy” Python库,可以实现数据探索、自定义训练模型等功能
新增可配置的Spark机器学习算法:Logistic Regression、Naive Bayes、Decision Tree、RandomForest、Gradient Boosted Tree、KMeans、GMM
新增训练流程中的特征重要性算法
优化了预测结果、混淆矩阵的展示
LittleBoy 2.1.0.1 (发布日期:2020年2月)#
针对⼤数据量的预测任务,优化了分布式预测
LittleBoy 2.1.0.0 (发布日期:2019年9月)#
新增模型导入导出功能
新增将模型发布成AI服务,并可为服务一键切换不同模型。
LittleBoy 2.0.0.0 (发布日期:2019年2月)#
以Wizard引导方式创建AI模型的训练流程(替代AI Studio形式)
新增可配置深度学习算法:Oushu Neural Network、Wide And Deep Neural Network
新增可配置传统机器学习算法:Random Forest、Decision Tree、Boosted Tree、SVM、K-Means
升级AutoML算法
新增调参助手功能
将模型评估、模型预测功能从原1.0的AI Studio移至模型管理中
新增训练过程中的进度提示
新增模型细节展示,包括模型超参、训练时长、模型大小、训练及评估数据等
新增Precision/Recall阈值调整功能(查全率及查准率调节)
LittleBoy 1.0.0.0 试用版 (发布日期:2018年8月)#
基于Azure的自动部署LittleBoy 1.0 训练集群(公有云)。
以AI Studio形式创建AI流程。
支持AutoML进行深度学习训练(分类、回归)
模型评估
批量预测
REST API预测