## Release Notes ### LittleBoy 5.0.3.0 (发布日期2023年10月) * 适配了Skylab 5.4.0.0 ### LittleBoy 5.0.0.0 RC2 (发布日期2022年11月) * 支持了MultiMaster * UI全新升级 * 新增时序数据建模支持,增加机器学习时序算法Lasso、Prophet,深度学习算法RNN * 新增数十种不同图、表类型的数据可视化算子 * 修复了复制画布连接,合并,SQL算子异常的问题 * 修复了并发训练模型相关问题 ### LittleBoy 4.2.0.0 (发布日期2022年02月) * 新增分布式随机森林、孤立森林等机器学习算法 * 优化AutoML算法的使用体验,允许保存AutoML过程中的多个模型,并在这些模型之间自由切换 * 新增部分机器学习模型的训练记录展示,包括训练过程中的损失函数折线图,特征重要性柱状图,P-R曲线,Gain-Lift曲线等等 * 新增决策树类算法的可视化展示,包括分布式随机森林、XGBoost、孤立森林及AutoML中的所有决策树类模型 * 在分布式随机森林模型、XGBoost模型预测结果中,添加模型可解释性SHAP值输出 * 优化模型管理页面的展示结构,添加按照目录结构展示的组织形式,便于模型的版本控制 * 新增可视化建模任务一键导入导出功能 * 添加数据抽样算子,允许随机抽样及分层抽样等抽样方法 * 优化数据分割算子,支持按照选定的标签列进行分层分割 * 优化目标表算子,允许将目标表作为数据对象添加到数据集中,允许切换“覆写”和“追加”两种数据写入方式 * 优化特征工程算子的使用逻辑,添加批量处理特征的开关 * LittleBoy平台全面适配ARM架构 ### LittleBoy 4.1.0.0 (发布日期:2021年12月) * 重构可视化建模执行器,提升了画布运行速度,减少任务和节点的启动延迟,规范了不同数据源之间的数据类型 * 新增“我的资源”页面,使用图形化展示当前用户的计算资源使用情况,允许对资源进行统一管理 * 新增对计算集群的运行监控和日志展示 * 可视化建模页面中,新增对运行时间和运行历史的展示 * 数据处理流程中新增“统计”节点,提供空值、平均数、分位数、异常值、离散类别数等常用信息的一键统计,便于快速地掌握数据分布情况 * 数据处理流程中新增“类型转换”节点 * 新增AutoML训练算子,自动从线性回归、随机森林、梯度提升树、XGBoost、神经网络等算法中自动选择模型结构,进行超参调优并获得最优模型。支持输出模型参数细节、支持模型进行批量预测与发布服务 * 新增DeepLearning训练算子,支持自定义隐藏层参数、支持自适应学习率 * 升级了XGBoost等算子,丰富了可配置的参数项,提升了建模表现、运行速度和稳定性 * 机器学习评估算子中新增一键导出评估报告功能 ### LittleBoy 4.0.2.0 (发布日期:2021年8月) * 可视化建模新增数据清洗算子,支持十余种通用的数据清洗动作,包括字符串长度填充、指定位置填充字符串、搜索并填充字符串等填充操作,字符串替换操作,删除指定位数、搜索并删除子串、搜索并删除指定位数、修剪前后缀等删除操作,空值填充、指定数值转空值操作,列重命名操作,日期类型、时间戳类型、数值类型和日期字符串类型之间的转换和格式化操作,英文字母全部转换大写、全部转换小写、单词首字母转大写等操作 * 可视化建模新增数据脱敏算子,包含数据模糊化、替换固定值、增补前后缀、数据裁切、MD5字段加密等多种脱敏操作 * 可视化建模升级字段衍生算子,新增按位取子字符串、正则匹配子字符串、生成固定字段、字段对比、拆分多列、合并多列等操作,也支持添加自定义SQL语句的衍生列 * 可视化建模支持XGBoost算法框架,支持用XGBoost算法训练机器学习模型,使用XGBoost模型批量预测和发布服务 ### LittleBoy 4.0.1.0 (发布日期:2021年6月) * 可视化建模新增自定义SQL算子 * 优化流计算对断点续传的支持 * 提升了模型训练、上线服务的稳定性 ### LittleBoy 4.0.0.0 (发布日期:2021年5月) * 升级可视化建模架构,新增特征工程、机器学习建模流程,添加对流计算的支持 * 可视化建模中新增“独热编码”、“标准化”、"主成分分析"等特征工程算子 * 新增分类、回归、聚类、关联规则等领域的机器学习算子,及机器学习模型的预测和评估算子 * 新增“折线图”、“饼状图”、“热力图”、“树状图”、“桑基图”等几十种数据可视化算子 * 支持读取和解析流式数据,新增流数据的数据处理算子 * 优化可视化建模的使用体验,提供智能推荐下游算子的方法 * 升级数据集功能,支持MySQL等更多数据库/文件系统的来源数据 * 新增分配计算资源,管理资源队列的功能 ### LittleBoy 3.3.2.0 (发布日期:2021年2月) * 新增可视化建模(数据集处理算子) * 移植原数据工厂的“筛选”、“合并”、“连接”、“衍生”、“去重”、“分组”、“排序‘、”分割“等算子 * 新增数据集功能 ### LittleBoy 3.0.0.0 (发布日期:2020年4月) * 新增Notebook功能和配合其使用的“littleboy” Python库,可以实现数据探索、自定义训练模型等功能 * 新增可配置的Spark机器学习算法:Logistic Regression、Naive Bayes、Decision Tree、RandomForest、Gradient Boosted Tree、KMeans、GMM * 新增训练流程中的特征重要性算法 * 优化了预测结果、混淆矩阵的展示 ### LittleBoy 2.1.0.1 (发布日期:2020年2月) * 针对⼤数据量的预测任务,优化了分布式预测 ### LittleBoy 2.1.0.0 (发布日期:2019年9月) * 新增模型导入导出功能 * 新增将模型发布成AI服务,并可为服务一键切换不同模型。 ### LittleBoy 2.0.0.0 (发布日期:2019年2月) * 以Wizard引导方式创建AI模型的训练流程(替代AI Studio形式) * 新增可配置深度学习算法:Oushu Neural Network、Wide And Deep Neural Network * 新增可配置传统机器学习算法:Random Forest、Decision Tree、Boosted Tree、SVM、K-Means * 升级AutoML算法 * 新增调参助手功能 * 将模型评估、模型预测功能从原1.0的AI Studio移至模型管理中 * 新增训练过程中的进度提示 * 新增模型细节展示,包括模型超参、训练时长、模型大小、训练及评估数据等 * 新增Precision/Recall阈值调整功能(查全率及查准率调节) ### LittleBoy 1.0.0.0 试用版 (发布日期:2018年8月) * 基于Azure的自动部署LittleBoy 1.0 训练集群(公有云)。 * 以AI Studio形式创建AI流程。 * 支持AutoML进行深度学习训练(分类、回归) * 模型评估 * 批量预测 * REST API预测