数据集
本页目录
数据集#
数据集管理页面#
数据集用来管理“可视化建模”等功能中使用到的全部数据。在数据集管理页面用户可以自由创建、编辑数据集,也可通过修改权限的方式与其他用户协作管理同一个数据集。
如图所示为数据集管理页面,可以通过左上角按名称筛选或排序数据集。每个数据集的方框中,由上至下分别展示了数据集的名称、创建用户、创建时间、数据集内对象名称和类型。
每个数据集方框的右上角是功能按钮,分别用来编辑名称、设置权限、删除。点击权限按钮,在如图所示的弹出窗口中,可以将当前数据集的权限读取、编辑等权限赋给其他角色、用户组,从而共享给他人。
数据集详情页面#
在数据集管理页面点击“添加数据集”,会新建一个数据集并进入它的管理的页面;或是点击某个数据集的标题,也会进入相应的详情页面。
页面采用列表的形式,展示了数据集中所有数据对象的详细信息,在其中可以进行筛选、排序、添加、删除等操作。
单击某个类别为“OushuDB”的数据对象的名称,可以在弹出框中看到这个表的位置信息。
而单击类别为“CSV”、“Excel”的数据对象的名称,则会弹出一个新窗口,在窗口中可以重新设置各列的数据类型,也可以查看到文件在HDFS上的存储位置等信息。单击“保存”就可以保存所做的改动。
添加数据对象-文件类型#
要向一个数据集中添加一个CSV类型的数据,需要点击数据集详情页面的“添加数据对象”按钮,在弹出窗口中选择“本地上传”。
在“本地上传”栏目中,用户需在本地存储中选择需要上传的CSV或Excel文件并上传。等待上传成功后,系统会自动识别文件各个字段的名称和数据类别,结果会显示在“分析结果”一栏里。如果自动分析结果不理想,还可以手动更新“名称”,“类型”等字段。
本地上传类型数据时,还需设置上传后文件的保存位置,如一个OushuDB数据库的特定schema里。
完成后点击“新建数据对象”按钮,就成功地将本地数据上传至平台,并能顺利地用在之后的建模工作中了。
添加数据对象-表类型#
从已连接的数据库中添加一个表类型的数据。当前版本支持的数据库类型包括OushuDB、MySQL等。新建数据对象窗口的最上方展示出了所有可选择的数据库集群,用户可以从中选择一个集群,在树状选单中寻找到要添加的表,设置一个合适的数据对象名称后,再点击“保存”按钮。注意数据对象可以根需要灵活取名,并不会影响到数据库中的表。