# 数据集 ## 数据集管理页面 数据集用来管理“可视化建模”等功能中使用到的全部数据。在数据集管理页面用户可以自由创建、编辑数据集,也可通过修改权限的方式与其他用户协作管理同一个数据集。 如图所示为数据集管理页面,可以通过左上角按名称筛选或排序数据集。每个数据集的方框中,由上至下分别展示了数据集的名称、创建用户、创建时间、数据集内对象名称和类型。 ![dataset](../images/dataset.png) 每个数据集方框的右上角是功能按钮,分别用来编辑名称、设置权限、删除。点击权限按钮,在如图所示的弹出窗口中,可以将当前数据集的权限读取、编辑等权限赋给其他角色、用户组,从而共享给他人。 ![dataset-auth](../images/dataset-auth.png) ## 数据集详情页面 在数据集管理页面点击“添加数据集”,会新建一个数据集并进入它的管理的页面;或是点击某个数据集的标题,也会进入相应的详情页面。 页面采用列表的形式,展示了数据集中所有数据对象的详细信息,在其中可以进行筛选、排序、添加、删除等操作。 ![dataset-detail](../images/dataset-detail.png) 单击某个类别为“OushuDB”的数据对象的名称,可以在弹出框中看到这个表的位置信息。 ![dataset-db](../images/dataset-db.png) 而单击类别为“CSV”、“Excel”的数据对象的名称,则会弹出一个新窗口,在窗口中可以重新设置各列的数据类型,也可以查看到文件在HDFS上的存储位置等信息。单击“保存”就可以保存所做的改动。 ![dataset-db](../images/dataset-csv.png) ## 添加数据对象-文件类型 要向一个数据集中添加一个CSV类型的数据,需要点击数据集详情页面的“添加数据对象”按钮,在弹出窗口中选择“本地上传”。 在“本地上传”栏目中,用户需在本地存储中选择需要上传的CSV或Excel文件并上传。等待上传成功后,系统会自动识别文件各个字段的名称和数据类别,结果会显示在“分析结果”一栏里。如果自动分析结果不理想,还可以手动更新“名称”,“类型”等字段。 ![dataset-new-csv](../images/dataset-new-csv.png) 本地上传类型数据时,还需设置上传后文件的保存位置,如一个OushuDB数据库的特定schema里。 ![dataset-new-csv-2](../images/dataset-new-csv-2.png) 完成后点击“新建数据对象”按钮,就成功地将本地数据上传至平台,并能顺利地用在之后的建模工作中了。 ## 添加数据对象-表类型 从已连接的数据库中添加一个表类型的数据。当前版本支持的数据库类型包括OushuDB、MySQL等。新建数据对象窗口的最上方展示出了所有可选择的数据库集群,用户可以从中选择一个集群,在树状选单中寻找到要添加的表,设置一个合适的数据对象名称后,再点击“保存”按钮。注意数据对象可以根需要灵活取名,并不会影响到数据库中的表。 ![dataset-new-csv](../images/dataset-new-db.png)