OushuDB 发布新版本啦!
OushuDB 云原生数据仓库正式发布 4.6.0.0 版本
数据云平台上的鸿星尔克们可以很快扩大产能吗?
如果你还不了解云数仓,那我们不妨先拿鸿星尔克发紧急通知求大家退款这件事举个栗子
偶数AI小课堂:集成学习之Bagging思想
我们在生活中做出的许多决定都是基于其他人的意见,而通常情况下由一群人做出的决策比由该群体中的任何一个成员做出的决策会产生更好的结果,这被称为群体的智慧。集成学习(Ensemble Learning)类似于这种思想,集成学习结合了来自多个模型的预测,旨在比集成该学习器的任何成员表现得更好,从而提升预测性能(模型的准确率),预测性能也是许多分类和回归问题的最重要的关注点。
你的数据库为什么这么慢?
数据库的计算引擎性能有多重要?我们可以拿汽车做个简单类比。服务器硬件配置是基础设施,相当于汽车行驶的道路,高速公路和山村土路的行驶效果肯定是不一样的;SQL的查询优化相当于驾驶水平;而数据库计算引擎就相当于汽车发动机,既是数据库性能的源动力,也是各家厂商最核心的技术壁垒。
数据湖还数据仓库?湖仓一体了解下
由于云技术的推动,企业对于跨公司、跨行业、跨领域的综合型数据的需求日趋明显,不同类型、格式数据之间的关联性碰撞越来越激烈,刺激着数据技术的创新发展,逐渐形成了大数据生态结构。当前面临的问题的复杂性、综合性、交叉性,导致数据的使用成本越来越高,企业迫切需求能够有效打破数据孤岛、解决数据主权、统一数据汇聚和共享的混合式数据平台,数据湖应运而生。
数字化转型前夜,保险科技如何破局?
作为OushuDB最直接的用户,研发人员和运维人员等不同角色通过使用OushuDB为险企搭建企业级数仓、大数据平台和部门级数据集市(如风险集市、监管报送、财险集市、健康险集市),在国产化自助可控的大背景下,未来有望逐步平稳的替代现行国外厂商的数仓。客户和用户在使用OushuDB的同时,获得了更高的计算性能、大规模集群和在线扩容等科技优势。
数据同步工具ETL、ELT傻傻分不清楚?3分钟看懂两者区别
数据同步工具ETL或者ELT的作用是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。数据同步是大数据项目重要的一个环节。通常情况下,在大数据项目中数据同步会花掉整个项目至少1/3的时间,数据同步工具设计的好坏直接关接到BI项目的成败。
3分钟告诉你 计算机是如何像人类一样阅读的
不知道最近大家有没有注意,在使用Baidu、Google等搜索引擎的时候,很多简单的问题搜索引擎会直接告诉你答案,比如输入“西游记的作者是谁”就能直接得到“吴承恩”。并且,即便你更换提问方式,例如换成更加口语化的“谁写的西游记”也能获得正确答案。显然,计算机能在一定程度上读懂这个问题,并且还能根据自己掌握的信息来反馈出正确的答案。那么计算机是如何做到的呢?
偶数AI小课堂:如何解决数据集不均衡问题
机器学习作为数据分析的一种重要技术手段,正成为一家企业实现数据智能的关键,通过学术界和工业界对模型和算法的不断优化,通用的模型在部分领域的分类准确度已经超越了人类的水平。但是在信息化和智能化的道路上产生的自然数据往往将有用的信息掩藏较深,面对这样未经科学方法预先处理的数据即便是强大的神经网络都难以给出正确的决策,因此在机器学习中数据往往扮演着很重要的角色。
干货 | 十五年DBA教你如何多、快、好、省的进行大数据平台硬件选型(一)
再优秀的软件也离不开硬件的支持,但如何在大数据平台搭建之初进行硬件选型知道的人却不多。很多看似正确的配置背后却隐藏着巨大瓶颈。如何选择一个配置均衡、高性价比、后期维护成本低、拓展灵活的配置不仅需要丰富的硬件配置经验,还需要对软件有着深刻理解。我们的一位有十五年工作经验的DBA结合实操经验为大家带来了该系列文章。