R语言是开源免费的,它已经应用了15年了,这意味着你需要的大部分功能,它都已经具备了。
在云计算时代到来之前,安全就已经成为数据库领域最受关注的话题之一,而将数据放到云端,就意味着企业数据中心失去了对数据的掌控,这无疑会增加额外的风险。
我们看到的大量内存数据库还是用来跑分析应用,因为交易数据都存储在传统磁盘当中,而内存数据库中运行都只是原始数据的副本。
随着当今数据分析技术的发展,数据可视化也在发生着剧变。在本文中,我们一起来看看它都有哪些显著的变化。
在构建数据仓库项目时,技术问题总是很容易解决;而企业文化问题则通常是导致数据仓库项目失败的原因。
不同的技术都需要数据库团队的支持和维护。但如果你成功地减少了数据库平台,那么效率得到提高,成本得以降低,这几乎是必然的。
操作型数据库支持在线事务处理(OLTP),它们是高度优化的进行事务处理的数据库。而分析型数据库不适合做事务处理,但非常擅长处理分析问题。
在考虑性能优化之前,需要先找出现存的瓶颈。如果你的查询性能CPU负载比较高,那么买更快的磁盘就完全是浪费钱。
MapReduce和Hadoop是相互独立的,实际上又能相互配合工作得很好。因此,我们常常发现他们会被同时提到。
用Hadoop和Mapreduce管理存储和查询半结构化数据是一种趋势,由他们所产生的元数据可以用更加常规的技术存储和操纵。