对于产品经理来讲,了解产品的使用情况是最为重要的事情之一。不过,对于Hadoop平台这样的产品来讲这件事情就有点飘忽不定了。
对于三个顶级的Apache项目,本文并未对它们的大量特性和不同之处做进一步描述。不过,一定要记得上面的比较是有局限性的,因为这些系统会一直演化和进步。
Amazon在AWS re:Invent云计算大会上,AWS发布了分布式关系数据库Aurora的预览版、以及对应的AWS配置和密钥管理。但一些重要细节并未公开。
从来没有什么项目像YARN这样,对Hadoop有如此之大的影响。YARN是第二代的MapReduce,一个资源和集群管理的工具,对提高Hadoop的实用性具有深远的意义。
机器学习可能是现在收益最高,也是最受欢迎的一项技术之一。毫无疑问——作为开发人员,机器学习是一个能够大展身手的舞台。
如果你还没有尝试过TokuDB,现在就是一个机会。首先我将介绍TokuDB是如何与MySQL协同工作的。
数据爆炸得益于以下几点:处理能力增加,处理器小型化,以及成本也有所下降。这些变化的综合结果是,从我们的手表到冰箱,几乎都具有了处理能力。
通过四个传感器产生的数据,一般可以分为两类:一类是温度和声响,它们一般是一个常量数据流;一类是运动和触控传感器,它们通常不会按照特定的频率发生
虚拟服务器的介入把存储管理搞得一团糟,但好的管理工具可以抽茧剥丝,呈现存储管理的行云流水之势。
在近期举行的Teradata大数据峰会上,数据仓库巨头Teradata发布了一系列增强其核心数据管理功能的产品。其中最重要的当属大数据解决方案QueryGrid。