TechTarget新闻记者和网站编辑,主要关注数据管理领域的技术趋势和动态。
对于在实时数据集上测试机器学习算法,搭建云平台特别有用,因为用户就不必为测试运行对内部系统进行供应和配置。
那些正挣扎在大量企业数据中的IT和分析管理人员可能发现,他们很难忽略不断变化的市场会推进从技术供应商那里获得机器学习工具。
汹涌而来的大数据浪潮正在改变数据建模技术,包括模式的创建。数据专业人员应该及时做出调整,适应形势的变化。
开源Apache Spark架构已经提供了快速的内存处理和高性能的机器学习库,还集成了数据流处理能力。它还在继续吸引更多来自Web新贵和传统企业环境的追随者。
GPU技术的使用是一些机器学习应用的前沿和核心。Facebook,百度、亚马逊和其他一些公司正在使用的GPU集群来研究深层神经网络相关的机器学习应用程序。
批处理本是大型机时代的主题,近十年来随着Hadoop MapReduce的关注度逐渐增加,批处理现在又重新成为热门主题。
Hadoop受到很多人的关注,但是大数据框架融入IT主流的步伐在减缓, Gartner公司2015年的调查显示只有十分之一的受访者将Hadoop用于生产应用。
曾经有一段时间,地理数据用于寻找石油或水资源研究。现在,地理位置系统已无处不在。这其中发生了哪些变化呢?
虽然在Kafka和MapR Streams间存在不同,但是,MapR软件会将其高可用性和数据恢复特性的品牌包含在内。
Hadoop在一些企业部署时,往往会遇到多个用户各自创建的数据处理工作的情况。这些工作都运行在同一个Hadoop系统上时,他们之间可能会彼此冲突。