分析团队的管理者们必须拿捏好指导数据科学家们完成工作,和给予他们能够有效完成工作所需要的空间之间的分寸。
一些企业发现,他们不能轻易搭建一个数据湖(data lake),因为这需要制定特定的战略来构建一个框架以提供支持。
通过使用Kafka信息队列技术和自动处理脚本,网络点击数据可以进入集群,能够在20到40毫秒之间进行数据分析。报表和分析基本上是实时的,比旧系统要快很多。
报告显示,公司最常用的数据集为地理/地图数据(57%)、交通数据(43%)和环境数据(42%)。
Forrester咨询师Boris Evelson在调查报告中指出,自服务BI工具和先进的数据可视化软件能有效帮助BI系统更敏捷地支持业务运营
在Hadoop集群上部署Spark处理引擎,每天处理14TB的交易数据,这就是在线广告平台Altitude Digital最近的实践,它主要追踪用户的社交媒体数据。
先进的分析技术可以帮助企业超越基本的商务智能流程,提高业务运营效率,预测客户行为,识别并影响市场趋势。
ROI(投资回报率)是考量商务智能、客户服务和其他项目的重要指标。如果没有ROI,就很难了解项目的执行效果。但IT项目的ROI并不是那么容易的。
2013年末,调研机构Gartner发布的魔力象限报告称,其所采用的运行数据库管理系统顶级供应商中,有五家是NoSQL数据库供应商。
银行并不希望将BI人员操作产生的所有分析数据都塞进新的数据集和EDW——银行想要的只是那些可视为企业资产的信息。