恒泰博远,专家级研发软件定制开发公司,为企业定制营销、办公、管理软件 在线咨询 :
咨询电话:010-82969001

谷歌分析服务的实时数据流

来源:http://www.hengtaiboyuan.com 作者:恒泰博远 时间:2014-06-27

[摘要]谷歌云数据流可以分析这两个流和批量数据使用相同的编程模型

谷歌云数据流可以分析这两个流和批量数据使用相同的编程模型 

 

采取什么许多人认为在大数据分析的下一步,谷歌还预览了一个名为谷歌云服务的数据流,分析实时数据,这可能使用户能够查看趋势和警觉到,因为它们发生事件的能力。 

 

“有被创建的数据的大量,所以你需要一种方法来摄取,在一个更智能的方式,”布赖恩戈德法布,营销谷歌云平台负责人说。随着大数据“的课程模式是不同的,技术是不同的,它要求开发人员学习了很多,管理大量做到这一点。”

 

[发现什么新的业务应用与InfoWorld的技术:应用通讯。 ] 

 

“这是一个全面的管理服务,可以让您创建数据管道的摄取,转化和分析任意数量在这两个批次或流模式数据,使用相同的编程模型,”戈德法布说。 

 

谷歌云计算数据流的设计,使用户可以专注于制定适当的分析,而无需担心设置和维护基础数据管道和处理基础设施。 

 

它可以被用于实时情感分析,例如,在一个组织通过扫描社交网络如Twitter估计围绕产品的火爆人气。它也可以被用来作为一种安全工具来监视异常活动活动日志。 

 

“有一堆不同的业务应用中,它可以应用在很多数据中心的垂直行业,如零售,石油和天然气,技术这样可以打开大门,以获得分析,”戈德法布说。 

 

它也可以用来替代商业ETL(提取,转换和加载)节目,广泛用于制备数据用于通过商业智能软件分析。 

 

谷歌云计算数据流的基础上,该公司在内部建立了其自己使用,对工作也做了MapReduce编程模型,它采用的是Apache的Hadoop的跟进技术。 

 

实时数据流分析,似乎是在大数据分析的下一个合乎逻辑的步骤,通过Hadoop的开创一个领域。 Hadoop提供一个方法来分析跨多个服务器分布大量的非结构化数据。原来,Hadoop的MapReduce的使用作为平台编写分析数据的程序。 

 

的MapReduce的局限性在于它只能分析数据以批处理模式,这意味着所有的数据必须收集它可以分析之前。已经开发了一些新的软件程序来绕过批处理的限制,如Twitter Storm和Apache的火花,这两者都是可以作为开源的,可以在Hadoop上运行。 

 

谷歌自己的方式来实时数据分析使用了一些由公司,尤其是水槽和MillWheel建造技术。水槽汇总大量数据和MillWheel提供低延迟的数据处理平台。 

 

该服务提供了一个软件开发工具包,可以用来构建复杂的管道和分析。 MapReduce一样,云数据流将开始使用Java编程语言。在未来,其他语言可以被支撑。 

 

该管道可以从外部来源摄取数据,并将其用于各种各样的事情。该服务提供了一个函数库编写和格式化的数据进行进一步的分析,用户可以编写自己的转换。 

 

经处理后的数据集,可以对查询使用谷歌的BigQuery中的服务。或者用户可以编写模块来检查数据,因为它跨越了线,寻找实时的异常行为或趋势。 

 

谷歌宣布云数据流在旧金山的公司的谷歌I / O的用户大会。少数谷歌的客户正在测试它,该公司计划打开它作为一个公共预览今年晚些时候。