基础数据是智慧园区的基础,基于基础数据的分析、处理及整合,可以协调不同业务、不同领域、不同部门之间的业务处理,实现园区资源的综合利用,在大数据技术领域,主要目的是围绕打造信息优势并向决策优势转换的发展目标,通过突破高效、稳定、易用、安全的大数据分析处理技术,解决当前数据资源利用单一、分析挖掘手段缺乏、智能化辅助能力低的问题,为智慧园区建设提供支撑。大数据关键技术的能力将瞄准在平台运算处理能力和对业务的支撑,优化、提升平台存储和运算能力,进一步对跨系统及各类数据进行整合,提升数据分区二次存储能力,满足数据支撑不同类型的业务需要。对行业业务数据进行积累和沉淀,形成可复用算法库。因此,基于大数据平台的分析、处理及融合的相关技术是解决支撑平台能够智能运行的关键。
1、海量数据存储技术
针对不同应用场景满足海量数据存储管理需求,提供异构数据统一管理,支持关系数据库、分布式文件系统、分布式数据库、图数据库的数据存储。
2、多种计算模式的海量数据并行计算技术
针对不同数据处理需求特征,提供涵盖批量计算、流式计算、图计算多种计算模式,为大规模数据高效挖掘分析提供计算支撑。提供批处理计算框架、流处理计算框架、图计算框架等计算引擎,并对集群的大规模计算资源进行统一管理。
3、大数据挖掘引擎技术
实现大数据挖掘平台技术,为业务分析人员提供图形化大数据挖掘算法运行、监控功能以及图形化大数据挖掘流程构建与运行功能;为分布式开发人员提供大数据挖掘算法开发基础软件环境以及工具库;提供大数据挖掘算法、流程管理功能,集成Mahout、MLib开源分布式挖掘算法,支持分布式挖掘算法注册与搜索。
4、大数据交互式分析技术
实现海量数据交互式内容分析,一方面提供交互式数据操作接口,支持select、join、insert、union、avg、group等典型SQL操作;另一方面封装数据分析典型需求,支持全局有序数据重组、数据统计、数据抽样等一键式数据分析。降低数据分析人员的分析复杂度,提升数据内容分析效率。