Griffin数据质量监控工具

24 Mar 2021

为什么要做数据质量监控

garbage in garbage out,处理的数据质量不好,处理完也不会有什么有用的信息

数据质量监控方法

Griffin架构

Apache Griffin是一个开源的大数据数据质量解决方案,它支持批处理和流模式两种 数据质量检测方式,可以从不同维度(如离线任务执行完毕后检查源端和目标端的数 据数量是否一致、源表的数据空值数量等)度量数据资产,从而提升数据的准确度、 可信度。
Griffin主要分为Define、Measure和Analyze三个部分:

编译安装