WHOAMI
Xu Jiang
技术人的日常.
  • sparksql-ranger-column-level-security-masking

    Apache Spark引发了在大型数据集上进行数据挖掘的爆炸式增长。Spark在通用分布式计算访问中发挥了巨大的作用。任何在Python,Scala,Java和R中具有一定造诣的人都能大规模地探索数据。Spark提供ML(Machine Learning)作为一系列黑盒子,将数据科学民主化。对于...

    • spark
  • 简介Apache Spark的行-列级的访问权限

    Hortonworks数据平台(HDP)的最新版本的功能为我们的客户提供了大量重大的改良,例如,现在HDP 2.6.0支持Apache Spark™2.1和Apache Hive™2.1(LLAP™)作为GA。通常客户在Hive里面存储数据,用Hive和SparkSQL分析这些数据。这种方案一个很...

    • spark
  • spark manual

    集群概述 本文章涉及spark安装部署,spark-sql,spark-shell,streaming等等的应用demo… saprk文章 部署过程详解 Spark布置环境中组件构成如下图所示。 Driver Program 简要来说在spark-shell中输入...

    • spark