首页 > 新闻中心 > 掌酷科技 > 数码 > VRAR >

SQL任务运行时间省40%,后悔没早从Hive迁到Spark…(3)
2021-06-02 09:45 dbaplus社群
  • 定时将前一天的History目录上传到hdfs
  • 开发HiveHistoryParser
  • Hive History Parser的主要功能是:

    2. SQL改写&双跑

    SQL改写会对上一步生成的每个原始SQL文件执行以下步骤:

    SQL双跑步骤如下:

    3. 结果对比

    结果对比时会遍历每个回放记录,统计以下指标:

    具体流程如下:

    分别对Spark和Hive的产出表执行以下SQL,获取表的概要信息

    比较两张表的概要信息:

    标签: 后悔 时间 运行 迁到
    0

    官方微信公众号:掌酷门户(wapzknet)

    相关资讯

    新闻热点
    精选美图