即兴小探华为开源行业领先大数据虚拟化引擎openLooKeng( 三 )


  • 存储计算分离:openLooKeng本身没有存储引擎,但可以查询存储在不同数据源中的数据 。因此,该系统是一个典型的存储计算分离系统,有利于独立扩展计算和存储系统 。openLooKeng存储计算分离架构适用于动态扩展集群,实现资源快速弹性伸缩 。
  • 快速数据探索:客户拥有大量数据 。为了使用这些数据,他们通常会构建专用的数据仓库 。但是,这将带来额外的数据仓库维护人力成本和数据ETL时间成本 。对于需要快速探索数据 , 但又不想建设专用数据仓库的客户,复制数据并加载到数据仓库费时费力 。openLooKeng可以使用标准SQL定义一个虚拟数据市?。?通过跨源异构查询能力连接各个数据源 。这样,在虚拟数据市场的语义层中就可以定义出用户需要探索的各种分析任务 。借助openLooKeng的数据虚拟化能力 , 客户可以快速构建基于多种数据源的探索分析服务,无需建设复杂、专用的数据仓库 。
  • 相反的由于openLooKeng设计其不适用对实时性要求很高如秒级响应的系统和针对并发要求很高的系统 。
    安装openLooKeng支持单机一键部署、手动部署、自动部署,自动部署又包含在线部署、离线部署 。下面离线单台集群部署和多台集群部署
    单台部署# 下载 https://download.openlookeng.io/auto-install/openlookeng.tar.gz 并将其内容解压到 /opt 目录 。wget --no-check-certificate https://download.openlookeng.io/auto-install/openlookeng.tar.gztar -xvf openlookeng.tar.gz -C /opt/# 创建目录 /opt/openlookeng/resource 并保存 openLooKeng 执行文件 https://download.openlookeng.io/<version>/hetu-server-<version>.tar.gz 和 https://download.openlookeng.io/<version>/hetu-cli-<version>-executable.jar , 其中<version>对应于正在安装的版本,例如1.0.0 。mkdir -p /opt/openlookeng/resourcewget --no-check-certificate https://download.openlookeng.io/1.8.0/hetu-server-1.8.0.tar.gzwget --no-check-certificate https://download.openlookeng.io/1.8.0/hetu-cli-1.8.0-executable.jar# 同时将第三方依赖保存在 /opt/openlookeng/resource 目录下 。根据本机的架构,下载 https://download.openlookeng.io/auto-install/third-resource/x86/ 或 https://download.openlookeng.io/auto-install/third-resource/aarch64/ 下面的全部文件 。这应该包括一个 OpenJDK 文件和两个 sshpass 文件 。wget --no-check-certificate https://download.openlookeng.io/auto-install/third-resource/aarch64/OpenJDK8U-jdk_aarch64_linux_hotspot_8u222b10.tar.gzwget --no-check-certificate https://download.openlookeng.io/auto-install/third-resource/aarch64/sshpass-1.06-1.el7.aarch64.rpmwget --no-check-certificate https://download.openlookeng.io/auto-install/third-resource/aarch64/sshpass-1.06.tar.gz# 执行离线bash /opt/openlookeng/bin/install_offline.sh
    即兴小探华为开源行业领先大数据虚拟化引擎openLooKeng

    文章插图
    集群部署集群部署裕单台部署类似
    # 将openlookeng.tar.gz文件和资源文件分发到其他服务器scp -r /opt/openlookeng server2:/opt/scp -r /opt/openlookeng server3:/opt/# 执行离线,等待几分钟时间待三个节点完成部署bash /opt/openlookeng/bin/install_offline.sh -m
    即兴小探华为开源行业领先大数据虚拟化引擎openLooKeng

    文章插图
    命令行接口# openLooKeng CLI提供了一个基于终端的交互shell,用于运行查询 。CLI是一个可执行的JAR文件,可以通过java -jar ./hetu-cli-*.jar执行 。下载于服务器对应版本的 CLI 文件,例如:hetu-cli-1.0.0-executable.jar,运行:java -jar ./hetu-cli-1.0.0-executable.jar --server localhost:8080 --catalog hive --schema default# 也可以直接运行openlk-cli , 相当于java  -jar /opt/openlookeng/resource/hetu-cli-*-executable.jar   --server localhost:8090/opt/openlookeng/bin/openlk-cli# 使用--help选项运行CLI,查看可用选项 。# 默认情况下 , 使用less程序将查询结果分页,该程序配置了一组精心选择的选项 。可以通过将环境变量OPENLOOKENG_PAGER设置为其他程序的名称(如more)或将其设置为空值来完全禁用分页来覆盖此行为连接器openLooKeng中可用的连接器,用于访问不同数据源的数据 。官方提供非常丰富连接器供使用
    MySQL连接器
    MySQL连接器允许在外部MySQL数据库中查询和创建表 。可用于在MySQL和Hive等不同系统之间或在两个不同的MySQL实例之间联接数据 。

    推荐阅读