Altair Grid Engine 高级培训 2021

功能和命令的详细方面

实时互动在线培训

2021 年 11 月 16 日,星期二,欧洲中部时间 10:00 开始

期间

每周 4 小时,周二至周四,为期两周

价钱

每人 2,500 欧元


Course Overview

本课程旨在通过涵盖 Grid Engine 功能和命令的详细方面来扩展系统管理员和最终用户对 Grid Engine 的知识。该课程使管理员能够将业务目标转化为 Grid Engine 配置,并使高级最终用户能够创建工作流以有效地使用工作负载管理系统。

该课程提供了收集站点定义共享资源的宝贵经验,例如许可证、经典和容器化工作负载(例如 Docker)的作业提交和执行环境的配置、GPU 管理、动态集群配置等。

课程中集成了动手练习以及实用的故障排除技巧。


谁应该参加课程?

本高级课程专为负责扩展 Grid Engine 在站点定义的集群资源管理中的角色并需要实施作业和资源控制的系统管理员和高级最终用户而设计。

课程内容适用于所有版本的Grid Engine。


Prerequisites

  • Linux或Unix操作系统的基础知识
  • Unix shell 基础知识(如 bash/csh/ksh 和 vi 编辑器)
  • 系统管理概念和并行编程模型(共享内存/分布式内存)的基础知识
  • 实用的 Grid Engine(或类似)管理技能或高级的基本知识
    网格引擎 用户体验是有利的,但不是必需的

客户在说什么

培训给我们带来了许多新的见解......仅仅几周后,当我们遇到一个小问题时,我们能够立即解决它。

- Ralf Nolte,系统管理员,CeBiTec,比勒费尔德大学

培训的好处是显着的,尤其是在管理企业面临的风险方面。

- Mike Twelves,供应链解决方案,塔塔钢铁公司


Course Outline

  • 概念回顾
  • 网格引擎 概念和组件
  • 高级配置
  • 全局配置
  • 主机配置
  • 队列配置
  • 负载传感器和资源
  • 工作类型和环境
  • 并行作业和环境
  • 多线程、MPI等
  • 松散与紧密的并行作业集成
  • 阵列作业
  • 互动作业
  • 诊断和性能调优
  • 调试与故障诊断
  • 调整高吞吐量
  • 数据假脱机和影响
  • 调度器配置
  • 调度策略(权利、紧急和优先级策略)
  • 资源预留 (RR) 和回填
  • 提前预订 (AR) 和长期预订 (SR) 简介
  • 用于灵活执行限制的资源配额集 (RQS)
  • 管理不同类型的工作负载
  • 用于封装复杂作业提交的作业类 (JC)
  • 管理作业提交验证程序 (JSV)
  • 内核/内存绑定,Linux CGROUPS
  • 管理 GPU 并与 NVIDIA 数据中心 GPU 管理器集成
  • 将 Docker 与 Altair 结合使用 网格引擎
  • 提交 Docker 作业并请求 Docker 运行选项
  • 问题和解答
 

保存您的位置!