uit cloud智算平台是集合资源统一部署、管理、调度、监控、报警、计费、报表及ai应用管理为一体的hpc和ai融合算力管理平台,支持混合云资源调度管理,满足不同场景需求,满足不同场景需求 帮助企业高效、低成本地实现复杂数据集群的统一管理,用一个平台、一套标准帮助 多云环境下的企业实现应用管理,大幅提高计算效率,加速应用处理
uit cloud智算平台是集合资源统一部署、管理、调度、监控、报警、计费、报表及ai应用管理为一体的hpc和ai融合算力管理平台,支持混合云资源调度管理,满足不同场景需求,满足不同场景需求 帮助企业高效、低成本地实现复杂数据集群的统一管理,用一个平台、一套标准帮助 多云环境下的企业实现应用管理,大幅提高计算效率,加速应用处理
支持前处理、后处理作业过程实时可视化查看,为仿真设计提速
支持应用软件优化、定制,应用模板发布管理,自定 义业务pipeline任务流;基于计算、存储等资源的定价、账单、报表管理
支持tensorflow、caffe等多种ai开源框架,支持docker、 singularity容器实现单机/多机训练和推理
支持x86(intel/海光)及arm(飞腾/鲲鹏)多种架构, 支持gpu监控与调度,支持lustre/beegfs/gpfs多种并行存储
支持混合云,本地与公有云资源联动管理,支持多种调度 器(cas/slurm/lsf/pbs)智能作业调度,提供web/cli/gui多种访问形式
集群部署 | web portal |
利用集群部署模块可帮助系统管理员快速部署大规模集群系统,简单完成集群节点的操作系统和软件的部署。 | 通过web portal将集群管理、集群监控、作业调度管理、集群报表等各个功能模块的界面统一起来,实现用户统一登陆,提供用户管理和权限管理功能,管理员可以给用户设置各个模块的访问权限。 |
集群监控管理 | 数据管理 |
系统管理员可实时监控真实物理机柜视图,可便捷、直观查看所有节点运行情况,监控集群系统以及每个节点的系统资源使用情况(cpu、内存、硬盘、网络、负载),支持页面、邮件报警,提供统一控制报警功能且支持报警阈值设置。可查看节点列表并进行节点角色管理、并行命令、远程开关机等操作。 | 数据管理模块提供用户数据文件的管理功能。用户可通过左侧的文件目录树找到路径下的所有文件和目录,根据需要打开或者浏览目标文件。也可使用文件管理功能栏对文件或文件夹进行各种操作,如 “预览”、“下载”、“复制”、“剪切”、“创建副本”、“删除”和“查看详情”等。 |
作业调度 | 计费与报表 |
作业调度模块帮助管理员合理、高效的利用集群系统中软、硬件资源,通过调整调度策略来优化资源利用率并减少作业响应时间,提高集群效率;支持多种方式提交作业,简化作业提交过程,可将常用应用程序设置为模板,方便快速提交作业。通过web界面上传应用程序算例和作业脚本,并且可对脚本完成在线编辑、删除、压缩等功能。 | 计费模块提供了详单、报表、余额和定价的功能。详单中展示了用户作业产生的实时费用信息。 报表系统为用户提供详细、丰富的数据资源统计功能,包括系统资源使用统计报表,账单收费报表以及记账设置,可导出pdf、html、excel报表。 |
许可证管理 | 远程3d可视化 |
许可证管理模块提供了许可证服务管理,以及应用软件许可证服务器配置和客户端连接状态的查看功能,便于用户管理应用软件许可证的连接和查看其使用情况。许可证中包含了许可证服务的增删改,feature状态和使用数的监控。 | 采用vnc或dcv技术实现应用的远程3d可视化,将复杂抽象的应用计算过程和数据信息,以合适的视觉元素及视角去呈现,方便大家理解、监控和记忆,且操作简单、易理解。 |
uit cloud智算平台是集合资源统一部署、管理、调度、监控、报警、计费、报表及ai应用管理为一体的hpc和ai融合算力管理平台,支持混合云资源调度管理,满足不同场景需求,满足不同场景需求 帮助企业高效、低成本地实现复杂数据集群的统一管理,用一个平台、一套标准帮助 多云环境下的企业实现应用管理,大幅提高计算效率,加速...