解决方案

以客户为中心,提供定制化或一站式的全栈解决方案,赋能千行百业

人工智能管理平台解决方案
方案介绍

针对客户的需求及现状,推荐学校采用艾克斯特人工智能管理平台PLStack,该平台是集深度学习模型训练推理、项目工程管理、资源集群调度于一体的人工智能管理平台。平台采用分布式存储,构建高效的资源、集群管理分配机制,支持GPU芯片和任务的管理与并行调度,为深度学习技术的研发和应用提供从模型训练、模型评估、服务部署到模型推理的链式云端托管服务。PLStack平台由管理视图和业务视图两个视图组成,管理视图为平台管理员视图,包括集群管理、项目管理、用户管理、配置管理、代理管理等五个模块,业务视图为普通用户视图,包括资源总览、我的项目、数据管理、工作空间、模型训练、模型管理、产品生产、镜像管理等八个模块,如下图所示:

方案解析

艾克斯特力推的高性能集群是专门为满足大规模分析计算而设计的超级并行计算机集群系统,它遵循Intel开放的HPC生态体系架构来系统地部署所有的软硬件:既可以采用基于Intel安腾处理器的小型机系统为计算结点、也可以采用Intel基于酷睿架构的双路Xeon和多路Xeon作为计算节点。


艾克斯特高性能计算中心采用集群体系结构,通过标准开放的高速网络实现互连,运行开放源代码的Linux系统,对外提供单一系统接口,它针对大规模科学并行计算设计,兼顾事务处理和网络信息服务。简单的,我们可以将宝德高性能计算中心简单分解为如下系列模块以作示例:

方案优势
  • 低成本

    支持GPU、CPU资源综合调用与复用,提高资源的应用效率;

  • 低风险

    数据、模型、用户、项目统一管理,降低安全隐患;

  • 高效研发

    平台支持用户定制深度学习研发环境,生成可分享的镜像,减少环境配置时间,同时支持分布式深度学习网络模型训练与推理,增加深度学习研发效率