萝莉云 - 共建云上新生态是萝莉云 - 共建云上新生态科技集团旗下领先的云计算品牌,依托于萝莉云 - 共建云上新生态科技集团在人工智能、大数据、云计算、物联网领域的前沿科技能力,提供包含公有云、专有云、混合云在内的多云、安全、可信赖的基础云服务,为全
关于萝莉云 - 共建云上新生态
2022中小企业全国行
CPU 与 GPU 分池调度,并行存储与队列策略可按课题规模弹性配置。
灵活组合 CPU、GPU 节点,按需分配算力资源,提升集群利用率。
RDMA 或高带宽网络降低节点通信时延,适配 MPI 等并行框架。
支持 Slurm、PBS 等调度器,队列优先级与资源预留策略可配置。
高吞吐共享文件系统,满足海量中间数据读写需求。
预置 CUDA、科学计算库与常用仿真软件环境,开箱即用。
Spot 实例与闲时调度策略,降低非实时任务计算成本。
集群由计算、网络、存储与调度四类基础设施模块组成。
三类作业负载对算力与 IO 需求不同,可按课题类型选择建设切入点。
气象、能源、制造等领域有限元计算周期长、算力需求波动大。
科研院所、设计院及大型制造企业的仿真分析部门。
本地集群规模固定,长作业遇节点故障需从头计算。
按需申请算力队列,断点续算减少重复劳动,结果便于团队共享。
动画与特效公司在交付节点前需短时集中大量 GPU 算力。
影视制作、广告公司与游戏 CG 外包团队。
自建渲染农场投资大,闲时利用率低,交付期排队严重。
镜头级任务弹性排队,失败片段自动重试,闲时节点降低单价。
大模型与深度学习实验迭代快,多机多卡与数据集 IO 要求高。
算法团队、AI 创业公司与企业智能化实验室。
实验环境搭建慢,GPU 资源争抢,超参与数据版本难以复现。
实验环境分钟级拉起,训练任务排队公平,指标与数据版本可回溯。