img 首页 img 新闻详情

UIT Cloud AI智算平台,助力大模型赋能新质生产力

发布时间:2024-07-11 所属类别:新闻中心

新质生产力是由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生的当代先进生产力,它以劳动者、劳动资料、劳动对象及其优化组合的质变为基本内涵,以全要素生产率提升为核心标志。


新质生产力正成为推动经济增长的新引擎,随着我们步入数字化与智能化时代,通用人工智能(AGI)作为新质生产力的加速器,正发挥着关键作用。以文心一言、通义千问、ChatGLM等为代表的大模型产品,通过不断的迭代更新和日益普及的应用,引领着一场工业革命的新浪潮。这场革命正推动着生产力的转型,从依赖计算能力向利用机器智能转变,并促使经济从网络驱动的数字经济向以数据为核心的智能经济快速迈进。以AI大模型落地实际应用所孕育的新兴生产力,是新质生产力的重要形态。


1.jpg


在利用AI大模型转化为生产力的实际业务场景中,用户往往面临来自各方面的业务需求,实际业务中需要利用多类不同的AI模型来满足差异化的应用需求,例如:基于百亿级规模模型支持RAG、Agent应用的大语言模型、支持模型微调训练的文生图大模型、支持复杂任务处理的多模态大模型等各类服务不同场景的模型服务。


AI&大模型业务应用需求痛点


在AI大模型投入业务服务之前,从训练前的准备工作、训练过程本身、到训练完成后的上线部署,整个流程中存在众多待解决的实际业务挑战。这些问题的存在,影响大模型的迅速部署上线和业务服务的提供。


2.png


算力资源如何有效管理与调用


在底层基础设施层面,海量算力是人工智能的基础,智算中心的建设,建设后算力资源的有效运维、运营也是业务面临的重要挑战。


3.png


UIT Cloud AI智算平台整体架构方案


UIT Cloud AI智算平台是为AI应用服务量身定制的一站式AI算力管理平台,该平台在计算、网络、存储和调度等基础设施能力上进行了全面的强化,有效屏蔽底层异构算力的差异性,解决了AI大规模分布式计算的需求,并实现AI应用从开发、训练到推理的全生命周期管理。为AI应用提供稳定、高效的底层支撑架构,同时为开发者提供完善的开发和训练工具。通过一站式的AI服务平台,助力行业客户有效部署利用私有大模型,快速构建智能应用,帮助企业高效利用算力资源实现降本增效及业务新质生产力转化。


AI智算平台在底层算力基础设施上,部署AI算力管理引擎,实现CPU/GPU的算力灵活调度,服务上层应用。通过AI智算调度系统,支持CPU、GPU等各种异构计算资源,突破传统计算瓶颈,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。调度系统功能覆盖作业任务全周期,提供事前准备、事中调度、事后展示的能力,让用户随时掌握模型的开发、训练、发布情况,有效降低用户在部署、调试、运维等环节的繁琐工作,帮助用户专注于核心业务的开发及运维。


构建在算力调度平台上的AI训推一体化平台,在大模型的持续预训练、精调、评估、压缩和部署等环节提供完善易用的工具链,帮助客户针对自身业务场景快速定制专属大模型。支持Tensorflow、PyTorch等主流开源的AI开发框架,支持在线IDE环境,包括Jupyter、pycharm、vscode交互式建模,方便算法工程师对代码进行调试;同时平台内置多种算法组件,支持通过拖拉拽方式实现可视化建模,极大降低建模门槛。平台提供从数据标注处理、算法开发、模型训练、超参调整、模型管理与部署等环节的全流程支持,结合高性能异构算力底座,加速模型训练速度,有效降低模型训练门槛与训练成本。


4.png


UIT Cloud AI 智算平台亮点优势


异构算力资源池化:对CPU、GPU、AI 芯片等算力资源进行池化整合,支持英伟达、昇腾、曙光等多种异构算力资源,实现资源的集中调度、按需分配,使算力资源可被充分利用并降低碎片概率,提高总体有效算力、降低智算中心购置成本。


算力资源精细化管理:根据 AI 任务的资源需求进行按需供给,契合多样化业务的差异需求。算力池化技术可提供智能算力资源排队的能力,可根据训练任务的重要程度,设置资源使用的优先级。


资源无感动态伸缩:池化技术可通过资源动态分配,为容器动态分配可用资源,上层应用可向算力调度平台申请算力、显存资源,实现资源动态垂直扩展。


算力资源可观测:可视化并监控网络中所有 GPU 服务器的运行状况、利用率、效率和可用性,为加速大模型训推任务提供可视化参考依据。


一站式AI开发平台:提供端到端AI开发平台,支持大规模分布式训练及端-边-云模型按需部署能力,从数据准备到算法开发、模型训练,模型部署一站式完成所有任务。


智能数据标注:提供数据集管理能力,支持数据筛选、标注等数据处理,提供数据集版本管理,特别是深度学习的大数据集,让训练结果可重现。


快速模型训练:支持多种深度学习框架,更高效更易用,大幅提升训练速度。


便捷AI应用构建:基于模型市场中的模型提供微调训练快速构建专属模型;支持图片分类、物体检测、视频分类等业务场景模型的开发和部署,满足不同场景业务需求;支持根据业务场景创建模型,自动调参,自动训练,一键模型部署。


喜报∣bet356体育官方网站成功入选中国信通院“卓信大数据计划”第十二批(2024年首批)成员单位

下一新闻

喜报∣bet356体育官方网站成功入选中国信通院“卓信大数据计划”第十二批(2024年首批)成员单位