《云计算和大数据重点专项2024年度.docx》由会员分享,可在线阅读,更多相关《云计算和大数据重点专项2024年度.docx(17页珍藏版)》请在优知文库上搜索。
1、“云计算和大数据”重点专项2024年度项目申报指南为落实国家中长期科学和技术发展规划纲要(2024-2025年),以及国务院关于促进云计算创新发展,培育信息产业新业态的看法和关于印发促进大数据发展行动纲要的通知等提出的任务,国家重点研发安排启动实施“云计算和大数据”重点专项。依据本重点专项实施方案的部署,现提出2024年度项目申报指南建议。本重点专项总体目标是:形成自主可控的云计算和大数据系统解决方案、技术体系和标准规范;在云计算与大数据的重大设备、核心软件、支撑平台等方面突破一批关键技术;基本形成以自主云计算与大数据骨干企业为主体的产业生态体系和具有全球竞争优势的云计算与大数据产业集群;提升
2、资源汇聚、数据收集、存储管理、分析挖掘、平安保障、按需服务等实力,实现核心关键技术自主可控。本重点专项依据云计算和大数据基础设施、基于云模式和数据驱动的新型软件、大数据分析应用与类人智能、云端融合的感知认知与人机交互等4个创新链(技术方向),共部署20个重点探讨任务。专项实施周期为5年(20242024)。1 .云计算和大数据基础设施1.1 数据科学的若干基础理论(基础探讨类)探讨内容:探讨大数据的数据建模理论,包括大数据的统一表示和有效度量等;探讨大数据的新型计算困难性理论,包括多项式可计算问题类的细分等;探讨高通量计算理论与算法、高效并行计算算法、分布式计算算法、近似计算算法等;探讨大规模
3、分布式可扩展的数据存储与组织,能效优化的分布存储和处理的系统架构,以及数据副本一样性、数据压缩、数据划分与迁移等问题;探讨大数据的数据治理理论与方法,包括数据质量管理、数据权属、数据隐私爱护等。考核指标:形成有国际性影响的数据科学理论体系,发表系列高水平学术论文和若干专著。在关键技术上申请系列专利,形成专利群。1.2 基于NVM的TB级长久性内存存储系统及应用(共性关键技术类)探讨内容:探讨长久性内存存储I/O栈与存储管理;分布式长久性内存文件系统;基于RDMA的分布式长久性共享内存新型编程模型;构建分布式长久性内存存储系统;研制基于TB级内存系统的典型大数据应用系统及示范。考核指标:研制不少
4、于8节点的内存存储系统,每节点包含TB级非易失性的长久性内存。分布式内存系统中节点间通信延迟不超过Ius,高负载通信延迟不超过IOus,带宽可扩展,8节点带宽不低于40GB/S。支持长久性内存的一样性,支持分布式长久共享内存的新型编程模型接口。支持长久化键值存储系统、高性能大图数据处理等典型大数据应用,读操作OPS不低于5000万s,写操作OPS不低于1000万/s。1.3 面对异构体系结构的高性能分布式数据分析系统(共性关键技术类)探讨内容:面对分布式异构体系结构,探讨基于数据流的编程模型、性能建模技术、同步通信技术和运行时系统,并实现高通量视频、机器学习典型等应用示范。详细内容:支持异构体
5、系结构上的数据流编程模型与软件工具链;异构体系结构上的运行时系统,支持CPU与加速器之间的高效率混合执行,支持加速器上的细粒度流水线并行;性能建模技术和优化调度技术,优化安排CPU与加速器上的运行资源;分布式异构系统数据处理技术,包括数据与计算的高效划分技术、负载平衡以及高性能同步通信技术。考核指标:支持CPU-GPU异构体系结构,并支持单机多加速器和多机多加速器。性能建模技术可自动选取优化的执行模式,包括仅在CPU上执行、仅在加速器上执行以及在CPU和加速器上混合执行,并可给出混合执行时在CPU和GPU上执行的比例。支持单个GPUSM上部署多个kernel的细粒度任务调度,以及以此为基础的流
6、水线并行模式。单机上CPU/GPU细粒度混合执行的应用性能是通用CPU的5倍以上,是仅实现粗粒度并行性的GPU的2倍以上。在8台服务器16块GPU的环境下,应用性能是8台CPU服务器的5倍以上,是仅实现粗粒度并行性的16块GPU性能的2倍以上。1.4 面对图计算的通用计算机技术与系统(共性关键技术类)探讨内容:图计算众核处理器和异构图计算机体系结构;支撑异构图计算机的系统软件;面对异构图计算机系统的分布式处理技术;基于异构图计算机的数据管理与分析系统;基于异构图计算机的通用计算机系统,开展应用示范。考核指标:研制面对图计算的众核处理器芯片原型;研制基于已有加速器的低功耗异构图计算系统,单节点图
7、计算机总体性能达到G级TEPS,性能功耗比提升10倍;8节点的分布式异构图计算系统总体性能可达10GTEPS,静态图计算可获得2-3倍加速比;单节点支持50亿条边的图数据存储和查询,平均查询响应时间为秒级,支持每秒10万边的图流数据分析;开展包含社交网络在内的2个典型应用的验证开发。1.5 基于国产处理器的新一代虚拟化及虚拟执行环境优化技术(共性关键技术类)探讨内容:探讨基于国产单核、多核、众核处理器的新型虚拟化架构,虚拟计算环境下应用驱动的软件栈构造/设计的理论和方法;探讨基于国产单核、多核、众核处理器等计算系统核心物理资源的虚拟化和容器技术,虚拟资源池的构建、组织、调度等技术;探讨异构硬件
8、的状态互通方法,应用驱动的虚拟资源的动态映射和调配方法,实现面对应用的统一编程接口;探讨基于迭代反馈机制的轻量级虚拟机镜像定制、应用定制的虚拟机优化等方法和技术,构造面对特定应用的轻量级虚拟机;探讨虚拟化和虚拟机的性能评价方法与基准测试、性能调优工具。考核指标:国产处理器虚拟化后的性能指标与X86处理器相当,在关键行业的云计算系统中开展示范应用,在典型云计算应用负载下,较现有产品整机服务实力提升一个数量级,整机资源利用率提升50%,整机性能功耗比提升5倍。在关键技术上申请系列专利,形成专利群。1.6 数据驱动的云数据中心智能管理技术与平台(共性关键技术类)探讨内容:探讨基于计算智能的云计算运行
9、能效评价与预料技术,实现数据驱动的云平台运行精准化评估与预料;数据驱动的大规模云资源智能调度与管理技术,显著提升能效,提高计算资源的利用率;大规模云计算网络资源的智能虚拟化技术,突破云网络资源的利用效率瓶颈;面对大数据应用的智能云工作流管理与调度技术,供应高能效、高服务质量的大数据工作流应用服务;基于云计算的分布式计算智能方法与技术集成,实现大规模的数据管理与智能处理;基于以上技术突破,研发云计算的智能部署、运维管理与服务实力保障技术,搭建云智能管理平台并开展示范应用。考核指标:提出一套智能化的云计算运行能效评估、行为预料、资源调度、网络虚拟、工作流管理与系统运维的关键技术体系;研制的关键技术
10、在基准测试上的指标与国际主流技术或产品相比处于领先行列;云工作流和云服务恳求的接受率提升20%以上,满足用户在时间和成本等多方面的智能化选择需求;面对大数据智能处理需求,基于云平台集成10种以上的分布式计算智能方法;研制的云数据中心智能管理系统在50万台服务器以上规模的云数据中心开展系统的示范应用,整体水平处于国际领先地位;申请系列专利,形成专利群,并制定国家标准(送审稿)若干。2 .基于云模式和数据驱动的新型软件2.1 群智化生态化软件开发方法与环境(基础探讨类)探讨内容:探讨群体才智的形成机理、软件生态系统中的群体协作规律、社区组织模式、社会化特性和最佳实践;探讨软件生态系统的多维度度量和
11、评估方法、软件生态系统形成和演化的微过程模型等;探讨基于大规模群体协同的在线需求获得与建模、软件设计与建模、软件实现与测试等群智软件开发模式与方法;探讨基于开源软件和SaaS服务的可信软件资源管理框架和方法、群体驱动的软件制品搜寻、举荐与合成技术;研制基于群体才智和协同的软件开发、管理和维护支撑工具集及平台,形成支持智能化群体协作的软件开发环境,并在开源社区进行示范应用。考核指标:建立基于群智协作的软件开发理论模型,形成覆盖软件生命全周期的群智软件开发方法、工具、环境和最佳实践,支持单一项目达到数十到数千名开发者规模;形成兼容国际主流、符合中国特色的群智化软件开发生态系统建设方案,在2个云计算
12、和大数据开源社区进行实践与推广,实际应用于10个以上项目合计100O名以上开发者;形成一批具有引领作用的高水平论文成果,申请一批相关领域的学问产权。2.2 基于编程现场大数据的软件智能开发方法和环境(共性关键技术类)探讨内容:探讨跨地域的软件开发觉场的数据实时采集、清洗、组织、管理技术,基于机器学习的程序语义学习及自动生成方法与技术,面对代码质量实时动态检测与质量提升的智能编程技术,面对代码风格与编程规范实时检测与改进的智能人机交互方法与技术,上下文感知的编程接口与代码举荐方法;构建跨地域的软件开发觉场数据库和规范源码样例库,研制基于智能化人机交互协作的软件灵敏开发云平台,在不同规模的软件企业
13、中进行示范应用。考核指标:研制的平台支持1000人以上的软件开发觉场,人机交互协作系统响应时间低于2秒;规范源码样例库覆盖100个项目100O万行代码;在3个以上不同规模软件企业进行示范应用,最大开发人员规模超过1000人,支持10个软件开发项目,每个项目代码量不低于10万行,智能化人机交互协作覆盖70%以上的代码,接口与代码举荐平均精确率超过70%;形成一批具有引领作用的高水平论文成果,申请一批相关领域的学问产权。2.3 面对智能制造的流程管控软件平台(应用示范类)探讨内容:探讨面对智能制造中企业研发设计、生产制造、经营管理、销售服务、供应商管理和客户服务等多种流程的企业内外部系统基础数据获
14、得及加密传输和存储技术、面对关键制造流程的学问建模技术、制造流程大数据实时分析技术、深度网络挖掘和决策技术、实时工业系统闭环限制技术、大规模企业流程并行技术等基于云模式和大数据的新型软件应用关键技术,研制面对智能制造的流程管控软件平台,并进行示范应用。考核指标:供应实证的PB级的制造数据存储,关键企业数据加密效果需经具有平安评测资质的第三方认证;企业业务流程并行规模不少于100OO条;支持10种常见国产和进口工业软件系统90%基础数据的获得;支持10种常见国产和进口生产制造设备系统的秒级调用和按需闭环限制;管控软件平台国产化率达到80%,在10个大型制造企业部署和应用。2.4 私有云环境下服务
15、化智能办公系统平台(应用示范类)探讨内容:针对私有云在办公环境下的广泛应用和多元化需求,探讨适用于私有办公云建设的基础架构、虚拟应用、网络平安、数据存储以及数据分析等多项关键技术。重点探讨计算节点非一样内存访问的动态绑定、虚拟化内存超配、网络数据包零拷贝、虚拟磁盘预读、存储缓存加速等关键技术。探讨私有云环境下网络平安的基础理论与应用,重点探讨平台无关的云平安系统,利用虚拟化技术实现东西向、南北向流量的统一防护。探讨分布式存储的负载均衡、数据削减和分层、高牢靠、异地容灾等关键技术和解决方案。探讨基于办公数据的行为感知技术,重点探讨基于上网行为的数据挖掘技术,用户行为分析技术以及自动化的异样检测技
16、术。考核指标:研制私有云环境下服务化智能办公系统,实现智能办公的行为感知,支持不少于10种行为感知应用,支持新应用的快速开发和部署,在3-5个重要的部门开展示范应用。完成系列国家或行业标准草案,其中若干获国家或行业标准主管部门立项或批准。2.5 云计算和大数据开源社区生态系统(含前期成果集成展示)(应用示范类)探讨内容:探讨开源社区的运作模式和商业模式,研制平安可控的开源项目支撑系统,建立国内外开源项目和社区的按需同步机制,支持企业主导创建开源软硬件项目并建设相应的生态系统;探讨基于众包的软件在线开发方法,建立软件开发学问库和软件工程云;探讨开发一批面对云计算资源虚拟化、分布式管理与调度、存储与计算、监控与运维、云应用开发与部署等方面的开源软件;探讨开发一批涉及大数据采集、存储、传输、分析、计算与应用相关的开源软件,促进大数据技术的完善及在各个领域中的大规模应用;建设有肯定影响力的云计算和大数据开源社区,吸引一批云计算和