《云计算和大数据重点专项2024项目申报指南-国家科技部.docx》由会员分享,可在线阅读,更多相关《云计算和大数据重点专项2024项目申报指南-国家科技部.docx(12页珍藏版)》请在优知文库上搜索。
1、附件7“云计算和大数据”重点专项2024年度项目申报指南依据国家中长期科学和技术发展规划纲要(2024-2025年)、关于促进云计算创新发展,培育信息产业新业态的看法、国务院关于印发促进大数据发展行动纲要的通知等文件,科技部会同相关部门组织开展了云计算和大数据重点专项实施方案编制工作,在此基础上启动“云计算和大数据重点专项”2024年度项目,并发布本指南。云计算和大数据专项总体目标是:形成自主可控的云计算和大数据系统解决方案、技术体系和标准规范;在云计算与大数据的重大设备、核心软件、支撑平台等方面突破一批关键技术;基本形成以自主云计算与大数据骨干企业为主体的产业生态体系和具有全球竞争优势的云计
2、算与大数据产业集群;提升资源汇聚、数据收集、存储管理、分析挖掘、平安保障、按需服务等实力,实现核心关键技术自主可控,促进我国云计算和大数据技术的探讨与应用达到国际领先水平,加快建成信息强国。专项围绕云计算和大数据基础设施、基于云模式和数据驱动的新型软件、大数据分析应用与类人智能、云端融合的感知认知与人机交互4个创新链(技术方向)部署31项探讨任务,专项实施周期为2024年-2025年。根据分步实施、重点突出原则,2024年首批在4个技术方向启动12个任务。针对任务中的探讨内容,以项目为单位进行整体申报,探讨内容需覆盖相应指南方向的全部考核指标。项目设1名项目负责人,项目下设课题数原则上不超过5
3、个,每个课题设1名课题负责人,每个课题牵头单位及参加单位原则上不超过5个。1 .云计算和大数据基础设施1.1 软件定义的云计算基础理论和方法(前沿基础类)探讨内容:软件定义的云计算基础理论;能效优化的分布存储和处理的硬件及软件系统架构;大数据的困难性、可计算性与云平台处理效率的关系;混合云中面对软件定义的虚拟专用云的动态构建理论与方法以及应用运行机理;资源聚合与解耦的模型与构建方法;软件定义云平台的可用性、可审计性等度量与测评方法;软件定义的云计算原型系统。考核指标:建立软件定义的云计算基础理论,设计一组有效的模型与方法并在云计算原型系统中予以验证;形成软件定义云计算的可用性、可审计性与性能的
4、度量模型与评测方法;形成一批高水平、有国际高影响力的成果;形成一组软件定义的云计算相关规范和标准(送审稿)。支持年限:不超过5年。拟支持项目数:12项。1.2 新型大数据存储技术与平台(共性关键技术类)探讨内容:大数据环境下基于新型存储器件的存储体系架构及限制方法,以及与之对应的长久内存管理和数据组织方法。在此基础上形成基于非易失存储器件的新设备、驱动软件、专用高效长久内存管理和文件系统;异构存储介质高效融合的高并发低延迟的万亿文件级大数据存储系统;新型数据冗余技术,数据冗余的高效转化与高效重构技术;数据保存50年以上的方法和技术,以保障信息不丢失、能再现;大数据存储系统的评估理论、方法及其工
5、具软件。考核指标:(1)研制有自主学问产权的高速低耗存储限制器及设备、驱动软件、专用高效长久内存管理和文件系统;容量型设备容量NlOTB,性能型设备IOPS100万、带宽210GBs,能耗最低可达K)瓦/TB;节点内可扩展;(2)系统支持多存储介质设备异构融合,支持高密低耗、系列化的存储节点,节点容量达PB级;(3)系统支持万亿文件;在万级并发访问下,巨量小文件平均访问延迟低于Ioms;(4)在EB级大数据场景下应用于1-3个典型领域;(5)申请一批本事域的学问产权。支持年限:不超过4年。拟支持项目数:1-2项。1.3 基于数据流的大数据分析系统(共性关键技术类)探讨内容:探讨用于大数据分析的
6、数据流加速器系统,包括数据流加速器硬件、数据流编程模型及优化编译器以及运行时系统等。(1)数据流加速器硬件;(2)面对数据流加速器的编程模型及优化编译器,提出能充分发挥数据流在并行性和同步方面的优势的编程模型;探讨数据流的无编程动态模型定制与生成方法;(3)面对数据流加速器的运行时系统,包括加速器资源的安排与回收、动态重构、通信管理、内存管理等,支持基于数据流编程模型的在线计算和实时计算;支持对基于不同硬件架构的异构计算资源的统一抽象和一样高效管理;(4)数据流处理分析的可视化展示和监控管理工具。考核指标:(1)在加速器上完成不少于三个典型大数据应用的加速;在不少于5个领域进行胜利应用示范;(
7、2)在典型大数据应用上的性能功耗比是通用CPU平台的10倍以上;(3)单块加速器卡上内存不少于256GB,单台服务器可支持4块加速卡,加速器之间可以高速互连,互连理论带宽NloOGbps,实测带宽80Gbps;(4)系统可通过多机互连扩展,可处理PB量级的大数据;(5)针对高并发的数据流实时分析,单物理节点(一般PC服务器)流式数据处理吞吐量不小于3万笔/秒,集群数据处理吞吐量不小于100万笔/秒,单笔恳求处理平均延时小于10毫秒。支持年限:不超过3年。拟支持项目数:1-2项。1.4 面对云计算的网络化操作系统(共性关键技术类)探讨内容:软件定义的新一代ICT系统体系结构,重新界定软硬件的功能
8、划分以及面对应用的配置方法与机制;超大规模资源管理和调度核心技术和基础平台;研制新一代云操作系统、云组件、数据中心操作系统等基础核心软件;探讨硬件元素管理的合理粒度并供应应用编程接口,通过软件方式实现高效资源整合、调度、自适应与自动化协同;突破支撑大规模数据处理、内存计算、科学计算等具有海量资源需求的巨型虚拟机支撑方法,支持新型异构设备的巨型虚拟机;探讨基于容器的虚拟化方法,在提升效率的同时显著提升容器的隔离性;探讨面对领域需求的快速领域虚拟机定制方法,建立领域虚拟化组件库,集成面对领域的虚拟机仓库;探讨管理敏捷性、能耗和性能损耗之间的合理平衡,降低软件定义系统的困难性和故障率,通过软件管理降
9、低系统能耗,探讨评估理论、方法及其工具软件。考核指标:研发具有自主学问产权的网络化操作系统;显著提升现有虚拟化方法的资源整合实力与管理效率,云系统整体资源利用率比现有世界先进水平提高1倍;支持包括FPGA、GPU、RDMA与非易失内存等设备虚拟化,单个巨型虚拟机支持各类内存超过2TB,虚拟处理核数目超过500个,性能相对当前主流虚拟化平台提升30%以上;建立面对专业领域的虚拟机示范仓库,支撑不少于5个领域的应用,可定制的虚拟机类型超过100种;研发新一代云计算核心软件,形成软件定义的技术体系、方法、工具、环境和最佳实践,初步形成支持软件定义的一体化硬件架构、基础软件,并在2个或者2个以上的重点
10、领域进行应用验证与推广。支持年限:不超过4年。拟支持项目数:12项。1.5 面对特定领域的大数据管理系统(共性关键技术类)探讨内容:支持典型应用场景的开放架构大数据管理系统的设计,以及大数据管理系统标准和规范、系统评测基准的研制;面对关系数据、图数据、键-值对数据、非结构化数据等不同数据模型的大数据管理关键技术探讨与相应大数据管理系统研制;数据驱动的大数据管理系统的监控、运维与调优工具研制。考核指标:设计开放式架构大数据管理系统架构,形成大数据管理系统的系列国家标准和规范,提出针对至少3种数据模型的大数据管理系统评测基准和测试工具。研制针对不同数据模型的具备高扩展性、高可用性、高性能的数据管理
11、系统及其关键技术,在基准测试上的指标与国际主流产品可比。研制大数据应用所急需的、可独立部署的系统管理工具不少于5个。开展2-3个示范应用,数据规模达到EB级别。申请一批本事域的学问产权。支持年限:不超过3年。拟支持项目数:13项。2 .基于云模式和数据驱动的新型软件2.1 基于大数据的软件智能开发方法和环境(共性关键技术类)探讨内容:探讨软件开发相关大数据的收集、整理、存储、检索等关键技术;围绕学问获得、管理和利用形成学问驱动的软件开发方法,提升传统软件工具的学问处理机制,为软件建模、编码、程序理解、测试等工具建立起基于学问的处理架构,形成学问驱动的功能支撑,为开发人员供应基于问答(QA:Qu
12、estion-Answer)的开发环境,面对特定领域建立软件学问图谱,实现基于大数据的软件智能开发环境。考核指标:产出基于大数据的软件智能开发关键模型、算法、技术、工具和系统,形成PB级的软件工程大数据资源,问答系统覆盖10个领域或行业的软件开发,问题回答性能与效果均优于通用中文搜寻引擎,在5个大型软件企业进行应用推广,申请一批本事域的学问产权。支持年限:不超过3年。拟支持项目数:1-2项。3 .大数据分析应用与类人智能3.1 大数据学问工程基础理论及其应用探讨(前沿基础类+共性关键技术类)探讨内容:针对大数据异构、自治、困难、演化的网络环境,探讨多源、动态、异质碎片化学问/学问簇的表示模型与
13、在线挖掘方法,揭示碎片化学问的时空特性和演化机理;探讨碎片化学问间语义关联与涌现特性,探寻其动态挖掘与拓扑融合机理;设计多粒度情景感知与学问寻径模型,探讨交互式特性化服务的学问适配机理。考核指标:建立大数据学问工程基础理论,针对目前大数据向大学问转化过程中困惑人们的难题,设计出一组有效的算法并在实际应用中得到验证;探讨和形成利用海量、低质碎片化学问构建新型多通道学问服务平台的方法学体系,在此基础上融合10个以上领域的碎片化学问,建立PB级别的网上学问服务中心;选择既能体现国家重大需求又具有学问密集型应用特点的应用领域(如普适医疗、远程教化、互联网创业等),开展示范应用,用户规模超过100万人。
14、支持年限:不超过5年。拟支持项目数:12项。3.2 面对大范围场景透彻感知的视觉大数据智能分析关键技术(共性关键技术类)探讨内容:从个体、群体和场景三个方面探讨大范围场景视觉感知大数据的智能分析关键技术。在个体信息感知方面探讨多模态高通量生物特征获得与身份识别技术、个体属性特征与动作行为识别技术、行人重识别技术;在群体信息感知方面探讨人群流量监测与人群密度估计技术、群体行为理解和群体事务检测技术;在场景信息感知方面探讨大范围场景的视觉语义建模、困难事务的演化分析、视觉对象的时空定位与搜寻、跨场景数据关联技术等。考核指标:实现十万到百万级以上视觉感知终端的图像视频大数据智能分析;远距离获得和分析
15、虹膜、人脸、步态等多模态生物特征,个体身份识别精度98%,个体属性特征和行为识别精度90%,行人重识别精度90%;人群流量监测和人群密度估计误差10%,群体行为理解和群体事务检测的精确率90%;困难事务演化分析的精确率85%,视觉对象位置信息分析和预料的误差3米,视觉对象检索精确率90%。支持年限:不超过4年。拟支持项目数:12项。3.3 跨时空多源异构数据的融合、开放共享技术与平台(共性关键技术类)探讨内容:探讨非完整、非一样、非精确、跨时空多源异构数据的精准采集和清洗、异构数据的结构化描述和语义协同、以人为中心的多源信息感知融合与理解、数据程序化交易及其在线监管等关键技术;研制大数据开放共
16、享技术与平台,满意省部级政府以及大型企业数据的采集、清洗、分析、服务、交易、监管的功能、性能、时间、成本、风险等需求。考核指标:可实时采集数据库封闭、文档源码缺失、原开发团队缺位、第三方商业构件依靠等状况下的Web应用、移动应用、PC应用中的业务数据,数据可采集比例不低于90%,人力成本缩减10倍以上;在主流x86服务器单节点配置下,开放共享平台的业务数据(不含音视频)日开采量达TB级,支持万级用户并发访问;在100O个以上的政府和央企真实业务系统示范应用;形成多源异构数据的融合与智能服务相关技术规范和标准(送审稿)5项以上。支持年限:不超过4年。拟支持项目数:1-2项。4 .云端融合的感知认知与人机交互4.1 人机交互自然性的计算原理(前沿基础类)探讨内容:探讨自然交互的基础计算理论,探讨面对连续、不确定人体