《JR_T 0303-2024 投资研究时序数据参考模型.docx》由会员分享,可在线阅读,更多相关《JR_T 0303-2024 投资研究时序数据参考模型.docx(36页珍藏版)》请在优知文库上搜索。
1、ICS03.060CSSA11JR中华人民共和国金融行业标准JR/T03032024投资研究时序数据参考模型Investmentanalysistimeseriesdatareferencemodel2024-04-23发布2024-04-23实施中国证券监督管理委员会发布目次前言I引言III1 范围12 规范性引用文件13 术语和定义14 投资研究主数据类别24.1 主数据对象24.2 主数据实体24.3 主数据参考信息25 投资研究主数据表清单及逻辑模型图26 投资研究主数据逻辑模型数据表详细设计36.1 概述36.2 数据表详细设计37维度表达标准化设计方案117.1 概述117.2 维
2、度类型编码(主数据)规范127.3 通用维度码值规范128投资研窕时序数据指标标准模型设计方案168.1 标准化模型设计168.2 标准化模型表说明179通用指标模型ET1.作业的设计方法209.1 方法概述209.2 通用指标配置模型详述219.3 ET1.作业步骤简述249.4 模型验证24附录A(资料性)投资研究主数据逻辑模型示例图25附录B(资料性)投资研究主数据逻辑模型应用场景268.1 场景一数据表意消歧268.2 场景二指标表达标准化268.3 场景三数据智能应用27参考文献29本文件按照GBzT1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。本文件由
3、全国金融标准化技术委员会证券分技术委员会(SAC/TC180/SC4)提出。本文件由全国金融标准化技术委员会(SAOTC180)归口。本文件起草单位:嘉实基金管理有限公司、上证所信息网络有限公司、中证信息技术服务有限责任公司、银华基金管理股份有限公司、中国国际金融股份有限公司、中信证券股份有限公司、中国人寿资产管理有限公司、资本市场学院。木文件主要起草人:刘志明、杨竞霜、田玉双、蔡楚煌、路一、彭乔、刘瀚月、张若海、李珊珊、高贵中。投资研究是金融领域的重要环节,其涉及的数据范围之广、专业程度之深、数据非标准化程度之高,已成为阻碍数据治理与流通快速发展的影响因素。当前投资研究领域的数据化程度相对较
4、低,数据形态多样,机构内及机构间数据交换频繁、业务发展迅速。由于行业内缺乏数据流通标准,导致重复建设、加工数据采集和标准化程序,造成了多对多的更杂、低效的投研数据生产和传输模式。本文件专注于投资研究中使用频率最高的一类数据:时间序列数据,简称时序数据。通过对投资研究主数据分类,汇总归纳生成主数据清单及主数据逻辑模型图,同时结合主数据维度表达标准化设计方案,形成投资研究时序数据指标,基于此指标形成一套容易生产、便于流通的行业数据模型框架。该模型对于规范行业数据语言、推进行业数据治理、辅助行业监管科技建设等都具有十分重要的意义。投资研究时序数据参考模型1范围本文件专注于投资研究过程中使用频率最高的
5、时序数据,对投资研究主数据进行了分类,同时设计了主数据维度表达标准化方案,生成了一套容易生产、便于流通的时序数据指标参考模型框架。本文件适用于金融机构在投资研究场景中的指标数据抽象模型建设及投研数据交互工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T2260中华人民共和国行政区划代码GB/T2659.1世界各国和地区及其行政区划名称代码第1部分:国家和地区代码GB/T21076证券及相关金融工具国际证券识别编码体系GB/T3607
6、3数据管理能力成熟度评估模型JR/T0020上市公司分类与代码JR/T0176.1证券期货业数据模型第1部分:抽象模型设计方法JR/T0176.3证券期货业数据模型第3部分:证券公司逻辑模型JR/T0176.4证券期货业数据模型第4部分:基金公司逻辑模型IS04217Currencycodes3术语和定义下列术语和定义适用于本文件。tireseriesdata时间序列数据按时间顺序记录的数据列。3.2主数据masterdata组织中需要跨系统、跨部门进行共享的核心业务实体数据。来源:GB/T360733.3维度dimension描述性属性或特征。实体entity参与金融和经济生产活动的对象。3
7、.5指标indicator从数据中提取出来的特定的数值或统计量。4投资研究主数据类别4.1 主数据对象对投资研究主数据的对象进行约定及描述,同时对主数据的属性、不同主数据之间可能的关系进行约定及描述,是逻辑模型的核心内容。4.2 主数据实体对投资研究主数据的具体实体进行枚举、编码、定义与描述。例如地域主数据对应的地域主数据实体表,详细列示了所有国家、省州、市、区县等地域行政单位,并进行编码和层级关系描述。4.3 主数据叁考信息用在描述主数据实体的信息当中。对于范围与取值稳定且需要编码管理的非研究对象类信息,归纳为参考信息。例如交易所信息、主数据实体层级信息、机构类型信息等。5投资研究主数据表清
8、单及逻辑模型图根据JR/T0176.1抽象模型设计方法,通过对投资研究主数据逻辑模型的数据分类汇总归纳,形成的投资研究主数据表清单,见表1。1投资研究主数据表清单序号类别表名表释义主数据对象MDB.DEFINE主数据对象定义2主数据对象MDB_DEFINE_ATTR主数据属性表3主数据对象MDB_DEFINE_RE1.A关系定义表4主数据实体MDB_ENTITY_RE1.A实体关系表5主数据实体MDB_ENTITY_PROD_C1.S_ATTR产品分类属性表6主数据实体MDB_ENTITY_PROD_PROP产品属性值表7主数据实体MDB_ENTITY_DICT主数据别名表8主数据实体MDB_
9、ENTITY_INST机构主表9主数据实体MDB_ENTITY_SECURITY证券主表10主数据实体VDB_ENTITY_INDUSTRY行业主表11主数据实体MDB_ENTlTY.REGION地域主表12主数据实体MDB_ENTITY_PERSON人物主表13主数据实体MDB_ENTlTY.CONCEPT市场概念主表表1投资研究主数据表清单(续)序号类别表名表释义14主数据实体MDB_ENTITY_PROD产品主表15主数据实体MDB_ENTITY_PROD_C1.S产品分类主表16主数据实体MDB_ENTITY_COMMON通用实体主表17主数据参考信息REF_STANDARD_SRC数
10、据源参考表18主数据参考信息REF_INST_TYPE机构类型参考表19主数据参考信息REFJEVE1.实体层级参考表20主数据参考信息REF_EXCHANGE交易所参考表根据不f投资研究主数据逻辑模型的数据分类,形成逻辑模型图。投资研究主数据逻辑模型例图见附录A图A.1,其相关数据表的详细设计内容见第6章。6投资研究主数据逻辑模型数据表详细设计6.1 侬根据JR/T0176.3,通过梳理投资研究主数据逻辑模型的每个数据分类,分析整合形成出符合该分类定义范围的数据表信息,再对每个数据表进行细化设计,从而形成一套完整且适用于投资研究框架的实用性比较强的数据表结构。数据表之间通过相互关联,最终构成
11、投资研究主数据逻辑模型的主体部分。在投资研究主数据逻辑模型中,重要的数据主要为主数据定义与描述信息和主数据实体信息中的数据,该部分的数据表详细内容见6.1-6.16。其中,6.16.2所涉及的表可划分为数据模型的定义表,6.36.9涉及的表可被统称为业务表,6. 106.14所涉及的表为产品主表系列,产品数据在实际生活中品类繁多、内容更为丰富,每一品类具备其单独属性。但在下游日常的业务场景中,或者实际开发流程中,往往会统一调用。故针对产品主数据,我们未将其按不同的类别抽象成一个个独立的业务表,而是采用同一套数据模型进行维护,方便下游调用。6.2 数据表详细设计6.2.1 MDB.DEFINE定
12、义表表2用于管理主数据,如新增业务、项目为主数据,更新已有内容。故在表2中需要维护主数据基本信息,如名称、业务描述、业务表名等信息,有统领主数据体系的作用,便于后续业务的查询.某一项主数据既可以作为业务本身,也可以作为描述其他业务的一个维度(或属性),如“地域”,既可以单独研究某一省市的地理、环境特征,也可以用来描述公司注册地、办公地。“地域”与“公司”皆被定义为主数据。2MDB.DEFINE领据知R定54表序号英文字段中文字段字段类型业务主键HCODE内部编码,英文,具备可读性varchar(20)2PAREN1.HCODE上级编码varchar(20表2MDB_DEFINE主数据对象定义表
13、(续)序号英文字段中文字段字段类型业务主键3PARENT_HCODES祖先节点代码json4ENnTYTAB1.E_NAME所在业务表varchar(50)5NAME主数据中文varchar(50)6ENAME主数据英文Varchar(100)7ABBR用于生成下游业务表HCoDE的前缀varchar(10)一一8DESC具体描述varchar(5009Fl1.TER_SQ1.过滤条件varchar(20010SRC主要数据来源varchar(100)注:主数据存在父子层级关系,如国家与省、直辖市。可以使用PAREN1.KODE、FI1.TER_SQ1.维护,PARENTJCODES便于程序使
14、用。FI1.TERSQ1.维护方式包括WHERE和具体筛选条件。6.22MDI1.DEFlNE_ATTRKrt01性豪表3用于记录某一主数据具备的属性,如证券主数据需要有全称、简称、上市场所、上市日期等信息;地域需要维护中文名称、英文名称等内容。表3MDB_DEFINE_ATTR主数据属性表序号英文字段中文字段字段类型业务主键DEF_HCODE内部编码varchar(20V2KEY字段英文名,主数据的属性varchar(20)V3NAME字段中文名,主数据的属性varchar(50)4DESC描述信息varchar(2005VA1.UE_TYPE数据类型varchar(50)6ORDER排序int(ll)7IS_S1IOW_NAME是否展示名称tinyint(1)6.2.3 MDB_DEFINE_RE1.A关系定义表表4用于定义主数据之间的关系,如行业与证券的关系,公司与品牌的关系。知MDB_DEFINE_RE1.A关表序号英文字段中文字段字段类型业务主键