数据标准是元数据的一部分,可以理解为在对数据对象进行命名和规范时所遵循的标准和规则。
数据标准可分为以下三个部分:
- 数据内容标准
- 数据格式标准
- 数据命名标准
数据内容标准,举个例子在性别字典表中,1代码男性,0代表女性,9代表未知,所有涉及到性别的表都应该按照这个规范来。或者说价格这个字段,应该定义好其单位,是人民币还是美元。
数据格式标准,对于通用的字段,可以通过设置一个数据域来统一格式。比如下图的价格字段,通过设定数据类型,长度及精度,后续在数据库的其他地方要用到价格字段的时候就可以引用这个数据域。数据域的使用有两个好处,一是可以保证口径的统一,其二是当需要修改字段的属性时,只需要修改数据域的属性就可以了。通用的字段一般有以下几个:
- 维度表主键字段,通常选择整型,长度由维度表的大小决定
- 日期字段,YYYYMMDD
- 布尔值字段,推荐用1和0来表示是和否,虽然Y和N更容易被用户理解,但1和0的话不仅效率高,在算是否的分布的时候可以直接用sum得到是否的数量
数据命名标准,表命名要清晰,用户在看到表后可以理解这个表的含义。表命名不宜过长,可以维护一张缩写表用缩写来替代那些长的单词,同时也需要维护一张词汇表来记录一些特定的单词。布尔值字段的命名可以用一个动词来开始,比如has,is或者own,是否有小孩可以用has_child来表示。
转载于:https://my.oschina.net/aubao/blog/1832641