Hablemos del almacén dian (1) -¿Qué es el almacén dian?
Una breve discusión sobre el inventario de almacén (2): inventario de almacén tradicional e inventario de almacén de Internet
Una breve discusión sobre el inventario de almacén (3): estructura del sistema de inventario de almacén
Una breve discusión sobre el almacén de datos (4): diccionario de índice
Hable sobre el almacén de datos (5): la dimensión más importante de la dimensión de fecha.
Una breve discusión sobre el almacén digital (6) - Acerca de las convenciones de nomenclatura
Una breve discusión sobre el almacén de datos (7) - Sobre la gobernanza de datos
Una breve discusión en el almacén de inventario (8)——Acerca del incremento
Hablar sobre varios almacenes (9) -Acuerdos ascendentes y descendentes
Hablar sobre el número de almacenes (10) -Notas de tareas
En otras palabras, no habría un círculo cuadrado sin reglas. Al construir una plataforma de datos, dentro del grupo de datos, primero debemos formular varias especificaciones, cuanto antes mejor, y monitorear constantemente si todos las implementan según lo acordado. Una vez que a todos se les permita jugar libremente, la unificación o reconstrucción posterior desperdiciará mucha mano de obra y tiempo. Recuerde, todos estos son obstáculos.
A continuación se comparten algunas experiencias de mi empresa actual.
Por convención, la estructura de varios almacenes se desarrolla basándose en el modelo jerárquico de varios almacenes. Algunas se estratificarán según líneas de negocio, se reestratificarán según sus respectivas líneas de negocio y se desarrollarán por separado.
Utilizo MaxCompute de Alibaba Cloud, que es una plataforma de datos y un entorno de desarrollo completo proporcionado por Alibaba. Es muy cómodo de usar y le ahorra la molestia de crear su propia plataforma. Existe un concepto de proyecto en MaxCompute. En un principio se planeó crear proyectos directamente según el diseño del modelo jerárquico, pero por alguna razón se cambió para crear proyectos según líneas de negocio. Hay que pensar en un buen nombre para este proyecto. Sea lo que sea para lo que diseñemos, debemos pensar detenidamente en ello y comprenderlo. Una vez que tomamos una decisión, no debe ni puede cambiarse.
Olvidé si se llamaba "Etimología", así que lo escribí primero y luego encontré este libro para confirmarlo. La etimología pertenece a las especificaciones en la construcción de almacenes de datos y pertenece a la categoría de gestión de metadatos. Oh, ahora todo esto es parte de la gobernanza de datos.
Normalmente, la construcción completa de un almacén de datos incluye la gestión de datos, pero ahora, cuando se trata de modelado de almacenes de datos, se trata más de especificación y gestión de datos.
Hablemos primero de nuestro protagonista: la etimología.
Cuando aprendemos inglés, ya deberíamos conocer la raíz de la palabra. Esta palabra es la más simple y granular. Lo utilizamos principalmente para estandarizar la relación cartográfica entre chino e inglés. Parte del negocio de nuestra empresa son las estanterías. El nombre en inglés es rack. Rack es una raíz, por lo que deberíamos llamarlo rack en todas las tablas y campos, y nada más. Esta es la función de las palabras raíz, que se utilizan para unificar nombres y expresar un mismo significado.
Hay muchos indicadores de "tasa" en el sistema de indicadores, que se pueden descomponer en tasa XXX, y la tasa se puede llamar tasa, por lo que todos nuestros indicadores se llaman tasa XXX.
La raíz se puede utilizar para unificar nombres de tablas, nombres de campos, nombres de dominios de materias, etc.
El nombre de una tabla debe ser conocido por su nombre. Puede saber qué dominio empresarial es, por qué se utiliza y qué datos granulares son.
Al crear la tabla intermedia, agréguela. Si desea conservar la tabla intermedia histórica, puede agregar una fecha o marca de tiempo.
Los indicadores también se nombran con referencia a la raíz para evitar indicadores idénticos. Hay 10 formas de nombrar a 10 personas.
Se deben formular operaciones específicas lo antes posible en función de la situación real de la empresa.
El archivo adjunto es un ejemplo de nuestras especificaciones anteriores sobre Ali DataWorks.