¿Cuál es el proceso de digitalización de archivos?

1. Términos y definiciones

1. Digitalización

El proceso de convertir señales analógicas en señales digitales a través de tecnología informática.

2. Digitalización de documentos en papel

Utilizar equipos digitales como escáneres o cámaras digitales para digitalizar documentos en papel y convertirlos en soportes como cintas, discos y discos ópticos. de producir una imagen digital o un texto digital reconocible por computadora.

3. Imagen digital

Una matriz de números enteros que representa una imagen física. Una función de muestreo y cuantificación bidimensional o superior generada a partir de imágenes consecutivas de la misma dimensión. Muestra una función continua en una red matricial (u otra) y minimiza el valor en el punto de muestreo.

4. Imagen binaria en blanco y negro

Una imagen digital con escala de grises únicamente en blanco y negro. Los correspondientes son borradores de texto en blanco y negro, dibujos lineales, etc.

5. Imagen fija de tono continuo

Imagen digital estática compuesta por más de dos niveles de grises o diferentes tonalidades de diferentes canales de color. En el proceso de digitalización de documentos en papel, suele haber dos modos: escaneo en escala de grises y escaneo en color.

6. Solución

El número de puntos o píxeles contenidos en una imagen por unidad de longitud generalmente se expresa en puntos por pulgada (ppp).

7. Deformación

Después de la conversión digital, el grado de desviación en color y geometría entre la imagen digital y el archivo original.

8. Inteligibilidad

Capacidad de las imágenes digitales para proporcionar información a personas o máquinas.

9. Compresión de imágenes

Cualquier proceso de eliminación de redundancia o aproximación de imágenes, cuyo propósito es representar una imagen de una forma más compacta.

2. Requisitos básicos para la digitalización de archivos en papel

1. Principios básicos

El principio básico de la digitalización de archivos en papel es hacer que los recursos de información del archivo sean precisos y convenientes. obtener y compartir rápidamente recursos de información de archivo disponibles públicamente para satisfacer las necesidades sociales de utilización de archivos.

2. Determinar los principios de los objetos digitales.

Los objetos a digitalizar deben confirmarse según ciertos principios y métodos. Sólo se pueden digitalizar archivos en papel que cumplan ciertos requisitos.

1) Cumplir con los principios de las leyes y reglamentos nacionales.

La digitalización de archivos en papel debe cumplir con la normativa nacional sobre apertura de archivos y normativa relacionada.

2) Principio de valor

Pertenece al ámbito del archivo y debe conservarse de forma permanente o durante mucho tiempo. Los archivos con un alto valor de utilización social pueden incluirse en el ámbito de lo digital. tratamiento.

3. Enlaces básicos

Los enlaces básicos de la digitalización de archivos en papel incluyen principalmente: organización de archivos, establecimiento de catalogación, escaneo de archivos, procesamiento de imágenes, almacenamiento de imágenes, inspección de la calidad de los datos, enlace de datos, Aceptación de datos, respaldo de datos, gestión de resultados, etc.

4. Gestión de procesos

1) Es necesario fortalecer el mecanismo de gestión de seguridad y confidencialidad en todos los aspectos de la digitalización de archivos en papel para garantizar la seguridad de los archivos originales y la información del archivo digital.

2) Todos los aspectos de la digitalización de archivos en papel deben registrarse en detalle, compilarse y resumirse de manera oportuna, y deben establecerse registros completos y estandarizados mientras se completa el trabajo de digitalización.

En tercer lugar, organización de archivos

Antes de escanear, los archivos deben organizarse adecuadamente de acuerdo con los siguientes pasos según la situación de administración de archivos y marcarse según sea necesario para garantizar la calidad digital del archivos.

1 Preparación de datos del catálogo

2 Separación

3 Diferenciación de piezas escaneadas y no escaneadas

4 Corte de página

5 Archivado y registro

6 Encuadernación

Cuarto, escaneo de documentos

1, modo de escaneo

1) Según el documento Tamaño de formato (A4, A3, A0, etc.), seleccione un escáner con las especificaciones correspondientes o un escáner profesional (por ejemplo, puede usar el escáner de dibujos No. 0 para dibujos de ingeniería) para escanear. Los documentos de gran formato se pueden escanear usando una plataforma digital de gran formato, o usando un equipo de conversión de película a digital después de la microfilmación, o se pueden unir usando imágenes escaneadas de pequeño formato.

2) Los documentos con papel en malas condiciones, demasiado fino, demasiado blando o demasiado grueso, deben escanearse con una plataforma; los documentos con buen papel se pueden escanear a alta velocidad para mejorar la eficiencia del trabajo.

2. Modo de escaneo en color

1) El modo de escaneo en color generalmente incluye binario en blanco y negro, escala de grises, color, etc. Normalmente se utilizan valores binarios en blanco y negro.

2) Los documentos con páginas en blanco y negro, escritura clara y sin ilustraciones se pueden escanear en modo binario en blanco y negro.

3) Los documentos con páginas en blanco y negro pero con poca claridad de escritura o ilustraciones, y documentos con páginas multicolores se pueden escanear en modo gris.

4) Los documentos con encabezados rojos, sellos, fotografías en blanco y negro, fotografías en color o ilustraciones en color en la página se pueden escanear en modo color según sea necesario.

3. Resolución de escaneo

1) La selección de los parámetros de resolución de escaneo se basa en la premisa de que la imagen escaneada es clara y completa y no afecta el uso de la imagen.

2) Al escanear documentos en modo binario, escala de grises y color en blanco y negro, generalmente se recomienda que la resolución sea ≥100 ppp. En circunstancias especiales, como texto pequeño, texto denso, poca claridad, etc. , la resolución se puede aumentar adecuadamente.

3) Para documentos que requieren reconocimiento de caracteres chinos OCR, se recomienda que la resolución de escaneo sea ≥200 ppp.

4. Registro de escaneo

Rellene con cuidado el formulario de registro de entrega para el proceso de conversión digital de documentos en papel, registre el número de páginas escaneadas y verifique el número real de páginas escaneadas. cada documento y los documentos completados en la cantidad de clasificación de documentos ¿Son consistentes los números de página? Si hay alguna inconsistencia, se deben anotar las razones específicas y los métodos de manejo.

Procesamiento de imágenes verbales (abreviatura de verbo)

1. Inspección de la calidad de los datos de la imagen

1) Verifique la asimetría, claridad y distorsión de la imagen. Si se descubre que no se cumplen los requisitos de calidad de la imagen, se debe reprocesar la imagen.

2) Si el archivo de imagen escaneada está incompleto o no se puede identificar claramente debido a una operación incorrecta, se debe escanear nuevamente.

3) Si falta algún archivo escaneado, escanéelo a tiempo e inserte las imágenes correctamente.

4) Si se descubre que el orden de las imágenes escaneadas no coincide con el archivo original, se debe ajustar a tiempo.

5) Complete cuidadosamente los formularios relevantes y registre los resultados de la inspección de calidad y las opiniones de procesamiento.

2. Corrección, corrección; destilación [industria química]; rectificación [electricidad]; alargamiento [número]

La imagen de desviación debe corregirse para lograr la percepción visual básica de la desviación. Las imágenes con orientación incorrecta deben rotarse y restaurarse para ajustarse a los hábitos de lectura.

3. Purificar

Manchas negras, líneas negras, marcos negros, bordes negros y otras impurezas. Se deben eliminar las impurezas de la página de la imagen que afectan la calidad de la imagen. Durante el procesamiento se debe seguir el principio de mostrar la apariencia original del documento sin afectar su comprensión.

4. Unión de imágenes

Se deben unir y fusionar varias imágenes formadas al escanear documentos de gran formato en diferentes áreas en una imagen completa para garantizar la integridad de la imagen digital del documento. .

5. Recorte de bordes

Las imágenes escaneadas en modo de color deben recortarse para eliminar el exceso de bordes blancos para reducir efectivamente el tamaño de los archivos de imagen y ahorrar espacio de almacenamiento.

Sexto, almacenamiento de imágenes

1. Formato de almacenamiento

1) Los archivos de imágenes escaneados en modo binario en blanco y negro generalmente se almacenan en formato TIFF (G4). Los archivos escaneados en modo gris y en modo color generalmente se almacenan en formato JPEG. La elección de la relación de compresión durante el almacenamiento debe basarse en garantizar la legibilidad de las imágenes escaneadas y minimizar la capacidad de almacenamiento.

2) Proporcione imágenes escaneadas para consultas en la red, que también se pueden guardar como CEB, PDF u otros formatos.

2. Nomenclatura de archivos de imagen

1) Cada documento en la base de datos del directorio de documentos en papel tiene un número de archivo único correspondiente, y el archivo de imagen escaneada del documento recibe su nombre. después de este número de archivo.

2) Los archivos de varias páginas pueden usar este número de archivo para crear las carpetas correspondientes, y los archivos de imagen se pueden nombrar en el orden del número de página.

7. Base de datos del directorio.

1. Selección del formato de datos

Se debe seleccionar un formato de datos común para la construcción de bases de datos de catalogación. El formato de datos elegido debe poder intercambiar datos directa o indirectamente a través de documentos XML.

2. Descripción del archivo

De acuerdo con los requisitos de las "Reglas de descripción de archivos" (DA/T18), se ha establecido una base de datos del catálogo de archivos.

3. Inspección de la calidad de los datos del directorio

Compruebe la calidad de la base de datos del directorio mediante revisión manual o revisión automática de software. Compruebe si los elementos de la descripción están completos y si el contenido de la descripción está estandarizado y es preciso. Si se encuentran datos no calificados, se deben modificar o volver a registrar.

8. Enlace de datos

1. Enlace de resumen

Se confirma que la base de datos del catálogo y la base de datos de imágenes formadas durante la conversión digital de los archivos están "calificadas". inspección de calidad Luego se carga en el servidor de datos a tiempo a través de la red para su resumen. A través de la programación o con la ayuda del software correspondiente, los datos del directorio se pueden buscar automáticamente en busca de imágenes digitales relevantes y se puede agregar la información de la dirección electrónica correspondiente para lograr un enlace rápido y por lotes.

2. Asociación de datos

Según la base de datos del catálogo de documentos en papel, una o más imágenes escaneadas de cada documento en papel se almacenan como archivos de imagen. Al almacenar archivos de imagen en la carpeta correspondiente, debe verificar cuidadosamente si el nombre de cada archivo de imagen es el mismo que el número de archivo en la base de datos del directorio de archivos, si el número de página del archivo de imagen es el mismo que el número de archivo páginas en la base de datos del directorio de archivos y si el número de página del archivo de imagen es el mismo que el número de archivo en la base de datos del directorio de archivos. A través de la coherencia y unicidad del nombre de cada archivo de imagen y el número de archivo del archivo en la base de datos del directorio de archivo, se establece una correspondencia uno a uno, que proporciona condiciones para conexiones por lotes entre la base de datos del directorio de archivo y los archivos de imagen. .

3. Complete cuidadosamente el formulario de registro de entrega para el proceso de conversión digital de documentos en papel, registre el número de páginas después de la asociación de datos y verifique si el número de páginas después de cada asociación de archivos es consistente con el número. de páginas completadas durante la clasificación y escaneo de documentos. Si hay alguna inconsistencia, se deben anotar las razones específicas y los métodos de manejo.

9. Aceptación de datos

1. Muestreo de datos

1) Verifique todos los datos muestreados y digitalizados, incluidas las bases de datos de directorios, archivos de imágenes y enlaces de datos. calidad total.

2) Para todos los documentos, la tasa de muestreo durante la aceptación de datos no será inferior al 5%.

2. Indicadores de aceptación

1) Cuando hay un enlace de código de error entre la base de datos del catálogo y el archivo de imagen, o uno de la base de datos del catálogo y el archivo de imagen está incompleto, no está claro. , incorrecto, etc. Cuando hay un problema, la inspección aleatoria se marca como "no calificada".

2) Cuando la tasa de aprobación de la inspección de muestreo de calidad de conversión digital de todos los documentos alcance más del 95% (inclusive), se considerará "aprobada".

Tasa de calificación: número de documentos que pasaron la inspección por muestreo/número total de documentos de inspección por muestreo × 100%.

3. Revisión de aceptación

La conclusión de aceptación "aprobada" debe ser revisada y firmada por el líder a cargo antes de que pueda entrar en vigencia.

4. Registro de aceptación

Rellene con atención el formulario de registro de aceptación digital para archivos en papel.

X. Copia de seguridad de datos

1. Alcance de la copia de seguridad

Se debe realizar una copia de seguridad de los datos completos y calificados de manera oportuna.

2. Método de copia de seguridad

Para garantizar la seguridad de los datos, se debe diversificar la elección de los proveedores de copias de seguridad. Se pueden lograr múltiples conjuntos de copias de seguridad utilizando una combinación de métodos y atención en línea y fuera de línea. debe pagarse al almacenamiento remoto.

3. Verificación de datos

También se deben verificar los datos de respaldo. La inspección de los datos de la copia de seguridad incluye principalmente si los datos de la copia de seguridad se pueden abrir, si la información de los datos está completa y si la cantidad de archivos es precisa.

4. Etiqueta de copia de seguridad

Después de realizar la copia de seguridad de los datos, se deben etiquetar los medios de copia de seguridad correspondientes para facilitar la búsqueda y la administración.

5. Registro de copias de seguridad

Rellenar el formulario de registro de gestión de copias de seguridad digitales para documentos en papel.

XI. Gestión de resultados digitales

1. Se debe reforzar la gestión de los resultados digitales de los archivos en papel para garantizar su seguridad, integridad y disponibilidad a largo plazo.

2. Al proporcionar recuperación y utilización en línea de resultados digitales de archivos en papel, se debe proporcionar la identificación electrónica de la unidad de producción y el formato de los datos debe ser descargable o no, según la situación específica.