La similitud general se calcula como: la relación entre el número de palabras del artículo que son similares a la base de datos y el número total de palabras detectadas en el artículo. El sistema de verificación de plagio primero corta automáticamente el artículo enviado en párrafos mediante saltos de línea; luego extrae las oraciones del párrafo basándose en los signos de puntuación del párrafo y, finalmente, verifica las repeticiones oración por oración; El sistema actual de verificación de duplicaciones no juzgará la semántica similar como duplicación. La similitud es más una comparación de las palabras mismas, incluidas las palabras clave y la posición de las palabras clave en la oración.
La verificación de duplicación del artículo incluye el texto principal, descripción original, resumen, descripción de diagramas y fórmulas, referencias, apéndices, resultados de investigaciones experimentales, conclusiones, introducción, patentes, literatura, notas y tablas diversas, etc. Durante la temporada de graduación, la mayoría de los colegios y universidades emitirán avisos que explican las especificaciones de la tesis de graduación de la escuela y las instrucciones de verificación de plagio. La escuela emitirá uniformemente estilos de tesis y otros contenidos y, en general, detallará el alcance de la verificación de plagio. Si la escuela tiene requisitos específicos, debe presentarse de acuerdo con los requisitos de la escuela.