El sistema de verificación de duplicaciones de HowNet fue desarrollado por Tsinghua Tongfang Company y ahora es un sistema de detección autorizado en China. Tiene la base de datos más grande y extensa, por lo que los resultados de las pruebas serán relativamente estrictos. No solo eso, muchas universidades y revistas utilizan la verificación de plagio CNKI.
Principios y reglas de verificación de duplicación CNKI: una vez cargado el artículo, el sistema generará un directorio basado en el texto cargado, detectará automáticamente la información del capítulo del artículo y utilizará "capítulo" para la detección de segmentación. . La portada, el resumen, el propósito del estudio y el primer capítulo se examinarán por separado, y cada párrafo tendrá una tasa de repetición.
Si 13 palabras consecutivas son similares, se marcarán en rojo, entonces esta sección se repite mucho y el sistema calculará automáticamente la tasa de repetición de esta parte. Una vez completada la verificación de plagio, el sistema de verificación de plagio marcará automáticamente la tasa de duplicación, la tasa de citas, el recuento total de palabras y otros indicadores del papel en el informe de verificación de plagio en papel. Todo este proceso es el principio de verificación de plagio en papel.
Características del sistema de verificación de plagio
1. Detección difusa: cuando el sistema de verificación de plagio en papel de CNKI encuentra que una oración en su artículo es sospechosa de plagio, el sistema verificará automáticamente la oración. El reconocimiento difuso se realiza antes y después. Este algoritmo es muy estricto y se puede detectar simplemente añadiendo algunos adverbios. Solo si modifica el contenido duplicado o modifica una gran cantidad de partes duplicadas, no se detectará en este momento.
2. Umbral de sensibilidad: el sistema HowNet establece el umbral de sensibilidad en 5%, utilizando el cálculo de párrafos. Por ejemplo, si se detecta un párrafo grande de 5000 palabras y un documento al que se hace referencia tiene menos de 250 palabras, no se considerará un duplicado. Por lo tanto, cuando los estudiantes reducen el peso de los trabajos posteriores, es mejor no citar repetidamente un documento, sino utilizar varios documentos. El contenido de cada artículo solo se acumula, por lo que no se puede detectar.
3. El impacto del formato: De hecho, el formato del trabajo también puede tener un impacto en la tasa de repetición. Si el documento se carga como texto PDF, el sistema debe convertir el PDF a Word antes de realizar la prueba. Sin embargo, este paso de conversión puede confundir el formato del índice y las referencias en el texto, y luego el sistema puede juzgar estas dos partes como texto para participar en la prueba, lo que conducirá a un aumento en la tasa de repetición.
3. Impacto del directorio: después de cargar el artículo en el sistema en papel, el sistema monitoreará automáticamente la información del capítulo del artículo en función del índice generado por el artículo y luego dividirá el documento en capítulos correspondientes para completar la detección, y puede mostrar el contenido de cada capítulo grande Las tasas de duplicación, los directorios no se incluirán en el texto para la detección.