CNKI y VIP son dos proveedores de bases de datos de recursos literarios muy conocidos en China. Debido a las diferentes fuentes de datos, algoritmos de recuperación y cantidad de documentos en diferentes disciplinas, habrá una cierta brecha en los resultados de la verificación de duplicación.
En primer lugar, las fuentes de la base de datos son diferentes.
La base de datos VIP está diseñada principalmente para el campo cultural chino, e incluye documentos académicos en casi todos los campos, como noticias, política, economía, educación, literatura y arte. y cubre revistas básicas chinas, tesis de doctorado y maestría, artículos de conferencias y otros recursos. , y ha sido ampliamente utilizado en estas disciplinas.
HowNet es una de las bibliotecas digitales más completas y autorizadas de China. Como filial de la Academia China de Ciencias Sociales, su base de datos es más extensa y diversa que VIP.
HowNet reúne una gran cantidad de revistas académicas y artículos de agencias gubernamentales, instituciones de investigación y universidades. Además de las materias tradicionales como la literatura, la lengua y la historia, también abarca campos de las ciencias naturales como la física y la química. Por lo tanto, los resultados de las consultas de CNKI son más ricos que los de VIP.
En segundo lugar, los algoritmos de recuperación son diferentes.
Los algoritmos de verificación de duplicaciones de VIP y CNKI son diferentes. Los métodos básicos y modelos de cálculo adoptados por VIP afectarán la precisión de la verificación de duplicaciones. En este sentido, CNKI puede ser ligeramente mejor. CNKI adopta un modelo de espacio vectorial TF-IDF ($TERM frecuencia-frecuencia de documento inversa) único.
También combina algoritmos comunes como PageRank y LDA para calcular con mayor precisión valores de similitud basados en la frecuencia de las palabras, el peso y otros parámetros del artículo. Wip, por otro lado, utiliza un algoritmo tradicional de ventanas superpuestas para calcular la similitud del texto. Aunque los resultados de la búsqueda son ricos, la precisión de la verificación de duplicaciones es relativamente baja, lo que dificulta el procesamiento de una gran cantidad de información de consulta.
En tercer lugar, la cantidad de documentos es diferente
Dado que CNKI ha acumulado más recursos académicos que VIP, los resultados de búsqueda son más ricos, especialmente para la recuperación de literatura china y extranjera. Por supuesto, con la ayuda de pinyin, palabras clave y software de traducción, la diferencia no será demasiado grande a menos que involucre un determinado recurso de información relacionado en un campo determinado.
Aunque bajo los mismos estándares y condiciones de uso, las respuestas a las consultas de CNKI y VIP pueden ser diferentes, sus funciones principales son buscar y recuperar contenido académico en sus respectivos campos. Los usuarios deben sopesar las diferencias entre ellos. los dos de acuerdo con sus necesidades reales, elija y utilícelos adecuadamente.