Métodos de investigación, evaluación y previsión de mercados para la industria editorial de libros de texto

Métodos de estudio, evaluación y pronóstico de mercado en la industria editorial de libros de texto

Resumen

Este tema es un tema de diseño con las características de una gran cantidad de datos e información.

Primero, analizamos los datos de la base de datos y clasificamos las universidades de acuerdo con ciertas reglas. Utilizamos un muestreo aleatorio sistemático y agregamos correcciones regionales para limitar el alcance del estudio de mercado de 205 universidades a 26 universidades. Se llevó a cabo una encuesta mediante cuestionario en estas 26 escuelas. Analizamos los datos obtenidos de la encuesta y utilizamos la proporción del número de cuestionarios relacionados con la editorial con respecto al número total de cuestionarios para medir la participación de mercado de una editorial, obteniendo así una tabla de datos de la participación de mercado de cada editorial. casa dentro de tres años, utilizando el método de ajuste Hacer predicciones.

En segundo lugar, también tuvimos en cuenta las circunstancias especiales que pueden surgir durante la encuesta por muestreo del cuestionario, es decir, que no haya respuestas en la muestra. Adoptamos dos métodos de encuesta de submuestreo para resolver este problema, el método tradicional y el método bayesiano, y resumimos y comparamos brevemente sus similitudes y diferencias. Ambos métodos ayudan a reducir los errores ajenos al muestreo y mejorar la calidad de los datos.

En tercer lugar, también presentamos una nueva comprensión de la teoría de la impresión bajo demanda, que reduce en gran medida el coste de las editoriales. En la verificación de los datos, compararemos la participación de mercado obtenida de la encuesta por muestreo con la participación de mercado obtenida del análisis general para determinar el error relativo. Se descubre que la mayoría de los errores de datos son inferiores a 0,1 y el efecto es bueno. En la mejora del modelo también se propusieron nuevas ideas para mejorar el modelo.

Finalmente, proporcione una discusión y explicación más completa del tema, y ​​brinde opiniones y sugerencias al editor basadas en este tema.

Palabras clave: muestreo aleatorio sistemático, corrección y remediación regional, sin respuesta, método de encuesta por muestreo en dos etapas, teoría de la impresión bajo demanda

1. >

Cuando el Comité Central del Partido Comunista de China propuso el plan de desarrollo "Undécimo Plan Quinquenal" en el Consejo de Estado, la industria cultural de China ha recibido una atención sin precedentes. Al mismo tiempo, el XI Plan Quinquenal también anunció que la industria editorial se enfrenta a desafíos sin precedentes. Durante el período del "Undécimo Plan Quinquenal", la industria editorial enfrentará el impacto de los desarrollos tecnológicos como Internet, SMS y la publicación digital en el entorno editorial. Muchas editoriales y unidades de distribución ya han comenzado o están empezando a pensar y planificar su desarrollo futuro, lo que en sí mismo es un signo importante del retorno racional de la industria editorial. Para las unidades editoriales, el mayor valor de la planificación estratégica reside en su proceso, en cultivar un pensamiento sistemático y una adaptabilidad en un entorno de economía de mercado, no sólo en los resultados de la planificación. Según los compromisos de adhesión de China a la OMC, 2006 es el último año en que la industria editorial y de distribución de China estará completamente liberalizada. Profundizar la reforma institucional y responder a la adhesión a la OMC se han convertido en prioridades máximas para la industria editorial y de distribución. La industria concede una gran importancia a la competitividad como nunca antes. Cualquier informe de investigación, estudio de mercado y clasificación de la industria tocará los nervios sensibles de las editoriales. La educación y las publicaciones tienen un gran impacto en la competitividad de las editoriales. La gestión se ha convertido en el medio más importante para mejorar la competitividad, formando una ventaja competitiva relativamente estable. Por lo tanto, la industria editorial de libros de texto, que ocupa una posición dominante en la industria editorial, presta más atención a la investigación de mercado y a la evaluación y predicción científica del mercado. Lo que necesitamos es investigación científica, métodos de evaluación y predicción.

En segundo lugar, una reformulación del problema

Una editorial publica una variedad de libros de texto para la educación superior y la educación vocacional. Desde la perspectiva del desarrollo estratégico de la editorial, la estrategia de inversión, los acuerdos de producción, el modelo de ventas, la planificación de productos, etc., es necesario examinar la participación de mercado de la editorial y sus cambios año tras año. Diseñe métodos de encuesta efectivos y factibles, establezca un modelo de análisis de los datos de la encuesta y realice evaluaciones y predicciones científicas del mercado.

Los datos básicos que figuran en el apéndice de esta pregunta son datos del cuestionario del censo. Debido a las limitaciones en los costos de muestreo, no es aconsejable realizar un censo y el tamaño de la muestra debe ser lo más pequeño posible según el propósito de la encuesta.

Descripción del título

1. Debido al costo del muestreo, las encuestas generales no son aconsejables, pero existe un equilibrio entre el tamaño de la muestra del método de muestreo y la eficiencia de la encuesta. . Debe considerar este equilibrio al determinar el tamaño de la muestra.

2. Describe completamente tu método de investigación y proporciona claramente los datos de tu simulación. Si se utiliza una encuesta por muestreo por cuestionario (no limitada a una encuesta por cuestionario), proporcione el formato del cuestionario.

3. Ofrezca un modelo de predicción y evaluación del mercado basado en datos de encuestas y utilice datos para ilustrar la eficacia y la cientificidad de su método.

4. El formato del cuestionario de referencia se proporciona en el Apéndice 1, y también se proporciona la base de datos relacionada con este cuestionario (Apéndice 4).

Esta base de datos contiene las hojas de respuestas simuladas de todos los estudiantes en diez provincias (incluidos tres años) (para reducir la cantidad de datos, se supone que todos los estudiantes de la clase completan el mismo formulario, por lo que solo un estudiante de cada especialidad completa el cuestionario) como pregunta para este concurso Datos de antecedentes.

5. El Apéndice 2 proporciona los nombres y números de clasificación de 29 tipos de materiales didácticos en la base de datos proporcionada por este tema. El Apéndice 3 proporciona el volumen de ventas de tres años de diversos materiales didácticos de una editorial para su consulta. .

6. El Apéndice 4 también proporciona los nombres de todas las escuelas y sus especialidades en diez provincias. Puede utilizar estos términos de búsqueda para determinar sus consultas de muestra en la base de datos.

7. Si elige sus propios datos, proporcione los métodos de prueba y las fuentes de datos para la confiabilidad y racionalidad de los datos de la encuesta.

3. Supuestos básicos

Para facilitar nuestra comprensión general del tema, este artículo examina la editorial desde las perspectivas del desarrollo estratégico, la estrategia de inversión, los acuerdos de producción y los métodos de venta. y planificación de productos La participación de mercado (participación de mercado) de las editoriales y sus cambios año tras año. De este modo, se diseñan métodos de encuesta eficaces y viables, se establecen modelos de análisis para los datos de las encuestas y se realizan evaluaciones y predicciones científicas sobre el mercado. Aquí hacemos suposiciones básicas razonables:

(1) El mercado de la industria editorial de libros de texto será básicamente estable en un período de tiempo relativamente largo;

(2) El entorno social es estable y las políticas sociales tienen un impacto positivo en la industria editorial. No hay ajustes importantes en la industria;

(3) No hay cambios importantes en la aplicación de materiales didácticos por parte del departamento de educación;

(4) No hay cambios importantes en la escuela y el número de estudiantes en la escuela no aumentará ni disminuirá;

(5) El número de editoriales de material didáctico es. básicamente estable y las condiciones operativas no fluctúan mucho;

(6) Las condiciones operativas de las editoriales son buenas, sin accidentes;

(7) La calidad del Los materiales didácticos publicados por la editorial de libros de texto están garantizados y no hay problemas de calidad;

Cuarto, análisis de problemas y preparación de modelos

1. Análisis de problemas

Según. a los datos del apéndice de esta pregunta, se encuentran:

(1) El formato del cuestionario de referencia se muestra en el Apéndice 1

(2) El Apéndice 2 proporciona el; nombres y números de clasificación de 29 tipos de materiales didácticos en la base de datos proporcionada por este tema;

(3) El Apéndice 3 proporciona el volumen de ventas de tres años de diversos materiales didácticos de una editorial como referencia;

(4) El Apéndice 4 proporciona los datos originales de tres años de diez provincias y el catálogo de especialidades escolares correspondientes;

(5) También puede elegir sus propios datos.

Y los datos básicos que requiere la pregunta son los datos del cuestionario del censo. Debido a la limitación del costo del muestreo, no es aconsejable realizar un censo. Para lograr el propósito de la encuesta, el número de muestras debe ser lo más pequeño posible. Por lo tanto, debemos considerar los siguientes aspectos para procesar datos y resolver problemas:

Primero, analizamos los datos en la base de datos, clasificamos las universidades de acuerdo con ciertas reglas, utilizamos un muestreo aleatorio sistemático y agregamos la corrección regional. el alcance del estudio de mercado de 205 universidades a 26 universidades. Se llevó a cabo una encuesta mediante cuestionario en estas 26 escuelas. Analizamos los datos obtenidos de la encuesta y utilizamos la proporción del número de cuestionarios relacionados con la editorial con respecto al número total de cuestionarios para medir la participación de mercado de una editorial, obteniendo así una tabla de datos de la participación de mercado de cada editorial. casa dentro de tres años, utilizando el método de ajuste Hacer predicciones.

En segundo lugar, también tuvimos en cuenta las circunstancias especiales que pueden surgir durante la encuesta por muestreo del cuestionario, es decir, que no haya respuestas en la muestra. Adoptamos dos métodos de encuesta de submuestreo para resolver este problema, el método tradicional y el método bayesiano, y resumimos y comparamos brevemente sus similitudes y diferencias. Ambos métodos ayudan a reducir los errores ajenos al muestreo y mejorar la calidad de los datos. Se puede decir que la aplicación de una muy buena solución correctiva en el modelo hace que nuestro modelo sea más completo, efectivo y científico.

En tercer lugar, también presentamos una nueva comprensión de la teoría de la impresión bajo demanda, que reduce en gran medida el coste de las editoriales. En el análisis de sensibilidad, también utilizamos datos de una editorial para validar el modelo y generalizarlo a la situación general.

Finalmente, proporcione una discusión y explicación más completa del tema, y ​​brinde opiniones y sugerencias al editor basadas en este tema.

2. Elaboración del modelo (explicación de términos)

1. Compresión de datos

La compresión de datos consiste en simplificar o simplificar los datos con una mínima pérdida de información. Tecnología de compresión para mejorar la eficiencia de su transmisión, almacenamiento y procesamiento. Teniendo en cuenta la enorme cantidad de datos que deben adquirirse y procesarse, la compresión de datos es una forma eficaz de reducir la carga de trabajo y ahorrar tiempo en la computadora.

Esto se puede lograr eliminando intervalos, segmentos en blanco, elementos redundantes o datos innecesarios y reteniendo solo los datos que reflejen las características, aumentando así la cantidad de datos que se pueden almacenar en un espacio determinado y reduciendo el espacio ocupado por la cantidad de datos. Los métodos de compresión de datos suelen incluir: ①Reducción. Utilice extrapolación o interpolación para calcular y eliminar datos redundantes; ②Extracción de parámetros. Es decir, solo se conservan los datos y parámetros de las características; ③Muestreo isócrono. Muestreo continuo de datos de entrada a intervalos de tiempo iguales; ④ conversión de codificación. La eficiencia de convertir datos en códigos simplificados o codificar cada bloque de datos se mide por la cantidad de bits por píxel ⑤ Aplicación funcional. Según los puntos de muestreo necesarios obtenidos mediante el muestreo a intervalos iguales o desiguales, utilice un algoritmo de función para calcular los datos reducidos.

2. Sin respuesta

La llamada no respuesta significa que, por alguna razón, no se puede obtener la información requerida de todas las unidades de muestra o de todas las preguntas del cuestionario. Puede ser que las unidades de muestra no proporcionaron o no proporcionaron completamente la información requerida, o que parte de la información proporcionada no fuera utilizable. Los encuestados que no responden suelen tener características diferentes a las de los que responden, por lo que si no se corrige ninguna respuesta, la validez y representatividad de la muestra se reducirán y las estimaciones de la encuesta estarán sesgadas, reduciendo así la precisión de la encuesta y Incluso provocando que toda la investigación fracasara.

3. Método de muestreo secundario

El método de muestreo de dos niveles es un método común para abordar preguntas sin respuesta. La idea básica es volver a muestrear aleatoriamente las preguntas iniciales sin respuesta y luego utilizar los datos de respuesta de la muestra inicial y los datos de la submuestra para estimar la población, eliminando así el sesgo de las preguntas sin respuesta y mejorando la precisión del estimador. Este método se utiliza comúnmente en encuestas por correo electrónico. A continuación, presentaremos dos métodos de encuestas de submuestreo para remediar la falta de respuesta: el método tradicional y el método bayesiano, y resumiremos brevemente sus similitudes y diferencias.

4. Impresión bajo demanda

La intención original de la impresión bajo demanda (POD) es hacer realidad la industria editorial a través de tecnología de impresión digital y de ultra alta velocidad de acuerdo con las necesidades de diferentes tiempos, ubicaciones, cantidades y contenidos. Nuevos cambios en todo el proceso para adaptarse a las demandas del mercado moderno de personalización, tiradas cortas y alta eficiencia. Es especialmente adecuado para algunas empresas de impresión con un posicionamiento estrecho, gran profesionalismo, gran variabilidad y lotes pequeños. La impresión bajo demanda es producto de una combinación de tecnología avanzada de bases de datos y tecnología de impresión digital. El proceso operativo consiste en digitalizar primero el contenido del libro y luego utilizar archivos electrónicos para imprimir las páginas a alta velocidad en una impresora láser especial para completar los procesos de plegado, ensamblaje y encuadernación. Se caracteriza por la inmediatez del tiempo de impresión, la variabilidad y la personalización de la cantidad y el contenido de impresión.

Aquí utilizamos su significado extendido para imprimir según la cantidad de materiales didácticos que necesita el mercado. Dado que los colegios y universidades tienen diferentes tipos de necesidades de materiales didácticos, se necesita un modelo de este tipo para satisfacer las necesidades de los clientes. Por ello, proponemos aquí un modelo de impresión bajo demanda.

Al mismo tiempo, la impresión bajo demanda adopta el método de suministro y liquidación instantáneos, lo que ahorra espacio de almacenamiento de libros a los editores. Lograr un "inventario cero" también resuelve el problema de los libros y las tiradas agotadas. A través de la impresión bajo demanda, los editores pueden deshacerse de los riesgos financieros y la presión de circulación causados ​​por la impresión de libros, el inventario, el transporte y la inversión, y ahorrar costos.

Establecimiento y predicción del modelo de verbo (abreviatura de verbo)

(1) Descripción del método de encuesta por muestreo

Nuestra encuesta por muestreo se puede dividir en tres etapas. Eso es "análisis de datos de muestra". El trabajo preliminar consiste en realizar un diseño de muestreo, obtener una lista de unidades de encuesta y resolver el problema de quién recopila datos estadísticos (muestras) y el trabajo de mediano plazo consiste en realizar una encuesta estadística de las unidades de encuesta seleccionadas y obtener datos estadísticos; y organizar los datos según sea necesario para proporcionar estadísticas. El análisis proporciona datos precisos y resuelve los problemas de adquisición y formato de datos. El trabajo posterior consiste en utilizar software estadístico para realizar análisis estadísticos de los datos recopilados de la encuesta y realizar análisis científicos. conclusiones para lograr el objetivo final del trabajo estadístico (análisis). Los tres se complementan y son indispensables.

En la encuesta por muestreo real, las cuestiones consideradas en la encuesta por muestreo incluyen los siguientes tres aspectos: precisión de la estimación del indicador de la encuesta; nivel de costo de la encuesta; Los tres aspectos anteriores son contradictorios en el diseño del plan de encuesta por muestreo. Por lo tanto, al diseñar un plan de encuesta por muestreo, la importancia de los tres aspectos anteriores debe clasificarse según la situación real. En términos generales, lo más importante es la precisión de las estimaciones del índice de la encuesta, seguida del costo de la encuesta y, finalmente, el tamaño de la muestra.

Por lo tanto, se debe dar prioridad a tres temas al diseñar el plan de encuesta de muestra:

(I es prioridad)

Lo siguiente es lo que resumimos en la muestra Pasos de la encuesta:

5.1, Propósito del muestreo

El propósito del muestreo es seleccionar datos representativos de la base de datos del censo existente, es decir, comprimir los datos. Mediante la compresión de datos, se obtienen datos dentro del rango de error permitido, evaluando y prediciendo así científicamente el mercado.

5.2.Principios básicos del muestreo

Para poder captar la situación del mercado, los datos recogidos deben ser completos y representativos. Este es el principio básico del muestreo.

5.3.Métodos de muestreo comúnmente utilizados (breve descripción)

Los métodos de muestreo se pueden dividir en muestreo probabilístico y muestreo no probabilístico. Debido a que la probabilidad de un resultado de muestreo no probabilístico no se puede medir con precisión, generalmente se utilizan métodos de muestreo probabilístico. El muestreo aleatorio simple, el muestreo aleatorio estratificado y el muestreo aleatorio sistemático son todos métodos de muestreo probabilístico.

1. Muestreo aleatorio simple

El muestreo aleatorio simple se refiere a "seleccionar n individuos de una población que contiene n individuos de modo que se seleccionen todas las combinaciones posibles de n individuos. Igualmente probable". Al muestrear con este método, todos los datos de la base de datos tienen las mismas posibilidades de ser incluidos en la muestra. Es un método de muestreo aleatorio sin restricciones subjetivas. Es un método de muestreo aleatorio básico y la base de otros métodos de muestreo aleatorio.

2. Muestreo aleatorio estratificado

A veces los productos se pueden dividir en varias capas y la calidad del producto de cada capa es obviamente diferente. Para obtener una muestra representativa, todo el lote de productos se divide en varias capas para que la calidad del producto en la misma capa sea lo más uniforme y ordenada posible, y algunos productos se seleccionan al azar de cada capa para formar una muestra. Este método de muestreo se llama muestreo aleatorio estratificado. Si la estratificación es correcta, el muestreo estratificado es mejor que el muestreo aleatorio simple, pero si no se comprende la distribución de la calidad del lote o la estratificación es incorrecta, el efecto del muestreo estratificado será contraproducente.

3. Muestreo aleatorio sistemático

Si un lote de productos se puede organizar en un orden determinado y se puede dividir en n partes iguales, utilice un método de muestreo aleatorio simple para determinar la misma posición. Tomar una unidad de producto de cada parte para formar una muestra se llama muestreo aleatorio sistemático. Su representatividad es generalmente mejor que el muestreo aleatorio simple, pero cuando el período de fluctuación de la calidad del producto es equivalente al intervalo de muestreo, las unidades muestreadas pueden ser productos de buena o mala calidad y la representatividad es pobre.

5.4. Elección correcta del método de muestreo

Para evaluar y predecir mejor el mercado, es muy importante elegir un método de muestreo adecuado.

1. Cuando los datos sean relativamente estables y no haya muchos datos, elija el muestreo aleatorio simple. Si no conoce la calidad general, también debe elegir el muestreo aleatorio simple.

2. Cuando diferentes datos provienen de diferentes regiones, se puede utilizar el muestreo aleatorio estratificado para obtener una muestra representativa.

3. Cuando los datos son inestables y tienen grandes diferencias, se debe utilizar un muestreo aleatorio sistemático.

Basado en la situación real, es muy importante elegir un método de muestreo correcto y razonable para mejorar la representatividad y aleatoriedad de la muestra, mejorando así la eficacia del muestreo. Sólo mediante un muestreo científico, razonable y eficaz podremos cumplir nuestros requisitos.

Con este fin, en vista de las características de este tema, como la gran cantidad de datos, la amplia área geográfica y las grandes diferencias en la demanda de varios libros, se consideraron de manera integral tres métodos de muestreo y se realizó un muestreo sistemático. Se utilizó como método principal y se complementó otro muestreo. Aproveche la compresión de datos para resolver problemas de muestreo.

Al mismo tiempo, también utilizamos el software Excel. Aunque las funciones del software Excel en análisis estadístico no son tan buenas como las del software estadístico profesional (como SPSS, SAS, etc.), sus funciones de clasificación y gestión de datos potentes, flexibles y fáciles de usar están fuera del alcance de los profesionales. software estadístico. Por lo tanto, utilizamos más el software Excel en el procesamiento de datos, lo que acelera enormemente nuestra velocidad de procesamiento de datos.

El cuestionario de muestreo sigue el formato dado en la pregunta.

(2) Establecimiento del modelo

Primero, encontramos algunos datos útiles de la base de datos y los escribimos primero.

1.29 disciplinas

2. El número de editoriales es 25

3 Hay 205 universidades en total, y el número de universidades correspondientes a cada provincia. y la ciudad es la siguiente (Tabla 1):

Beijing Guangdong Hebei Anhui Henan Fujian Guangxi Gansu Guizhou Hainan

49 30 26 24 24 14 13 12 9 4

(Tabla 1)

4. Con base en todos los datos de la base de datos, el número de cuestionarios relacionados con la editorial entre el número de cuestionarios recopilados cada año se muestra en la Tabla 2:

El número de cuestionarios relacionados con la editorial en el primer año y el número de cuestionarios relacionados con la editorial en el segundo año El número de cuestionarios relacionados con la editorial en el año y el número de cuestionarios relacionados a la editorial en el tercer año.

p196 325 323 327

p559 328 336 346

p106 353 352 351

p199 380 379 393

p307 406 411 418

p102 444 451 452

p131 476 475 472

p511 490 495 503

p030 497 503 512

p063 506 508 515

p416 640 637 635

p304 654 661 666

p110 747 754 764

p246 773 778 781

p432 871 870 868

p 091 910 913 913

p 118 1002 1015 1031

p 210 1308 1311 1308

p044 1606 1604 1602

p390 2041 2035 2025

p405 3098 3162 3227

p534 4021 4001 3983

< p293 5095 4947 4767

p 115 18267 18116 17967

p357 20490 20646 20812

(Tabla 2)

Análisis: En En cuestión 4, se explicó el significado del cuestionario. El nombre de una editorial aparece en un cuestionario, lo que indica que toda la especialidad del estudiante que completa el cuestionario utiliza libros de texto de esa editorial. Podemos suponer que, en general, el número medio de carreras es el mismo, entonces cuanto mayor sea el número de cuestionarios correspondientes a una determinada editorial en un determinado año, más gente comprará libros de esa editorial, lo que significa mayor será el mercado. participación de la editorial.

5. A partir de todos los datos de la base de datos, podemos investigar la situación de la adquisición anual de libros de cada universidad. Podemos contar el número de estudiantes de cada universidad que completaron el cuestionario. Según nuestra hipótesis, cuanto mayor sea el número de cuestionarios, mayor será la demanda de libros en las escuelas.

Ordenamos los cuestionarios en orden descendente según el número de cuestionarios correspondientes a las diferentes universidades. Al mismo tiempo, se encontró que el número de cuestionarios en los tres años no ha cambiado, por lo que la clasificación de la universidad no cambiará. Por lo tanto, el número de cuestionarios para tres años se puede considerar en función de la situación del primer año.

Dado que hay 205 universidades, analizamos muchos datos de clasificación, que se omiten aquí.

Analicemos el número de universidades en cada segmento numérico del cuestionario: ver Tabla 3.

Número de cuestionarios cumplimentados por universidades

700~799 1

600~699 7

500~599 34

400~499 34

300~399 39

200~299 38

100~199 20

0~ 99 32

(Tabla 3)

Según esto, adoptamos un muestreo aleatorio sistemático y dividimos las 205 universidades en 26 partes en orden descendente según el número de cuestionarios completados (según Según el ranking, cada 8 escuelas eran sección A, las primeras 25 secciones están ocupadas y la sección 26 está vacante).

Para cada parte, determine la misma posición mediante muestreo aleatorio simple (para esta pregunta se selecciona la primera posición de cada parte).

Examinemos si el plan que hemos determinado cumple ahora con la “integridad, regionalidad y representatividad” de los datos.

Ver (Tabla 4)

Provincias Beijing Guangdong Hebei Anhui Henan Fujian Guangxi Gansu Guizhou Hainan

* * *Hay 49 30 26 24 24 14 13 12 94 universidad.

Seleccione el número de universidades 7 435 1 306 5438+0 1 1.

(Tabla 4)

Como se puede ver en la tabla, los datos individuales no pueden reflejar bien la región y la representatividad. Necesitamos afinar los resultados del muestreo aleatorio sistemático. Por ejemplo, podemos reemplazar una escuela en la provincia de Anhui por una escuela en la provincia de Guangxi con una clasificación más baja.

Finalmente, el número de escuelas que determinamos es el siguiente (Tabla 5):

Provincias Beijing Guangdong Hebei Anhui Henan Fujian Guangxi Gansu Guizhou Hainan

* * *Hay 49 30 26 24 24 14 13 12 94 universidades.

Después del ajuste, el número de colegios y universidades seleccionados es 6 4 3 3 3 2 2 1 1 1.

(Tabla 5)

Finalmente seleccionamos universidades específicas, y los resultados son los siguientes (Tabla 6):

Universidad de Zhengzhou, Universidad de Fuzhou, Universidad de Guangxi para Nacionalidades, Instituto de Tecnología de Beijing Universidades Universidad Agrícola de China Universidad de Ciencia y Tecnología de Guizhou Universidad Agrícola de Hebei Universidad Unión de Beijing

Henan, Fujian, Guangxi, Beijing, Beijing, Guizhou, Hebei, Beijing.

744 597 552 542 519 507 470 451

Continuar a la mesa

Universidad Normal de Guangxi Colegio Maoming Universidad de Hainan Colegio de Gestión de la Industria de Aviación de Zhengzhou Instituto de Radiodifusión de Beijing Normal Shangqiu Universidad Normal de Zhanjiang y Instituto de Ingeniería Mecánica de Beijing

Hainan, Guangxi, Guangdong, Henan, Beijing, Henan, Guangdong y Beijing.

414 405 385 369 342 305 301 276

Continuar a la mesa

Universidad Normal de Tangshan Hexi College Zhongkai Facultad de Agricultura y Tecnología Chaohu College Universidad Médica de Fujian Beijing Instituto de Ciencia y Tecnología Electrónica Universidad Médica de Anhui Facultad de Medicina Tradicional China de Anhui

Provincia de Hebei Provincia de Gansu Provincia de Guangdong Provincia de Anhui Provincia de Fujian Ciudad de Beijing Provincia de Anhui Provincia de Anhui

253 239 208 204 138 103 77 68

Continúa con la tabla anterior

Academia de la Fuerza Policial Armada del Pueblo Chino Instituto de Educación Física de Guangzhou

Provincia de Guangdong, Provincia de Hebei

35 32

(Tabla 6)

Para resumir nuestros métodos de encuesta, seleccionamos algunas escuelas de 205 escuelas como representantes y aceptamos la encuesta. El método de selección de escuelas es: se adopta el método de muestreo aleatorio sistemático general, pero para garantizar "integridad, regionalidad y representatividad", se realizan algunas modificaciones al método de muestreo. Seleccionamos las 26 universidades mencionadas anteriormente como objetivos para la emisión de cuestionarios.

A continuación, basándose en el método de encuesta anterior, encontramos el número de cuestionarios de primer año de las 26 universidades correspondientes a cada editorial de la base de datos. Se utilizó el software Excel para procesar y obtener la suma del número de cuestionarios de cada editorial correspondientes a las 26 universidades en el primer año.

La tabla correspondiente es la siguiente (Tabla 7):

Pulse p559 p 199 p 102 p 106 p 196 p 307 p 030 p 131p 511p 063 p 416.

Número de cuestionarios 38 45 47 47 49 55 59 64 67 68 72 85

Continúa con la tabla anterior

p 110 p 091 p 18 P432 p 210 p 044 P390 P405 P534 P293 p 16 5438+05 P357

88 99 118 119 119 160 204 266 378 515 631 2507 2657

(Tabla 7)

Utilizando el software Matlab, también mostramos la relación entre el número de cuestionarios correspondientes a cada editorial en el primer año y el número total de cuestionarios de la siguiente manera (Tabla 8):

P559 p 199 p 102 p 106 p 196 p 307 p 030 p 131 p 511 p 063 p 416.

Proporción del cuestionario 0,0044 0,0053 0,0055 0,0055 0,0057 0,0064 0,0069 0,0075 0,0078 0,0079 0,0084 0,0099.

Continúa con la tabla anterior

p 110 p 091 p 18 P432 p 210 p 044 P390 P405 P534 P293 p 16 5438+05 P357

0.0103 0.0116 0.0138 0,0139 0,0139 0,0187 0,0238 0,0311 0,0442 0,0602 0,0737 0,2930 0,3105

(Tabla 8)

Con base en los supuestos y explicaciones iniciales, podemos usarlo para examinar la participación de mercado. En consecuencia, también se puede obtener la proporción del número de cuestionarios correspondientes a cada editorial en el segundo y tercer año sobre el número total de cuestionarios.

Los resultados del segundo año son los siguientes, tal y como se muestra en la Tabla 9.

Pulsa p559 p 199 p 106 p 102 p 196 p 307 p 304 p 131030 p 5165438.

La proporción del cuestionario es 0.0044 0.0051.0055 0.0058 0.0061.0065 0.0069 0.0072 0.0076 0.0083 0.0098 0.05438+005.

Continuar con la tabla

p063 P246 P432 p 118 p 091p 210 p044 P390 P405 P534 P293 p 115 P357

0.0107 0.0118 0.0138 0.0141 0.0139 0.0185 0.0 259 0,031 0.0447 0.0595 0.0711 0.2886 0.3123

(Tabla 9)

Sexto, análisis de errores del modelo

Utilizando el software Matlab, en base a todos los datos de la base de datos, se puede obtener que cada La proporción del número de cuestionarios correspondientes a cada editorial sobre el número total de cuestionarios.

Para nuestro método de muestreo, tomando el primer año como ejemplo, podemos calcular el error relativo entre las dos proporciones para probar nuestro método.

Consulte la Tabla 10 para ver la tabla.

P196

p559 p106 P199

p307 p 102 p 131 p 511 p030 p063 p 416 p304

Estándar 0,0049 0,0050 0,0054 0,0058 0,0062 0,0068 0,0072 0,0075 0,0076 0,0077 0,0097 0,05438+000.

Medida 0,0057 0,0044 0,0055 0,0053 0,0064 0,0055 0,0078 0,0079 0,0075 0,0084 0,0099 0,0069.

Error:16.3% 12.0% 1.8% 8.6% 3.2% 1% 8.3% 5.3% 1.3% 9.654338+0% 2.66665436

Continúa con la tabla anterior

p 110 p246 p432 p 091 p 18 p 210 p 044 p390 p405 p534 p293 p 115 p357

0.0114 0.0118 0.0133 0.0138 0.0152 0.0199 0.0244 0.0311 7 1 0,0612 0,0775 0,2779 0,3117

0,0103 0,0116 0,0139 0,0138 0,0139 0,0187 0,0238 0,0311 0,0442 0,0602 0,0737 0,2930 0,3105

9,6% 1,7% 4,5% 0 8,6% 6% 2,5% 0 6,2% 4,9% 5,4% 0,4%

( Tabla 10)

Como se puede ver en la tabla anterior, a excepción de algunos grupos, los errores relativos de cada grupo son inferiores a 0,1. Se puede ver que dentro de los requisitos de precisión, nuestro método es mejor.

Siete. Verificación y mejora del modelo

Desde la perspectiva de la editorial, en términos de impresión, propusimos la teoría de la impresión bajo demanda. Para verificar la validez y cientificidad del modelo, recopilamos estadísticas sobre las ventas de libros en 10 provincias y ciudades durante los últimos tres años por región, y luego utilizamos el software Excel para procesar los datos y crear gráficos intuitivos para verificar la selección de 26 universidades.

Libros vendidos por una editorial en 10 provincias y ciudades en tres años;

1. Consulte la Tabla 11 para ver la tabla:

Beijing, Guangdong, Henan. , Hebei y Anhui, Fujian, Gansu, Guangxi, Guizhou y Hainan

3934 2837 2544 2374 1998 1400 1136 1017844 290 18374 en el primer año.

El segundo año 3902 2809 2533 2354 1980 1396 133 1017838 282 18244.

Tercer año: 3870 2773 2504 2315 1963 1378 1122 1009 830 283 18047.

Totales 11706 8419 7581 7043 5941 4174 3391 3043 2512 855 54655.

El valor promedio es 3902 2807 2527 2348 1981932 111015838 285 18222.

Ranking 1 2 3 4 5 6 7 8 9 10

(Tabla 11)

De la tabla podemos observar:

(1) En las 10 provincias y ciudades, el volumen de ventas de libros chinos en cada provincia y ciudad fue básicamente el mismo en tres años, y el volumen anual no fue muy diferente;

(2) Dentro del En tres años, el volumen total de ventas de las 10 provincias y ciudades fue básicamente el mismo, con un volumen de ventas anual promedio de 18,222;

(3) A través de una comparación de tres años, las ventas anuales y las clasificaciones de 10 Se pueden obtener provincias y ciudades.

2. Los dibujos son los siguientes:

(Figura 1) es un gráfico de barras naturales de las ventas de libros en varias provincias y ciudades en 2010.

(Figura 1)

(Figura 2) Gráfico circular de ventas de libros en cada provincia y ciudad en tres años (10).

(Figura 2)

A través del dibujo, podemos ver:

(1) Beijing vendió la mayor cantidad de libros en tres años, alcanzando el 21,4%; La provincia vendió la mayor cantidad de libros; posteriormente, alcanzó el 15,4%; la provincia de Henan la siguió de cerca, alcanzando el 13,9%; las ventas de libros en estas tres provincias y ciudades alcanzaron el 50,7%, más de la mitad.

(2) Las ventas de libros en las cinco provincias de Beijing, Guangdong, Henan, Hebei, Anhui y Fujian superaron el 10%, y el volumen total de ventas en las cinco provincias alcanzó el 74,5%.

Según el apéndice, podemos conocer el porcentaje de provincias donde se ubican las editoriales P115 según nuestro modelo, como se muestra en la Tabla 12.

Provincias Pekín Guangdong Hebei Anhui Henan Fujian Guangxi Gansu Guizhou Hainan

Porcentaje 25,4% 10,2% 10,2% 4,7% 18,1% 7,9% 10,4% 3,3% 4,5% 5,4%.

(Tabla 12)

Se puede observar que comparados con el gráfico circular, los datos de algunas provincias son diferentes.

Sobre esta base, se encontró la dirección de mejora del modelo. Al seleccionar universidades, es necesario realizar un muestreo aleatorio sistemático y una corrección regional, y hacer que la distribución de las escuelas en cada provincia sea relativamente equilibrada. El resultado debe ser mejor.

Ocho. Opciones de corrección para modelos

Aquí, presentaremos dos métodos de encuestas de submuestreo para corregir la falta de respuesta: el método tradicional y el método bayesiano, y resumiremos brevemente sus similitudes y diferencias.

Primero, el método de muestreo tradicional de dos niveles

El método de muestreo tradicional de dos niveles fue propuesto por primera vez por Hansen y Hurwitz. Se basa en la inferencia estadística tradicional y utiliza un muestreo aleatorio simple para muestrear la población por primera vez para obtener una estimación del peso de los valores observados y las unidades de respuesta. Luego selecciona aleatoriamente una submuestra de las unidades sin respuesta. investigación y obtiene el peso de la información de las unidades de no respuesta. Finalmente, los hallazgos de ambas partes se combinan para hacer inferencias y estimaciones de la población. Este método es en realidad un muestreo estratificado de dos etapas, dividido en dos estratos, a saber, la capa de respuesta y la capa de no respuesta.

Supongamos que la capacidad total es n, entre las cuales hay encuestados y no respondedores, y se selecciona aleatoriamente una muestra inicial. La capacidad de la muestra es, entre las cuales hay encuestados, y la media muestral es; es uno que no responde. Luego se extrae aleatoriamente una submuestra de la muestra con una proporción de muestreo y una media muestral de . Tasa general de respuesta, tasa general de falta de respuesta. Entonces el estimador de la media poblacional del submuestreo es: (1)

De acuerdo con la fórmula de la varianza muestral del submuestreo, podemos obtener:

(2)

donde está la varianza de la muestra y la varianza de la capa que no responde.

Se puede observar que el primer término de la varianza poblacional se ve afectado por el tamaño de la muestra inicial, mientras que el segundo término no solo se ve afectado por la proporción muestral de no encuestados. En este momento, el segundo término de la varianza es cero, lo que significa que todos los encuestados respondieron y recopilaron todos los datos, lo que equivale a un muestreo aleatorio simple con un tamaño de muestra de .

Considerando que los términos de la fórmula de varianza anterior no tienen nada que ver con la distribución muestral, se puede reescribir como:

(3)

Si el dos encuestas en submuestreo se consideran diferencia de costos, la función de costo total se puede escribir como:

(4)

Donde, es el costo unitario de la encuesta de la muestra inicial, que es

="/style/tongji.js">