Las empresas que ingresan a la industria de big data deben comprender estos seis temas_Examen de analista de datos
En relación con los datos anteriores, analicemos el significado de big data:
1) También Muchos registros aparecen en forma analógica o aparecen en forma de datos, pero se almacenan localmente. No son recursos de datos públicos y no están abiertos a los usuarios de Internet, como música, fotografías, videos, videos de vigilancia y otros materiales de audio y video. Hoy en día, estos datos no sólo son enormes en volumen, sino que también están disponibles en Internet y están abiertos a todos los usuarios de Internet en una cantidad sin precedentes. Por ejemplo, en Facebook se suben o difunden cada día 1.800 millones de fotografías, lo que constituye una enorme cantidad de datos abiertos.
2) Después de la aparición de Internet móvil, muchos sensores en los dispositivos móviles han recopilado una gran cantidad de datos sobre el comportamiento de clics de los usuarios. Se sabe que el iPhone tiene 3 sensores y Samsung tiene 6 sensores. Generan una gran cantidad de datos de clics todos los días, que son propiedad de determinadas empresas, formando una gran cantidad de datos de comportamiento del usuario.
3) Después de la aparición de mapas móviles, como Amap, Baidu y Google Maps, se genera una gran cantidad de datos de flujo. Estos datos son diferentes de los datos tradicionales que representan un atributo o. un valor métrico, pero los datos de flujo generados por estos mapas representan un comportamiento y un hábito. Después del análisis de frecuencia, estos datos de flujo generarán un enorme valor comercial. El flujo de datos generado a partir del mapa es un nuevo tipo de datos que no existía en el pasado.
4) Después de entrar en la era de las redes sociales, el comportamiento en Internet lo crean principalmente los usuarios, por lo que una gran cantidad de usuarios de Internet crean una gran cantidad de datos de comportamiento social. Estos datos son masivos e inimaginables en el pasado. Ciertos datos representan las características y personalidades de grupos específicos de personas.
5) El auge del comercio electrónico ha provocado una gran cantidad de comportamientos de transacciones en línea, que han generado una gran cantidad de datos de transacciones, incluidos comportamientos de pago, comportamientos de consulta, transporte logístico, comportamientos de compra, etc. ., lo que resulta en flujos masivos de información y datos de flujo de fondos.
6) Después de que el portal tradicional de Internet pasó a los motores de búsqueda, el comportamiento de búsqueda y las preguntas de los usuarios generaron cantidades masivas de datos. La caída de los precios unitarios de almacenamiento también ofrece posibilidades técnicas para almacenar estos datos.
Los big data a los que nos referimos ahora son diferentes de los datos tradicionales del pasado: su método de generación, soporte de almacenamiento, método de acceso, forma de expresión, características de origen, etc., son todos diferentes de los datos tradicionales. En pocas palabras, el alcance de Big Data está más cerca de los datos de características de comportamiento de un determinado grupo y de datos completos. Internet móvil y las redes sociales han generado una gran cantidad de datos de comportamiento.
La industria del big data es una industria en alza. Cualquier empresa o individuo que quiera ingresar a esta industria debe pensar primero en las siguientes cuestiones.
1¿Dónde están los datos?
2¿Qué son los datos útiles?
3¿Cómo analizar estos datos? (Cómo convertir datos no estructurados en datos estructurados)
4. ¿Cuáles son los problemas que deben resolverse con los datos? ¿O cuáles son las opiniones que se expresan tras analizar los datos?
5¿Cómo presentar tus datos y razonamientos? (Gráficos, tablas, curvas, puntuaciones, evaluaciones, clasificaciones, calificaciones, probabilidades, modelos, etc., los big data pueden resolver el problema actual, respaldar su hipótesis o conducir a otro punto de vista desconocido)
6 Reexaminar la lógica y las fuentes de datos del análisis de datos. ¿Es posible presentar un informe de análisis de datos que pueda considerarse cuidadosamente?
Si los problemas anteriores se pueden resolver, entonces podrá ingresar a la industria real. La industria de big data de China se ha ido calentando gradualmente en los últimos años y el gobierno ha invertido mucho dinero.
La pregunta que actualmente afecta a muchas empresas de big data es ¿dónde están los datos? En la actualidad, las fuentes de big data que entendemos incluyen principalmente los siguientes aspectos:
1) Operadores de telecomunicaciones (porque brindan servicios de acceso a Internet y datos de registro de comportamiento en Internet)
2) Tres- pago de partes (datos de flujo de capital y flujo de información generados por el comportamiento de pago)
3) Plataforma de comercio electrónico (representada por Alibaba, cientos de millones de usuarios de Taobao y 2 billones de datos de comportamiento de compra en línea)
4) Plataformas sociales (datos de comportamiento en Internet generados por redes comunitarias representadas por WeChat y Weibo)
5) Plataformas de juegos electrónicos (datos generados por una gran cantidad de usuarios)
6) Los portales móviles generan una gran cantidad de datos (incluidas aplicaciones móviles, navegación, mapas, etc.)
7) Datos generados en motores de búsqueda
Además de estos big data emergentes De hecho, en la industria tradicional, debido a que muchos datos no se pueden hacer públicos ni compartir, todavía hay muchas fuentes de big data en las que no se ha centrado. Por ejemplo:
1) Datos estadísticos económicos y sociales en poder del gobierno
2) Datos de transacciones y pagos internos en la industria financiera
3) Registro médico datos en la industria médica
4) Datos de exámenes en la industria de la educación
5) Datos de logística en la industria del transporte
6) Datos sobre una gran cantidad de artículos repetidos, patentes y experimentos de investigación científica en investigación científica
7) Datos en bioingeniería, agricultura, silvicultura, ganadería, pesca, etc.
Actualmente, el gobierno es el que más invierte En la industria de big data de China, esto es algo bueno, porque en China el gobierno es el mayor Los propietarios de datos, los inversores más ricos y los participantes del mercado con más recursos. Si el gobierno puede utilizar eficazmente los datos que tiene en sus manos y, después de un análisis científico y riguroso, utilizarlos para llevar a cabo la asignación de recursos, decisiones económicas importantes, pronósticos de tendencias futuras del mercado, advertencias de riesgos económicos, gestión industrial, gestión de inversiones, gestión de gastos financieros. , etc., habrá Es propicio para el macrocontrol, la intervención tecnológica, la gestión administrativa, la asignación de recursos y la distribución de la riqueza por parte del gobierno. Al mismo tiempo, también ayudará al gobierno a mejorar su gestión de los asuntos públicos, incluido el bienestar social.
Pero descubrí que muchas industrias de big data en las que participan actualmente los gobiernos se concentran en dos áreas: la primera es construir plataformas de computación y almacenamiento en la nube, utilizando los recursos que pertenecen al gobierno y confiando en la investigación. instituciones para construir big data liderados por el gobierno. El ecosistema permite a las empresas proporcionar datos, y el gobierno ha propuesto instituciones industriales para ayudar a las empresas a analizar datos y proporcionar soluciones de big data. En pocas palabras, construimos una plataforma y un ecosistema de big data y nos involucramos en la recopilación y el desarrollo de big data.
El segundo es confiar a una empresa con tecnología de big data el uso de datos públicos en Internet y datos propiedad del gobierno para monitorear la opinión pública, comprender los temas centrales que usted valora y le preocupan, y prestar atención. al comportamiento de la opinión pública y al comportamiento de interacción social de los grupos sociales, así como al comportamiento de las transacciones de comercio electrónico regional, el comportamiento de quejas de servicios, etc. En pocas palabras, utiliza tecnología de recopilación de datos de Internet para comprender la opinión pública y sirve como información de inteligencia para ayudar al gobierno a tomar decisiones laborales.
No estoy completamente de acuerdo con ninguna de estas dos formas de participación. La primera es obviamente la participación excesiva en el mercado. El gobierno debería formular reglas para ayudar al desarrollo saludable de la industria de big data. en lugar de participar en el desarrollo de la industria como atleta. El gobierno debe formular sistemas relevantes para gestionar los datos que no pueden recopilarse ni divulgarse para proteger los intereses individuales. Al mismo tiempo, debe proporcionar apoyo financiero de I+D a las empresas de tecnología de big data y alentar a las empresas de big data a utilizar sus capacidades de I+D en tecnología para promover la industria. desarrollo y ayudar a las empresas a resolver problemas. Nunca construir un ecosistema o una plataforma industrial encomendada por el gobierno será ineficiente debido a problemas de mecanismo, provocará un desperdicio de talentos y recursos y, en última instancia, obstaculizará el desarrollo de esta industria. Aunque el segundo tipo tiene cierta importancia positiva, personalmente creo que el seguimiento de la opinión pública no puede producir un enorme valor social y económico, y los fondos invertidos no ayudarán eficazmente al desarrollo de toda la sociedad. Al contrario, limitarán algunos comportamientos empresariales razonables. En algunos aspectos, desde nuestro país, el conocimiento cultural y científico de la gente común es incompleto, y la guía de la opinión pública grupal puede no necesariamente representar la dirección correcta. Las decisiones políticas y económicas con visión de futuro a menudo provienen de líderes con visión de futuro, pensemos en las principales decisiones económicas tomadas por nuestro Primer Ministro Zhu Longji en 1998, como la reforma de las empresas estatales, la reforma financiera, la reforma de la vivienda, la reforma de la asignación de estudiantes universitarios, etc. etc., si se adoptan. Las conclusiones extraídas del seguimiento de la opinión pública no deben aplicarse porque afectan a los intereses de la mayoría de las personas. Pero son estas importantes decisiones económicas las que han desatado la vitalidad de la economía china y le han permitido mantener un rápido desarrollo durante unos 15 años.
Finalmente, resumamos este artículo. La industria del big data es la esperanza de China para el futuro y una industria emergente en el futuro. Sin embargo, las empresas que ingresan a esta industria no deben ser demasiado agresivas. y encontrar soluciones. El método de estas seis preguntas se basa en la tecnología y los datos para crear valor y ayudar e impulsar el desarrollo de las industrias tradicionales a través de la herramienta del big data. El posicionamiento del gobierno en la industria de big data debe ser claro. No debe convertirse en un participante importante en la industria. Debe comenzar desde la perspectiva de proteger la industria y la información personal y comercial, y convertirse en un legislador de la industria, un inversor en tecnología industrial. e inversor en empresas de tecnología de big data. El gobierno debe publicar los grandes datos que posee, que no involucren intereses nacionales ni privacidad personal y que puedan hacerse públicos, a fin de proporcionar terreno y sol para la industria de los grandes datos. El gobierno debería romper el monopolio de datos de las principales empresas de big data, exigir que las empresas propietarias de big data divulguen los datos disponibles públicamente y proporcionar fuentes de datos para la industria de big data con la premisa de proteger la privacidad de clientes y empresas. El gobierno puede actuar como líder tecnológico, promover la modernización tecnológica de las industrias y convertirse en un cohete impulsor para el desarrollo de la mayoría de las industrias.
Lo anterior es lo que el editor ha compartido con usted sobre las seis cuestiones que las empresas que ingresan a la industria de big data deben comprender. Para obtener más información, puede seguir a Global Ivy para compartir más información.