Investigación sobre algoritmos de comprensión de contenidos

Después de varios años de expansión, ya sea por el difícil camino de los cuatro tigres de la IA para salir a bolsa, el regreso de los vicepresidentes de las principales empresas de Internet al mundo académico o la congelación de la contratación de personal algorítmico, la popularidad de los algoritmos ha disminuido rápidamente. También está el impacto del deterioro de la situación económica general, que también está relacionado con el límite superior de las capacidades propias del algoritmo. En diversas tareas de aprendizaje, el rendimiento del algoritmo entra gradualmente en un cuello de botella y el gradiente para mejorar el efecto de las tareas generales disminuye gradualmente. El progreso efectivo depende de datos y parámetros de modelos a escala extremadamente grande. Tomando como ejemplo las tareas generales de representación semántica, el costo de completar un modelo de preformación a muy gran escala alcanza varios millones de yuanes, lo que limita en gran medida las oportunidades de participación de las pequeñas y medianas empresas.

En términos de aplicaciones comerciales, después de varios años de construcción continua y resultados de varias funciones, los algoritmos de comprensión de contenido correspondientes a diferentes direcciones de dependencia comercial se han vuelto relativamente maduros en aplicación y efecto, y hay pocas oportunidades para trae sorpresas. En este caso, como función de soporte de back-end, resulta muy importante identificar y profundizar continuamente la función de los algoritmos de comprensión de contenidos. Este artículo intenta analizar el estado de supervivencia de la comprensión de contenidos desde una perspectiva de valores, explorar las posibilidades de desarrollo futuro y proporcionar algunas explicaciones menos rigurosas sobre los métodos de afrontamiento de los empleados.

Siempre hemos definido los algoritmos de comprensión de contenidos como una panacea empresarial que se puede conectar y desconectar en cualquier momento y en cualquier lugar. Desde cooperar con productores de contenido para brindar consejos creativos, ayudar a los operadores con análisis de calidad, protección de derechos de autor y búsquedas similares, ayudar a los algoritmos de búsqueda a mejorar la eficiencia de las consultas de cola larga, ayudar a los algoritmos de recomendación a proporcionar características semánticas detalladas como etiquetas y bloquear comentarios negativos de consumidores Mismo tipo de contenido (como pornografía suave, celebridades repugnantes y que no gustan). Por lo tanto, naturalmente definimos la misión del algoritmo de comprensión de contenido como "mejorar la calidad y eficiencia de todo el enlace del flujo de contenido", donde la calidad incluye la eliminación determinista de contenido inferior y la recomendación de alta calidad sin prueba o de alta exposición. contenido. La eficiencia se refiere a optimizar el tiempo desde la producción hasta el consumo de contenido para que sea el más rápido, incluida la detección rápida de contenido a través de operaciones colaborativas y la coincidencia precisa de personas y contenido con algoritmos de distribución auxiliares.

Lo que hay que responder aquí es, basándose en las capacidades relativamente completas anteriores, ¿cuál es el valor central que puede proporcionar el algoritmo de comprensión de contenido?

La primera es la definición de cliente. El cliente del algoritmo de comprensión de contenidos no es el operador, ni el algoritmo de distribución, ni el productor, ni el consumidor. En cambio, debemos volver al “contenido” original para maximizar el valor agregado del contenido.

En segundo lugar, los roles involucrados en cada enlace de circulación de contenido conllevan el valor del algoritmo de comprensión del contenido, ya sea la realización de la voluntad de la plataforma liderada por las operaciones, la combinación eficiente de contenido y consumidores por parte de la distribución. algoritmo, o la producción Los autores y los consumidores tienen demandas de contenido que comprenden los algoritmos desde dos aspectos: el suministro y el consumo de contenido, respectivamente.

Finalmente, el contenido en sí es un soporte detrás del cual se encuentra la representación que la gente hace del mundo real. El nivel de plataforma tiene la lógica de acceder a contenidos bajo demanda, y los consumidores también tienen derecho a votar con los pies. El algoritmo de comprensión de contenido aquí no debe considerarse como una inclinación propia. El valor central de la comprensión de contenido es la producción de capacidades diversificadas en función de las demandas comerciales. De lo contrario, la simple aplicación del modelo de código abierto desde el mundo académico puede acumular capacidades comerciales superficiales, que obviamente no pueden satisfacer las necesidades del crecimiento empresarial.

Por lo tanto, podemos formar una definición de valor: "El valor central del algoritmo de comprensión de contenido es proporcionar capacidades de comprensión inteligentes y estructuradas basadas en las diversas demandas del negocio de servicios en todo el ciclo de vida del contenido. estándares de medición Es la mejora adicional de la eficiencia y la reducción de costos que aportan las capacidades anteriores”.

A partir de esta definición, el algoritmo de comprensión del contenido no parece estar en el frente principal y su valor se calcula implícitamente. No precisamente. Al igual que en una guerra, solo unas pocas tropas avanzan. Las tropas responsables de la defensa y las tareas auxiliares son en realidad indispensables, lo que a menudo determina la dirección de la guerra. Hay muchos ejemplos en la historia de guerras que cambiaron debido a problemas de apoyo logístico. Al igual que la mejora de la eficiencia en la definición, en realidad no es un método de un voto. Debido a que la mejora de la eficiencia aumentará la escala de proveedores y consumidores, también creará una mayor demanda para la mejora de la eficiencia de los algoritmos de comprensión de contenidos. Este enlace de retroalimentación positiva también es una forma importante para que los servicios de contenido alcancen rápidamente los objetivos establecidos.

Primero, el juego de valoración

A juzgar por la valoración de Xiaohongshu en 2021, la comunidad de contenido con 60 millones de DAU y 47 minutos per cápita fue valorada en 20 mil millones de dólares. de reconocimiento. Esta es la altura que una comunidad de contenido temprana puede alcanzar después de un largo período de crecimiento. Considerando un negocio de contenidos relativamente innovador, en realidad es muy difícil alcanzar los 50 millones de DAU en dos o tres años, con una media de 5 minutos por persona. Según la lógica de la evaluación comparativa de Xiaohongshu, el límite superior de valoración es de 3.000 millones de dólares. Suponiendo que la tasa de contribución de los algoritmos de comprensión de contenidos al negocio se descuenta por 3, la valoración estimada de la comprensión de contenidos es de 90 millones de dólares. Basado en una tasa de marketing simple de 10 veces, los ingresos anuales por comprensión de contenido son de 9 millones de dólares (según la valoración,

9 millones de dólares es una cifra muy vergonzosa, porque el costo de los algoritmos de comprensión de contenido es relativamente alto Desde una perspectiva grande, el gasto del algoritmo de comprensión del contenido se divide en tres partes. La primera parte es el personal del algoritmo, que es calculado por el equipo de soporte de 15 personas (parece un poco excesivo, pero no es suficiente). para soportar el crecimiento esperado en el futuro, y 15 personas no son suficientes según una persona). El costo del pago anual es 65,438 La segunda parte es el consumo de recursos Basado en la escala de un millón de contenidos por día, el costo de varios. los recursos (incluidas máquinas, almacenamiento, software auxiliar, etc.) son de aproximadamente 5 millones de dólares al año. La tercera parte es para apoyar a los ingenieros, gerentes de productos, soporte de etiquetado subcontratado, etc. Esta porción es de aproximadamente $6,543,850 por año. Se puede ver que en la etapa actual de desarrollo empresarial, los algoritmos de comprensión de contenidos son insuficientes.

Según el calibre anterior, los métodos centrales para mejorar el valor de la comprensión del contenido incluyen tres direcciones. Primero, un aumento en el valor de la empresa requiere un crecimiento constante en la DAU y la duración de la empresa. En segundo lugar, ha aumentado la tasa de contribución comercial de los algoritmos de comprensión de contenidos. Los requisitos para los algoritmos de comprensión de contenido aquí son relativamente altos, no solo desde la calidad del contenido, la asistencia de los productores, la eficiencia del tráfico de distribución, la ecología general del negocio, sino también la comercialización del negocio. El tercero es reducir costos. La viabilidad de esta carretera es débil. Por el contrario, a medida que el negocio crezca, el consumo de costos aumentará aún más. Lo que podemos hacer es controlar la tasa de crecimiento de los costos por debajo de la tasa de crecimiento del negocio.

“Medir el valor de los algoritmos de comprensión del contenido en las primeras etapas del desarrollo empresarial en función de la contribución empresarial no es optimista”.

En segundo lugar, la remodelación del valor

La primera perspectiva es la medición del valor en un negocio de circuito cerrado, que está abierta a una perspectiva más amplia. La razón por la que el algoritmo de comprensión de contenidos constituye una unidad funcional relativamente independiente es que las capacidades que proporciona son relativamente universales. Por ejemplo, el algoritmo de reconocimiento de etiquetas se puede utilizar no solo para Xiaohongshu, sino también para empresas de contenido como Tik Tok y Aauto.

Por lo tanto, en el proceso de respaldar negocios específicos, precipitar un algoritmo general para generar el valor de otros negocios similares es otra puerta para los algoritmos de comprensión del contenido. Otro problema que enfrentamos aquí es que si se trata de un comerciante líder, debe exigir que el algoritmo de comprensión de contenido se personalice para él, y el precio que los pequeños y medianos comerciantes están dispuestos a pagar por el algoritmo de comprensión de contenido es limitado. La solución principal a este problema es proporcionar las capacidades más versátiles al personalizar las capacidades comerciales principales y lograr un apilamiento de orden de magnitud formando una producción de valor para una gran cantidad de pequeñas y medianas empresas.

Además, para distinguir las empresas maduras de las innovadoras, para las empresas maduras, la ligera mejora del negocio mediante el algoritmo de comprensión del contenido puede ser muy obvia. Tomando la plataforma JD.COM como ejemplo, si el algoritmo de comprensión de contenido mejora las transacciones comerciales en un 0,1 mediante la búsqueda de imágenes o el reconocimiento de párrafos, agregará cientos de millones de yuanes en valor cada año. Para las empresas innovadoras, los algoritmos de comprensión del contenido deben profundizar en el negocio, proporcionar capacidades fundamentales para el negocio desde todo el ciclo de vida del contenido, ayudar al negocio a lograr una mejora significativa en el sentido físico de los productores y consumidores y, en última instancia, brindar crecimiento de retroalimentación positiva para el negocio. En sus inicios, Tik Tok confió en su fantástico sistema de efectos especiales de IA para lograr un rápido crecimiento en la escala de usuarios.

“La forma efectiva actual de amplificar el valor de los algoritmos de comprensión de contenido es acumular capacidades de generalización en el proceso de atender personalmente al negocio principal y generar tantos servicios del mismo tipo como sea posible. hacer crecer el negocio para empresas maduras Para identificar algunos puntos de crecimiento, las empresas innovadoras buscan capacidades básicas adecuadas para un rápido crecimiento empresarial.

Como veterano en algoritmos de comprensión de contenido durante seis años, soy cautelosamente optimista sobre el futuro de los algoritmos de comprensión de contenido. En primer lugar, el espacio para la mejora de los algoritmos generado por esta ronda de análisis profundo. el aprendizaje ha cambiado. En segundo lugar, después de que los usuarios de Internet entren en la era de las acciones, el contenido que tienen en la cabeza se volverá más intensivo, desde la búsqueda de la eficiencia hasta el refinamiento y el mantenimiento estricto de las operaciones. En tercer lugar, esperamos con ansias la próxima generación de modelos de consumo de contenido; que pueden surgir en el futuro.

Primero, el margen para mejorar los algoritmos es relativamente limitado

En los últimos años, la evolución de los algoritmos de comprensión de contenidos se puede dividir en tres direcciones. Una es la actualización de funciones manuales tradicionales a funciones de redes neuronales. A través de big data y potencia informática, el efecto se ha mejorado significativamente y el umbral de entrada para el personal de algoritmos se ha mejorado considerablemente. de un modo único a uno multimodal; capacidades de razonamiento intermodal basadas en redes neuronales gráficas: nuevamente, aprendizaje de modelos extremadamente para datos a gran escala, es decir, un método de representación de contenido unificado basado en modelos pre-entrenados a gran escala. ha dado lugar al crecimiento continuo de la familia Transformers.

Sin embargo, el rendimiento del algoritmo se está acercando gradualmente al cuello de botella en la lectura de imágenes y las tareas algorítmicas como el análisis y el reconocimiento de etiquetas todavía están muy por detrás de los humanos. Y no parece haber una oportunidad clara para lograr avances en esta distancia en el corto plazo. Por el contrario, la industria ha comenzado a pasar del aprendizaje supervisado al aprendizaje no supervisado, tratando de utilizar datos masivos para aprender los principios subyacentes. desviándose de la capacidad de alcanzar a los humanos.

Tome Transformer como ejemplo. El entrenamiento de decenas de miles de millones de datos consume cientos de GPU a la vez y se necesitan varias semanas para lograr resultados significativos. La mejora no incluye el frustrante costo de tiempo de ajustar la red. Además, si las tareas posteriores quieren lograr los resultados esperados, se requiere más aprendizaje por transferencia, lo que solo proporciona una mejor manera de aprender algoritmos. punto de partida.

Hemos pasado por un proceso de cooperación, en el que el negocio está esperando que nos volvamos más racionales. Los algoritmos de IA nunca son salvadores, sino herramientas más productivas. Al menos en los últimos años, el floreciente sistema de algoritmos ha provocado una gran disminución en el umbral de entrada para los profesionales. La amplia comprensión del público sobre los algoritmos de IA también ha contribuido a la vitalidad y el crecimiento a largo plazo de los algoritmos de comprensión de contenidos. /p>

2. El modelo operativo de las comunidades de contenidos en la era de los usuarios existentes

El uso de Internet en China significa que los principales proveedores de contenidos deben entrar en la etapa de los usuarios existentes. El dilema al que se enfrentan. El crecimiento detrás de las operaciones refinadas es una disminución en la demanda de eficiencia, reemplazada por paciencia. mentes de los usuarios y tácticas a largo plazo. En este caso, el algoritmo de comprensión del contenido se convertirá en un punto de apoyo funcional disperso entre muchas listas de requisitos comerciales, y las oportunidades de independencia disminuirán

“Desde la perspectiva. El aprendizaje de algoritmos, la creación humana, el diseño del juego y los atributos de interacción son el techo real sobre el terreno, por lo que es relativamente razonable mantener los atributos de la herramienta actual. ”

En tercer lugar, la próxima generación de modelo de consumo de contenido

El consumo de contenido en la era de Internet ha experimentado una actualización del texto a la imagen y al video. El resultado detrás de cada actualización del consumo de contenido. Todo explotó en algoritmos de comprensión de contenido. Entonces, ¿cuál es el modelo de consumo de contenido de próxima generación?

La industria está apostando actualmente por Metaverse, y Facebook incluso ha cambiado su nombre a Meta. En algunos sitios web para adultos en línea y dispositivos de juegos fuera de línea, no hay suficiente producción para subvertir nuestra vida diaria.

Los seres humanos obviamente necesitan percibir el entorno externo en un nivel superior. Otros interactúan sin diferencias en el tiempo y el espacio. pero se desconoce si es transportado por el "metaverso". Si el metaverso se utiliza como portador, entonces se desconocen el reconocimiento emocional, la generación táctil, la interacción natural y la salud ecológica bajo el consumo de contenido a gran escala en el mundo virtual. La gestión y la reducción de carga serán una nueva área que los algoritmos de comprensión de contenidos pueden intentar conquistar y profundizar, y también asumirán un papel más central.

“El modelo de consumo de comprensión de contenidos de próxima generación tiene la oportunidad de convertirse en el próximo campo de batalla principal para la comprensión de contenidos, pero la situación actual no está clara y debemos ser pacientes y esperar y ver”.

En cuarto lugar, otras posibilidades

Deje de lado a los principales fabricantes integrales de IA, como Baidu, Tencent, Alibaba, Huawei y otras empresas, como el primer polo para satisfacer las diversas necesidades de comprensión de contenidos. También está el algoritmo de comprensión de contenido como el segundo polo de la producción de capacidades de la plataforma. Los más famosos son los cuatro tigres de IA (SenseTime, Megvii, Yitu y Congyun), así como la producción de capacidades de IA industrial que integra profundamente varios campos de. el sustento de las personas.

La IA médica resuelve el problema de los recursos médicos insuficientes que no pueden satisfacer las necesidades médicas y el largo tiempo de consulta manual. Un caso típico es el protocolo de crowdsourcing COVID-19-Moonshot, en el que participan más de 500 científicos internacionales y tiene como objetivo acelerar el desarrollo de medicamentos antivirales contra la COVID-19.

La IA educativa soluciona la distribución injusta provocada por la falta de recursos educativos de alta calidad y la información asimétrica entre profesores y alumnos. Aunque el país está impulsando una nueva política de doble reducción en educación, la educación, como derecho individual básico, debería cumplirse mejor. Las empresas conocidas incluyen Squirrel AI, Yuanfudao, etc.

La IA de fabricación resuelve problemas como el aumento de equipos, cantidad y funciones, dificultades de programación y distribución y demanda personalizada por el lado de la demanda. Mediante el uso de IA, automatización, IoT, computación de punta, nube, 5G y otros medios, podemos aprovechar al máximo los datos de valor masivo en el taller de producción para liberar a las personas del trabajo simple y repetitivo y participar en tareas de nivel superior, ayudando a aumentar la producción y reducir los costos. Algunas empresas reconocidas que son innovadoras e innovadoras en inteligencia artificial industrial cotizan en Hong Kong.

Además, hay varias empresas que han estado trabajando duro en conducción inteligente, ciudades inteligentes, inteligencia artificial con chips y otros campos industriales. Están aprovechando al máximo las capacidades de los big data y los algoritmos de inteligencia artificial para llevar infinitas capacidades de innovación a las principales industrias.

Volviendo al entorno actual de algoritmos de comprensión de contenidos, todavía existe cierto potencial que se puede aprovechar. Antes de la llegada de la próxima generación de consumo de contenidos, podemos hacerlo mejor, formar un vínculo positivo con las corrientes ascendentes y descendentes y mostrar un mejor estilo en el escenario actual.

1. Producto

Es un poco controvertido si el producto del algoritmo de comprensión del contenido es estrictamente necesario. Algunas personas dicen que la velocidad de salida del algoritmo es relativamente lenta y que sería un desperdicio involucrar roles de productos costosos en la construcción misma. Personalmente, creo que el rol del producto correspondiente al algoritmo de comprensión de contenido es imprescindible, porque detrás del enorme sistema empresarial, si no existe un diseño y una construcción de arriba hacia abajo del sistema de algoritmo de comprensión de contenido orientado a las necesidades comerciales, es muy fácil desacostumbrarse al empoderamiento empresarial.

La cuestión central que los productos deben considerar es cómo medir la inversión a largo y corto plazo. Los algoritmos son un trabajo delicado y las expectativas de resultados son inciertas. Por lo tanto, las expectativas comerciales deben gestionarse e interactuar con los requisitos comerciales de manera oportuna. Para garantizar el efecto de uso final del algoritmo en los negocios, se puede realizar una prueba y error rápidos en la etapa inicial simplificando la versión o la solución del producto del algoritmo semiacabado, lo cual es útil para la toma de decisiones comerciales y gana. espacio para la iteración a largo plazo del algoritmo. Además, es necesario diseñar un mecanismo eficaz de reflujo de datos de muestra para la iteración a largo plazo del algoritmo, generar tantos métodos de prueba y error como sea posible para la empresa a través de la configuración y monitorear en tiempo real los efectos una vez que la empresa se pone en uso. todas las tareas en las que el producto necesita pensar.

2. Operación

La operación debe ser la parte involucrada con mayor frecuencia en el algoritmo de comprensión del contenido. Los criterios de evaluación y la adaptación comercial del algoritmo de comprensión del contenido requieren operaciones para construir y monitorear. El algoritmo de comprensión de contenido es un asistente inteligente para el funcionamiento de la ecología de suministro de contenido y la ecología de consumo. Proporciona y opera varios métodos de análisis y uso desde la perspectiva de etiquetas estructuradas de contenido, como revisión de contenido, selección de círculo de contenido, selección de grupo de contenido. , etc.

Las operaciones de procesamiento imponen altas exigencias a los algoritmos de comprensión del contenido, y es fundamental saber medir rápidamente la racionalidad y viabilidad de los requisitos. A veces, se invierte demasiado en el algoritmo de comprensión del contenido, lo que genera malos resultados en línea y afecta el desarrollo empresarial. A veces hay una falta de confianza en la implementación del algoritmo, o una falta de influencia en el uso de producción, lo que resulta en el rechazo de los requisitos, lo que hace que la empresa pierda valiosas oportunidades de prueba y error.

Por lo tanto, los algoritmos de comprensión de contenido deben comprender bien los enlaces de las operaciones de contenido, ser capaces de definir capacidades de algoritmos de enlace completo junto con las operaciones y promover el desarrollo razonable y ordenado de los requisitos del algoritmo desde la perspectiva de la aplicación.

En tercer lugar, los productores

Los productores son muy importantes para la plataforma y una mujer experta no puede preparar una comida sin paja. No importa cuán poderosos sean los algoritmos de operación y distribución, sin fuentes de producción de contenido de alta calidad, el negocio no puede seguir creciendo. En circunstancias normales, 2.000 productores de alta calidad más decenas de miles de productores ordinarios pueden sustentar un negocio de decenas de millones de DAU. Cómo servir bien a estos productores es muy importante para la plataforma.

En la actualidad, la interacción entre los algoritmos de comprensión de contenidos y los productores incluye principalmente varios aspectos. Una es la recomendación inteligente de elementos de contenido por parte del productor durante el proceso de producción del contenido, como temas, títulos, recomendaciones de bandas sonoras, etc. El segundo es mejorar el efecto de visualización del contenido, como filtros, pegatinas, belleza, mejora de la calidad de la imagen, etc. El tercero es guiar y controlar a los productores desde un nivel de calidad, incluidas las razones por las cuales la plataforma no adopta el contenido entregado a los productores desde una perspectiva comercial, listas de consumo de contenido de moda, protección de derechos de autor del contenido, etc.

Desde la perspectiva del productor, obtener la mayor cantidad de tráfico o valor comercial de la plataforma es la búsqueda fundamental, por lo que a menudo hay exploraciones constantes de las reglas de la plataforma para obtener beneficios, como publicar una gran cantidad de contenido lateral. proyectos o contenidos alarmistas. Los algoritmos de comprensión del contenido deben ayudar a la plataforma a mantener una ecología saludable y una distribución efectiva del tráfico a medida que aumenta la escala del suministro de contenido, al mismo tiempo que brindan a los productores la mayor orientación posible. Esta relación de lucha mutua también plantea desafíos considerables y espacio vital para el algoritmo de comprensión del contenido.

Cuarto, algoritmo de distribución y consumidor

La lógica central de unir el algoritmo de distribución y el consumidor es que el algoritmo de comprensión del contenido debe pasar por el algoritmo de distribución y el consumidor en la mayoría de los casos. Desde la perspectiva de los consumidores, los usuarios muy activos representan la mentalidad dominante, y cómo servir bien a este grupo está relacionado con la supervivencia de las empresas. Los usuarios activos medios y bajos son el incremento de la plataforma, y ​​fortalecer continuamente la rigidez de la plataforma de estos usuarios es una tarea clave (algunos usuarios huirán aquí y, para mantener la cordura de la plataforma, esta parte del sacrificio es aceptable). ). El algoritmo de distribución asume la misión de recomendar contenido masivo en función de los intereses a corto y largo plazo de los usuarios tras la reducción de carga. El algoritmo de distribución debe adherirse a la voluntad de la plataforma y utilizarse para la distribución del tráfico de contenido para influir en los sentimientos físicos y mentales de los consumidores y aportar una vitalidad infinita a la plataforma.

En el modelo inicial de distribución de contenido basado en editoriales, los consumidores eran los que recibían educación: podían ver muy poco contenido nuevo en un día, lo que resultaba en una profundidad y duración de navegación limitadas. En el modo de recomendación personalizada, los intereses de los usuarios se amplifican enormemente. Debido al rápido impulso de contenido relevante y nuevo, los consumidores sentirán una fuerte sensación de consumo inmersivo. Sin embargo, la diversidad de contenidos, el mantenimiento continuo de las percepciones de los consumidores y la expansión de los intereses se han vuelto muy importantes, lo que impone grandes exigencias a la precisión de los algoritmos de distribución. Proporcionar capacidades de reconocimiento detalladas para los algoritmos de distribución es una oportunidad para que los algoritmos de comprensión de contenidos muestren sus talentos. ¿Tiene el contenido un buen potencial de distribución para aumentar el tráfico de distribución? ¿Para qué audiencia es adecuado el contenido? ¿Cuáles son los intereses centrales detrás de la navegación desordenada de los usuarios? Cuestiones como la pornografía blanda o cómo identificar con precisión el contenido que a algunas personas no les gusta (mascotas serpientes) para la supervisión de la distribución son difíciles de abordar para los algoritmos de distribución. Estas proposiciones son aspectos importantes en los que los algoritmos de comprensión de contenidos pueden profundizar e influir en la distribución y el consumo de contenidos.

Excepto en escenarios específicos (como juegos interactivos, imágenes de portada personalizadas, etc.), el algoritmo de comprensión del contenido debe cumplir con la amplitud de su participación en el ciclo de vida del contenido. Cuando se trata de distribución y consumo de contenido, los algoritmos de comprensión de contenido deberían definirse como un complemento indispensable del algoritmo de distribución, en lugar de intentar reemplazarlo. Desde la perspectiva de los algoritmos de comprensión del contenido, el algoritmo de distribución puede ser aproximadamente igual al del consumidor. Tomando como ejemplo las operaciones de un restaurante, el algoritmo de entrega es chef, que proporciona servicios de catering personalizados basados ​​en los gustos, ingredientes y recetas de los consumidores. Los algoritmos de comprensión de contenido pueden controlar la calidad de los ingredientes, desarrollar nuevas recetas y proporcionar platos semiacabados cuando sea necesario. La interacción con los consumidores está a cargo del algoritmo de distribución.

Después de todo, existen especialidades en la industria, y los algoritmos de comprensión de contenido pueden proporcionar una comprensión vertical profunda del contenido y los conocimientos del consumidor, brindando más posibilidades, incluida la ecología, la diversidad, la preservación del contenido, etc.

El estado ideal del algoritmo de comprensión de contenido y del algoritmo de distribución es un juego de suma positiva, y un juego de suma cero no tiene sentido para ambas partes. Por lo tanto, los requisitos adicionales para el algoritmo de comprensión de contenido aquí son establecer un sistema de evaluación relativamente objetivo en el escenario de consumo de contenido, acelerar el proceso en línea mediante una evaluación estandarizada del algoritmo y proporcionar más armas y municiones para el algoritmo de distribución mediante pruebas rápidas y continuas. y error.

Ingeniería verbal (abreviatura de verbo); análisis de datos

Un héroe tiene tres bandas y un grupo de amigos respalda el algoritmo de comprensión del contenido. La infraestructura de ingeniería a gran escala para la producción de algoritmos y las capacidades de análisis de datos de la información sobre algoritmos pueden ayudar a que los algoritmos de comprensión del contenido se desarrollen mejor. En la era actual de crecimiento explosivo del contenido, un sistema de ingeniería de algoritmos eficiente es muy crítico e incluso es uno de los medios más importantes para ampliar la brecha entre diferentes empresas. Hay un ejemplo muy obvio. En varias competiciones de algoritmos organizadas por la industria, siempre que participen las grandes empresas de Internet, básicamente dominarán la lista. Detrás de esto está la fuerte ventaja de ser el primero en actuar en la eficiencia del entrenamiento de modelos. Hay muy pocas universidades con capacidades de capacitación simultánea de GPU de nivel 100. Además, tomando la función general de recuperación de vectores como ejemplo, se requiere una gran cantidad de métodos de optimización de ingeniería para operar de manera estable decenas de miles de millones de capacidades de indexación de vectores con potencia de cálculo y consumo de memoria limitados, y esta función es muy importante para el uso eficiente. del algoritmo.

El análisis de datos tiene muchas aplicaciones para los algoritmos de comprensión de contenidos. Con base en el comportamiento estadístico del consumo, cree retratos de usuarios orientados a los intereses del contenido, proporcione el viento y la dirección de la tendencia del consumo de contenido, afiliaciones razonables de etiquetas de contenido acopladas jerárquicamente, análisis de efectividad antes de que se lance el algoritmo, monitoreo continuo y alarma anormal después del algoritmo. se lanza.

Lo que debe hacer el algoritmo de comprensión de contenido es llevar a cabo un diseño de arquitectura completo para el campo empresarial. Desde la perspectiva de la eficiencia del algoritmo, incluye proyectos de vinculación en términos de eficiencia del servicio del algoritmo, perspectiva de conocimiento del algoritmo. etc.; el análisis de datos proporciona una productividad poderosa, a través de la escala y el espesor del sistema, construye umbrales técnicos suficientes.

2021 es un año diferente para Internet chino e incluso para la sociedad china. Con la crisis económica mundial y la construcción de barreras artificiales entre países, acabamos de encontrarnos con un crecimiento demográfico interno estancado, un fuerte control estatal sobre las plataformas de Internet y una penetración máxima de los usuarios de Internet.

El sistema de algoritmos de IA detrás del algoritmo de comprensión de contenido también ha sufrido algunos reveses, pero en general, el sistema de algoritmos de IA y la industrialización siguen avanzando. En los sistemas teóricos básicos de RD, aumentó el número de artículos publicados, conferencias realizadas, concursos realizados y participantes. La fría recepción de los últimos dos años se debe principalmente al impacto del entorno del mercado, y la proporción de la IA en la inversión total sigue aumentando. A nivel interno, el bloqueo tecnológico de la economía global ha fortalecido aún más la determinación y la confianza de China en la innovación independiente. El "14º Plan Quinquenal" de China ha propuesto claramente planes de desarrollo industrial para big data, inteligencia artificial y VR/AR. La industria de la IA todavía tiene un gran potencial que merece ser aprovechado.

Como algoritmo de comprensión de contenido dependiente del negocio, requiere una autocomprensión y un posicionamiento claros. ¿Cuáles son nuestros valores fundamentales? ¿Cómo definir y cuantificar eficazmente? Como uno de los muchos roles que sirven al negocio, ¿cómo interactúa bien con otros roles? Las respuestas detrás de las preguntas anteriores representan el papel central de los algoritmos de comprensión de contenido. Ahora existe una tendencia especulativa en el campo de los algoritmos, y hacen todo lo que es popular, como el aprendizaje no supervisado que afirma no requerir anotación de datos, el aprendizaje de muestras pequeñas que puede comparar eficazmente una gran cantidad de muestras etiquetadas y el aprendizaje multimodal. predicción que afirma que un único modelo de algoritmo puede extenderse por todo el mundo. Entrenar para aprender. No hay problema si estudiamos el sistema teórico básico y el paradigma de aprendizaje de algoritmos desde la perspectiva de la abstracción y simplificación del problema, pero habrá problemas si los estudiantes de negocios también hablan sobre dichos conceptos. Hablar de tecnología para crear nuevos negocios sin las necesidades centrales del escenario empresarial es una especie de arrogancia hacia los clientes y un mecanismo típico.

Como algoritmo de comprensión de contenido para servicios profundamente integrados, las tecnologías centrales para el empoderamiento empresarial deben explorarse en función de los escenarios comerciales y la viabilidad del algoritmo.

Incluso si lleva mucho tiempo pulir una tecnología de algoritmos que pueda generar valor comercial positivo, debemos atrevernos a invertir en construcción, pensar constantemente en más posibilidades comerciales en el proceso de investigación y desarrollo de algoritmos y transformar gradualmente la incertidumbre empresarial en incertidumbre relativa en Certeza. Para los algoritmos que no pueden contribuir al negocio a largo plazo, debemos abandonar resueltamente la investigación en profundidad. Por supuesto, no hay ningún problema como seguimiento técnico.

A juzgar por la situación actual, el desarrollo de algoritmos de comprensión de contenidos ha encontrado algunas dificultades, pero podemos seguir siendo cautelosamente optimistas sobre el futuro y esperar la llegada de la próxima generación de modelos de consumo de contenidos. Al mismo tiempo, es necesario perfeccionar al máximo los escenarios comerciales para producir y fortalecer las capacidades, amplificar el valor comercial de las acciones existentes y hacer reservas técnicas para posibles momentos futuros mediante la construcción continua del propio algoritmo.