CCTV News: El 17 de mayo, el reportero aprendió de la Conferencia de Desarrollo de Seguridad de Datos de 2025 que mi país cultivará y expandirá una serie de empresas ascendentes y aguas abajo en la cadena de la industria del factor de datos. Se estima que para 2030, la escala de la industria de datos de mi país alcanzará 7.5 billones de yuanes.
como el primer país mundial que incluye los datos de producción en los datos de la producción, mi país ha acumulado inicialmente. Los datos muestran que en 2024, la producción de datos anual de mi país alcanzó 41.06 Zetes, un aumento interanual del 25%. Hasta ahora, hay más de 190,000 empresas relacionadas en el campo de datos de mi país, y la escala de la industria de datos supera los 2 billones de yuanes. Basado en la tasa de crecimiento anual de más del 20%, la escala de la industria de datos de mi país alcanzará 7.5 billones de yuanes en 2030.
Liu Liehong, director de la Administración Nacional de Datos, dijo que actualmente planea construir una construcción horizontal, vertical y coordinada y fuerte del sistema de infraestructura de datos, y básicamente construir la estructura principal de la infraestructura de datos nacional para 2029.
El intercambio abierto de datos públicos se ha convertido en un importante ruptura en la comercialización de los elementos de datos. En 2024, el número de plataformas abiertas de datos públicos locales en el nivel municipal o por encima de todo el país aumentó en un 7,5%, el número de datos abiertos aumentó en un 7,1%y el número de conjuntos de datos de alta calidad aumentó en un 27,4%interanual. En términos de la integración de elementos de datos e industrias, el país está acelerando las barreras de apertura para el intercambio de datos públicos, promoviendo la profunda integración de datos públicos y datos empresariales, y activa un "datos de sueño" masivos.
Conjuntos de datos de alta calidad para acelerar el desarrollo de inteligencia artificial
En la actualidad, los datos han superado los factores de producción tradicionales y se han convertido en la fuerza impulsora central para los avances en la tecnología de inteligencia artificial y la transformación industrial. Los conjuntos de datos de alta calidad no son solo la piedra angular del salto en el rendimiento del modelo de inteligencia artificial, sino que también remodelan toda la cadena industrial desde la investigación y el desarrollo tecnológico hasta la implementación comercial. Entonces, ¿cómo se construyen los conjuntos de datos de alta calidad?
El personal técnico dijo a los periodistas que construir grandes conjuntos de datos de modelos incluye principalmente enlaces principales como recopilación de datos, limpieza de datos, anotación de datos y evaluación de calidad. Cada enlace necesita llevar a cabo investigaciones técnicas y adaptación específicas basadas en las características de la diversidad a gran escala, suficiente diversidad y fuertes atributos verticales de la industria.
La anotación y la limpieza de datos son enlaces clave en la construcción de conjuntos de datos de alta calidad. La anotación de datos enseña inteligencia artificial a "cognizar el mundo" al "etiquetar" (como etiquetar "gatos" y "perros" para fotos). Los datos no etiquetados son como libros de texto confusos, lo que resulta en la incapacidad de la inteligencia artificial para aprender de manera efectiva; La limpieza de datos purifica los datos eliminando los duplicados y la corrección de errores, y los datos caóticos afectarán directamente la efectividad de la capacitación de inteligencia artificial.
El valor de salida de la industria de etiquetado de datos de mi país excede los 8 mil millones
Se puede ver que el etiquetado de datos es un enlace clave en la construcción de conjuntos de datos de alta calidad. Entonces, ¿cuál es el desarrollo de las industrias relacionadas de mi país? El "Informe de investigación del conjunto de datos de alta calidad 2025" publicado por la Conferencia de Desarrollo de Seguridad de Datos de 2025 muestra que con la iteración de la inteligencia artificial y la tecnología de modelos a gran escala, el valor de salida de la industria de etiquetado de datos de mi país ha superado los 8 mil millones de yuanes y la construcción de datos de alta calidad ha entrado en una nueva etapa de desarrollo a gran escala y estandarizado.