Análisis de perfiles de profesionales y formación TIC utilizando Internet como fuente de datos

Abril 2020
Análisis de perfiles de profesionales y formación TIC utilizando Internet como fuente de datos Abril 2020
Análisis de perfiles de profesionales y formación TIC utilizando Internet como fuente de datos
Presentación Análisis de perfiles de profesionales y formación TIC utilizando Internet como fuente de datos. Abril 2020
Fecha publicación


El ONTSI publica la tercera edición del informe sobre Análisis de perfiles profesionales de las Tecnologías de la Información y la Comunicación (TIC), que viene elaborando desde 2015 para conocer cuál es la demanda y las habilidades de este tipo de profesionales en España. Este proyecto tiene como aspecto clave innovador la utilización de Internet como fuente de datos (IaD por el acrónimo en inglés de Internet as Datasource) y de técnicas avanzadas de análisis de datos e inteligencia artificial.

IaD es una metodología que permite servirse de Internet como fuente complementaria o sustitutiva de otras fuentes de datos estadísticos tradicionales. Lo que distingue a estos métodos de otras técnicas también orientadas a Internet, como las encuestas online, es su carácter automático, no intrusivo, pues no requiere la participación activa de terceros, y exhaustivo, pues permite la exploración completa de las fuentes sin recurrir a métodos de muestreo. Además, utilizar IaD puede proporcionar una visión rápida sobre fenómenos nuevos respecto de los que las técnicas tradicionales tienen dificultad de medir. El proyecto se completa con la aplicación de técnicas de análisis de datos y aprendizaje automático (ML por el acrónimo en inglés de Machine Learning) para detectar y caracterizar la oferta y la demanda de profesionales de las TIC. La automatización pretende evitar o minimizar las tareas de exploración o anotación manual de sitios web (de empresas, portales de empleo o catálogos oficiales de titulaciones).

El análisis de la demanda de profesionales del sector TIC se basa fundamentalmente en la detección automática de los perfiles más demandados por las empresas, a partir de la información disponible principalmente en portales de empleo. En las ediciones anteriores, en los años 2015 y 2016, la fuente de información fue la descarga diarias de las ofertas de empleo publicadas en los sitios web 'Infojobs', 'Infoempleo' y 'Tecnoempleo'. A partir de 2019, solo se ha podido contar con la colaboración e información del portal Tecnoempleo.

La identificación de perfiles se realiza de forma automática a partir de las ofertas de empleo, esto es, con una mínima intervención manual. Como tipos de técnicas de IA, se ha empleado PLN para preprocesado y homogeneización de la representación de las ofertas / titulaciones; técnicas de clasificación basada en descripciones, para la asignación de ofertas a CNO y ESCO; y técnicas de modelado de tópicos para la extracción de los perfiles: modelado convencional, dinámico (temporal) y jerárquico. A estos efectos, un perfil se caracteriza a partir de un conjunto de términos (habilidades, técnicas o conocimientos específicos) que suelen aparecer conjuntamente en las ofertas de empleo.

Como resultado final, se proporciona una herramienta de Inteligencia de Negocio que permite visualizar y explotar todos los metadatos disponibles en los portales de empleo, y visualizar las relaciones entre los perfiles detectados, la evolución a lo largo de tiempo, las categorías profesionales de ocupación (códigos CNO y ESCO) más demandadas, los rangos salariales, la perspectiva de género, la demanda por CCAA y por provincias, la experiencia y titulación requerida, el tipo de contrato que se ofrece y el tiempo que la oferta permanece publicada en el portal.

Esta herramienta de visualización se encuentra disponible en la siguiente URL http://iad.ontsi.es/perfilestic2020/index.html