Pasar al contenido principal
Descubre los aspectos más significativos del proyecto
26/03/2026
FOTO GRUPO LUCIA

Barcelona acogió un nuevo encuentro del proyecto europeo LUCIA, organizado por el Centro Nacional de Análisis Genómico (CNAG), en el que el consorcio del que forma parte BILBOMÁTICA siguió avanzando en sus líneas de trabajo y coordinación. 

Espacios de datos europeos

En los proyectos europeos de investigación sanitaria, uno de los mayores retos no es solo contar con datos, sino conseguir que puedan integrarse, analizarse y aprovecharse de forma segura, interoperable y útil para la comunidad científica. Este desafío cobra todavía más importancia cuando el objetivo es estudiar factores de riesgo relacionados con el cáncer de pulmón.

En este contexto, los espacios de datos adquieren un papel clave. No se trata solo de reunir información, sino de hacerlo posible dentro de un marco que garantice calidad, trazabilidad, gobernanza, interoperabilidad y reutilización. Esa es también la lógica que impulsa los espacios de datos europeos: crear entornos donde los datos puedan compartirse y explotarse de forma responsable para generar conocimiento y valor científico.

Imagen
web lucia

Desde BILBOMÁTICA participamos en tareas clave vinculadas a la LUCIA Health Data Platform- eCRF y el Virtual Research Environment VRE). Estas piezas funcionan como una infraestructura común para almacenar datos, modelos y herramientas, y para facilitar su integración dentro de un entorno de investigación seguro y operativo.

Dentro del VRE, hemos incorporado funcionalidades de selección, filtrado y análisis comparativo, orientadas a apoyar la investigación sobre factores de riesgo asociados al cáncer de pulmón. La interfaz permite trabajar con datos prospectivos y retrospectivos, aplicar criterios clínicos y sociodemográficos, seleccionar pacientes, ejecutar modelos de inferencia y visualizar resultados agregados de forma clara para los equipos investigadores.

Entre las funcionalidades desarrolladas se incluye la comparación de distintos algoritmos de predicción de riesgo, como LCDRAT, BACH, LLPi, PLCOm2012 o LCRAT. El sistema muestra resultados por paciente, umbrales de riesgo, distribución por fases y diagramas de Venn que permiten identificar coincidencias y diferencias entre modelos.

Imagen
web lucia

Esta actividad conecta de forma directa con el enfoque de espacios de datos, cada vez más relevante en Europa. La selección de datos para el VRE no es solo una funcionalidad técnica, sino parte de una lógica más amplia de gobernanza, calidad, trazabilidad, interoperabilidad y reutilización. En este sentido, LUCIA se alinea con la evolución de los espacios de datos europeos, donde el valor no reside únicamente en almacenar información, sino en hacerla localizable, accesible, interoperable, reutilizable y explotable bajo condiciones claras de seguridad y gobernanza.

En este sentido, el valor de LUCIA no está en “mandar datos”, sino en preparar el ecosistema técnico y metodológico para que los datos puedan ser utilizados de forma segura, trazable e interoperable. La plataforma facilita la integración y explotación de datos dentro del proyecto, mientras que cualquier eventual compartición externa dependería de los propietarios de los datos, de los permisos aplicables y de los requisitos regulatorios correspondientes. 

Para que este modelo funcione, son esenciales los estándares de interoperabilidad, descripción y gobernanza del dato. En el EHDS tendrán especial relevancia el European Electronic Health Record Exchange Format (EEHRxF) para el intercambio de historia clínica electrónica, HealthDCAT-AP para describir datasets sanitarios en catálogos europeos, y estándares como HL7 FHIR, SNOMED CT, LOINC, OMOP CDM o perfiles europeos específicos para estructurar, codificar y hacer comprensibles los datos entre sistemas y países. 

En paralelo, el acceso para uso secundario no se basa en una cesión libre de datos, sino en solicitudes, permisos, contratos, finalidades autorizadas, control de accesos, entornos seguros de procesamiento y obligaciones de trazabilidad, Esta visión se apoya en infraestructuras europeas como MyHealth@EU, orientada al uso primario de los datos en la atención sanitaria transfronteriza, y HealthData@EU, centrada en el uso secundario para investigación e innovación

Estandarización y normativa 

Este desarrollo también se alinea con el marco europeo de normas y estándares para una inteligencia artificial confiable, especialmente en lo relativo a la gestión de datos y fuentes. En el contexto del AI Act, los estándares armonizados impulsados por CEN-CENELEC se plantean como una vía para demostrar conformidad con los requisitos regulatorios europeos. Aplicado al VRE, esto refuerza la importancia de trabajar con criterios claros de calidad del dato, trazabilidad, transparencia, representatividad, control de sesgos, gobernanza, seguridad y gestión del riesgo.

Imagen
proyecto lucia

Desde esta perspectiva, la selección de datos deja de ser una cuestión meramente técnica y pasa a ser una pieza esencial para garantizar que los análisis y modelos de inferencia se apoyen en fuentes adecuadas, documentadas y reutilizables dentro de un entorno científico controlado.

Además, este desarrollo se enmarca en una lógica de calidad, validación y despliegue operativo. La integración de modelos y funcionalidades dentro del VRE permite que los resultados no se queden en una fase experimental aislada, sino que puedan utilizarse en un entorno común, seguro y accesible para los socios del proyecto. 

Contexto ambiental 

La futura validación de modelos basados en factores de riesgo con datasets prospectivos refuerza todavía más la necesidad de contar con criterios sólidos de selección de datos, trazabilidad de las fuentes y mecanismos de evaluación que permitan interpretar los resultados de forma responsable y reproducible.

La experiencia de BILBOMÁTICA en plataformas TIC, interoperabilidad, integración de sistemas y gestión de datos resulta especialmente valiosa para trasladar al proyecto una visión conectada con los espacios europeos de datos. Una visión en la que el dato no solo se almacena, sino que se organiza y se pone en valor para que pueda ser compartido, comprendido y reutilizado de forma segura.

Imagen
geohealth

Otro de los componentes integrados en este ecosistema es la herramienta GIS/GeoHealth, desarrollada por el Servicio Andaluz de Salud (SAS). Su objetivo es enriquecer los registros de pacientes con información socioeconómica y ambiental a partir de la geolocalización. De este modo, el análisis de factores de riesgo puede incorporar no solo información clínica, sino también variables relacionadas con el territorio, el entorno y la exposición ambiental.

En este ámbito, el Exploratory Spatial Data Analysis (ESDA) aporta una capa adicional de análisis geoespacial al permitir explorar patrones territoriales, agrupaciones y posibles valores atípicos en los datos ambientales, sociodemográficos y clínicos. Incorporando técnicas como Anselin Local Moran’s I (LISA) y Getis-Ord hotspot analysis para estudiar tasas de cáncer de pulmón, distribución espacial de errores de modelos de machine learning y agrupaciones territoriales. Estos análisis permiten extraer conocimiento del componente espacial de los datos y utilizarlo después como entrada para modelos de IA geoespacial, reforzando la capacidad del proyecto para identificar factores de riesgo vinculados al entorno y al territorio.

Este enfoque refleja una de las grandes fortalezas de los proyectos europeos de I+D: combinar capacidades clínicas, tecnológicas, analíticas y territoriales para construir infraestructuras compartidas, reutilizables y orientadas a generar conocimiento útil. En LUCIA, la integración de datos de salud, herramientas digitales, espacios de datos y análisis geoespacial representa un paso importante hacia una investigación más contextualizada, interoperable y basada en evidencias.
 

P.D.: Publicación científica: “Comprensión de los factores de riesgo del cáncer de pulmón y evaluación de su impacto (LUCIA): protocolo para un estudio de cohorte observacional multicéntrico”

https://bmjopen.bmj.com/content/16/5/e116423

Understanding LUng Cancer risk factors and their Impact Assessment (LUCIA): protocol for multicentre observational cohort study. “… LUCIA is a multicentre, observational, longitudinal cohort study that will recruit approximately 4000 participants across four European regions: Andalusia and the Basque Country (Spain), Liège (Belgium) and Riga (Latvia)…”
 

 

Imagen
Logo unión europea

 El proyecto LUCIA recibe financiación del programa de investigación e innovación Horizon Europe de la Unión Europea en virtud del acuerdo de subvención  101096473.