Loading AI tools
trabajo realizado para garantizar un acceso significativo y duradero a los datos De Wikipedia, la enciclopedia libre
La curación de datos o curaduría de datos, también comúnmente llamada por su término en inglés, data curation, es la organización e integración de datos recopilados de diversas fuentes. Implica la anotación, publicación y presentación de los datos de manera que su valor se mantenga a lo largo del tiempo y los datos permanezcan disponibles para su reutilización y conservación. La curación de datos incluye «todos los procesos necesarios para la creación, el mantenimiento y la gestión de datos controlados y basados en principios, junto con la capacidad de añadir valor a los datos».[1] En ciencia, la curación de datos puede indicar el proceso de extracción de información importante de textos científicos, como artículos de investigación de expertos, para convertirlos en un formato electrónico, como una entrada de una base de datos biológica.[2]
En la era moderna de los macrodatos (big data), la curación de datos se ha vuelto más prominente, particularmente en los programas informáticos que procesan sistemas de datos complejos y de gran volumen.[3] El término también se usa en ocasiones históricas y en el ámbito de las humanidades,[4] donde el aumento de los datos culturales y académicos procedentes de los proyectos de humanidades digitales requiere la experiencia y las prácticas analíticas de la curación de datos.[5] En términos generales, la curación significa una variedad de actividades y procesos realizados para crear, administrar, mantener y validar un componente.[6] Específicamente, la curación de datos es el intento de determinar qué información merece ser guardada y durante cuánto tiempo.[7]
El usuario y no la propia base de datos, suele iniciar la curación de datos y mantener los metadatos.[8] Según la Facultad de Biblioteconomía y Ciencias de la Información de la Universidad de Illinois, "la curación de datos es la gestión activa y continua de los datos a lo largo de su ciclo de vida de interés y utilidad para la erudición, la ciencia y la educación; las actividades de curación permiten el descubrimiento y la recuperación de datos, mantiene la calidad, añaden valor y permiten la reutilización a lo largo del tiempo".[9] El flujo de trabajo de curación de los datos es distinto de la gestión de calidad de datos, la protección de datos, la gestión del ciclo de vida y el movimiento de datos.[8]
Los datos del censo han estado disponibles en forma de tarjeta perforada tabulada desde principios del siglo XX y han sido electrónicos desde la década de 1960.[10] El sitio web del Consorcio Interuniversitario para la Investigación Política y Social (ICPSR) señala a 1962 como la fecha de su primer archivo de datos de encuestas.[11]
En el contexto general de las bibliotecas de datos aparecieron en una edición de 1982 de la revista de Illinois, Library Trends.[12] Para conocer los antecedentes históricos del movimiento de archivos de datos, se puede consultar Social Scientific Information Needs for Numeric Data: The Evolution of the International Data Archive Infrastructure (Necesidades de información científica social para datos numéricos: la evolución de la infraestructura internacional de archivos de datos).[13] El proceso exacto de curación que se lleve a cabo en cualquier organización depende del volumen de datos, de la cantidad de ruido que contienen y de lo que significa el uso futuro previsto de los datos para su difusión.[3]
La crisis de los datos espaciales condujo a la creación en 1999 del modelo Open Archival Information System (OAIS),[14] administrado por el Comité Consultivo para Sistemas de Datos Espaciales (CCSDS), que se formó en 1982.[15]
El término curación de datos a veces se utiliza en el contexto de las bases de datos biológicas, donde la información biológica específica se obtiene primero de una serie de artículos de investigación y luego se almacena dentro de una categoría específica de la base de datos. Por ejemplo, la información sobre medicamentos antidepresivos se puede obtener de varias fuentes y después de verificar si están disponibles en una base de datos o no, se guardan en la categoría de antidepresivos de una base de datos de medicamentos. Las empresas también están utilizando la curación de datos dentro de sus procesos operativos y estratégicos para garantizar la calidad y precisión de los datos.
En el ámbito de las imágenes médicas, la curación de datos comúnmente se refiere a ajustes de datos de los píxeles de imágenes o de los metadatos de la imagen de los formatos de archivo de imágenes médicas como DICOM. La curación de datos también puede referirse a cualquier paso de procesamiento que sigue a la adquisición de datos de imágenes en un centro de salud u otro entorno clínico. En tales contextos, es un término general para una serie de actividades que incluyen la gestión de datos, la creación, la modificación, la verificación, la extracción, la integración, la normalización, la conversión, el mantenimiento, la garantía de calidad y la validación de datos, así como la integridad, la trazabilidad y las comprobaciones de reproducibilidad.[16]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.