Loading AI tools
De Wikipedia, la enciclopedia libre
MPEG-7 consiste en una representación estándar de la información audiovisual que permite la descripción de contenidos (metadatos) para:
Es un estándar de la Organización Internacional para la Estandarización ISO/IEC y desarrollado por el grupo MPEG. El nombre formal para este estándar es Interfaz de Descripción del Contenido Multimedia (Multimedia Content Description Interface). La primera versión se aprobó en julio de 2001 (ISO/IEC 15938) y actualmente la última versión publicada y aprobada por la ISO data de octubre de 2004.
Una vez finalizado el estándar MPEG-4, juntamente con MPEG-1 y MPEG-2 quedan cubiertas las necesidades de obtener información audiovisual en cualquier sitio, también se consigue más libertad de interacción con el contenido audiovisual (gracias a MPEG-4).
Con MPEG-7 se busca la forma de enlazar los elementos del contenido audiovisual, encontrar y seleccionar la información que el usuario necesita e identificar y proteger los derechos del contenido. MPEG-7 surge a partir del momento en que aparece la necesidad de describir los contenidos audiovisuales debido a la creciente cantidad de información. El hecho de gestionar los contenidos es una tarea compleja (encontrar, seleccionar, filtrar, organizar... el material audiovisual).
MPEG-7 ofrece un mecanismo para describir información audiovisual, de manera que sea posible desarrollar sistemas capaces de indexar grandes bases de material multimedia (este puede incluir: gráficos, imágenes estáticas, audio, modelos 3D, vídeo y escenarios de cómo estos elementos se combinan) y buscar en estas bases de materiales manual o automáticamente.
El formato MPEG-7 se asocia de forma natural a los contenidos audiovisuales comprimidos por los codificadores MPEG-1, MPEG-2 y MPEG-4, de todas formas, se ha diseñado para que sea independiente del formato del contenido.
MPEG-7 se basa en el lenguaje XML de metadatos en un intento de favorecer la interoperabilidad y la creación de aplicaciones, aunque para evitar un problema de exceso de datos se ha creado un compresor llamado BiM (Binary Format for MPEG-7).[1] Este compresor presenta la ventaja de ser más robusto que XML ante los errores de transmisión.
Los contenidos pueden ser descritos de distintas formas dependiendo de la necesidad, ya que las características descriptivas deben tener un significado en el contexto de la aplicación.
Estas descripciones deberán ser distintas para distintos dominios de usuarios y sistemas. Esto significa que no se puede generar un sistema único para la descripción de contenidos, sino que se tendrán que proveer un conjunto de métodos y herramientas para satisfacer los distintos puntos de vista que distintos usuarios pueden tener.
El material multimedia, pues, puede ser descrito usando distintos niveles de abstracción. Cuanto mayor sea dicho nivel de abstracción, más difícil es efectuar un proceso automático. Por ejemplo, los cambios de ritmo de una melodía pueden catalogarse como de bajo nivel de abstracción, mientras que la información semántica "esta canción causó furor en el estadio", cae en un nivel más alto. Pero, además de disponer de la descripción relacionada con el contenido, también es necesario incluir otros tipos de información descriptiva, como pueden ser:
La arquitectura MPEG-7 se basa en que la descripción debe estar separada del contenido audiovisual.
Por otro lado, tiene que haber una relación entre contenido y descripción. Estos dos elementos están comunicados de forma que la descripción debe multiplexarse con el contenido.
El esquema de la derecha muestra esta relación entre el contenido y la descripción.
A continuación tenemos las herramientas con las que trabaja el estándar:
Es posible que un solo objeto esté descrito por varios descriptores.
La relación entre todas estas herramientas se puede observar en la figura de la derecha.
El MPEG-7 está organizado en ocho partes, de las cuales, de la 1.ª a la 5.ª, veremos que son herramientas que se refieren a la "tecnología" propiamente dicha del MPEG-7, mientras que las partes 6 a 8 son partes llamadas "de apoyo".
Los ‘visual descriptors’ son el componente que especifica la estructura y semántica de las relaciones entre sus componentes (para el filtrado y recuperación de la información).
También se utilizan descriptores de alto nivel que incluyen reconocimiento de sonido general y herramientas para la indexación de descriptores, para la descripción de timbres instrumentales, para el contenido hablado, un esquema para firma de audio y herramientas también para la descripción de melodías.
Existen muchas aplicaciones y muchos campos de aplicación que se pueden beneficiar del estándar MPEG-7. Algunos ejemplos son los siguientes:
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.