Remove ads
De Wikipedia, la enciclopedia libre
En teoría de operadores, una rama de las matemáticas, un núcleo definido positivo es una generalización del concepto de función definida positiva o de matriz definida positiva. Fue introducido por primera vez por James Mercer a principios del siglo XX, en el contexto de la resolución de ecuaciones con integrales. Desde entonces, las funciones definidas positivas y sus diversos análogos y generalizaciones han surgido en diversas partes de las matemáticas. Aparecen naturalmente en el análisis de Fourier, en la teoría de la probabilidad, en la teoría de operadores, en la teoría de funciones complejas, en problemas de momentos, en ecuaciones integrales, problemas de condiciones de contorno para ecuaciones en derivadas parciales, en aprendizaje automático, en problemas de embebido, en teoría de la información y en otras áreas.
Este artículo discute algunos de los desarrollos históricos y actuales de la teoría de los núcleos definidos positivos, comenzando con la idea general y las propiedades antes de considerar sus aplicaciones prácticas.
Sea un conjunto no vacío, a veces denominado conjunto índice. Una función simétrica se denomina núcleo definido positivo (d.p.) en si
|
(1.1) |
se cumple para cualquier , dado .
En la teoría de la probabilidad, a veces se hace una distinción entre núcleos definidos positivos, para los cuales la igualdad en (1.1) implica , y núcleos semidefinidos positivos (s.d.p.), que no imponen esta condición. Téngase en cuenta que esto es equivalente a exigir que cualquier matriz finita construida mediante evaluación por pares, , tenga autovalores completamente positivos (d.p.) o no negativos (s.d.p.).
En la literatura matemática, los núcleos suelen ser funciones de valores complejos, pero en el presente artículo figuran funciones de valores reales, que es la práctica común en las aplicaciones de núcleos d.p.
como
son núcleos d.p. en . |
Los núcleos definidos positivos, como se definen en (1.1), aparecieron por primera vez en 1909 en un artículo sobre ecuaciones integrales de James Mercer.[2] Varios otros autores hicieron uso de este concepto en las siguientes dos décadas, pero ninguno de ellos usó explícitamente núcleos , es decir, funciones d.p. (de hecho, M. Mathias y S. Bochner parecen no haber estado al tanto de estos estudios). El trabajo de Mercer surgió del artículo de Hilbert de 1904[3] sobre las ecuaciones integrales de Fredholm del segundo tipo:
|
En particular, Hilbert había demostrado que:
|
donde es un núcleo simétrico real continuo, es continuo, es un sistema completo de orthonormal eigenfunctions y los son los correspondientes autovalores de (1.2). Hilbert ideó la definición de un núcleo definido como uno para el cual la integral doble
satisface que excepto para . El objeto original del artículo de Mercer era caracterizar los núcleos que son definidos en el sentido de Hilbert, pero pronto descubrió que la clase de tales funciones era demasiado restrictiva para caracterizarlas en términos de determinantes. Por lo tanto, definió un núcleo simétrico real continuo como de tipo positivo (es decir, definido positivo) si para todas las funciones continuas reales sobre , y demostró que (1.1) es una condición necesaria y suficiente para que un núcleo sea de tipo positivo. Luego demostró que para cualquier núcleo d.p. la expansión
se mantiene absoluta y uniformemente.
Aproximadamente al mismo tiempo, W. H. Young,[4] motivado por una pregunta diferente en la teoría de ecuaciones integrales, demostró que para núcleos continuos la condición (1.1) es equivalente a para todo .
E.H. Moore[5][6] inició el estudio de un tipo muy general de núcleo d.p. Si es un conjunto abstracto, llama a las funciones definidas en matrices hermíticas positivas si cumplen (1.1) para todo . Moore estaba interesado en la generalización de ecuaciones integrales y demostró que para cada existe un espacio de Hilbert de funciones tales que, para cada . Esta propiedad se denomina propiedad de reproducción del núcleo y resulta ser importante en la solución de problemas de valores de frontera para ecuaciones diferenciales parciales elípticas.
Otra línea de desarrollo en la que los núcleos d.p. jugaron un papel importante fue la teoría de los armónicos en espacios homogéneos, iniciada por E. Cartan en 1929, y continuada por H. Weyl y S. Ito. La teoría más completa sobre núcleos d.p. en espacios homogéneos es la de Mark Krein[7] que incluye como casos especiales el trabajo sobre funciones d.p. e irreducibles representaciones unitarias de grupos localmente compactos.
En la teoría de la probabilidad los núcleos d.p. surgen como núcleos de covarianza de procesos estocásticos.[8]
Los núcleos definidos positivos proporcionan un marco que abarca algunas construcciones espaciales básicas de Hilbert. A continuación, se presenta una estrecha relación entre los núcleos definidos positivos y dos objetos matemáticos, a saber, la reproducción de núcleos de espacios de Hilbert y mapas de características.
Sea un conjunto, un espacio de Hilbert de funciones y el producto interno correspondiente en . Para cualquier , la evaluación funcional está definida por . Primero se define un espacio de Hilbert del núcleo de reproducción (EHRN):
Definición: Un espacio es denominado espacio de Hilbert con reproducción del núcleo si los funcionales valoración son continuos.
Cada EHRN tiene una función especial asociada, a saber, el núcleo reproductor:
Definición: El núcleo reproductor es una función tal que
- , y
- , para todo y .
La última propiedad se llama la propiedad de reproducción.
El siguiente resultado muestra la equivalencia entre EHRN y la reproducción de los núcleos:
|
Ahora, la conexión entre los núcleos definidos positivos y los EHRN viene dada por el siguiente teorema
|
Por lo tanto, dado un núcleo definido positivo , es posible construir un EHRN asociado con como núcleo reproductor.
Como se indicó anteriormente, los núcleos definidos positivos se pueden construir a partir de productos internos. Este hecho se puede utilizar para conectar los núcleos d.p. con otro objeto interesante que surge en las aplicaciones de aprendizaje automático, a saber, el mapa de características. Sea un espacio de Hilbert y el producto interno correspondiente. Cualquier mapa se denomina mapa de características. En este caso se denomina al espacio de características. Es fácil ver[9] que cada mapa de características define un único núcleo d.p. por
De hecho, la definición positiva de se deriva de la propiedad del producto interior definido positivo. Por otro lado, cada núcleo d.p. y su EHRN correspondiente tienen muchos mapas de características asociados. Por ejemplo: sean , y para todo . Entonces , por la propiedad de reproducción. Esto sugiere una nueva visión de los núcleos d.p. como productos internos en espacios de Hilbert propios, o en otras palabras, los núcleos d.p. se pueden ver como mapas de similitud que cuantifican de manera efectiva lo similares que son dos puntos e a través del valor . Además, mediante la equivalencia de núcleos d.p. y su correspondiente EHRN, cada mapa de características se puede utilizar para construir un EHRN.
Los métodos del núcleo a menudo se comparan con los métodos basados en la distancia, como vecinos más próximos. En esta sección se discuten los paralelismos entre sus dos ingredientes respectivos, a saber, los núcleos y las distancias .
Aquí, por una función de distancia entre cada par de elementos de algún conjunto , se hace referencia a una métrica definida en ese conjunto, es decir, cualquier función de valor no negativo en que satisfaga
Un enlace entre distancias y núcleos d.p. está dada por un tipo particular de núcleo, llamado núcleo definido negativo, caracterizado de la siguiente manera
Definición: Una función simétrica se denomina núcleo definido negativo (d.n.) sobre si
(1.4)
mantiene para cualquier y tales que .
El paralelismo entre núcleos d.n. y distancias es el siguiente: siempre que un núcleo d.n. desaparece en el conjunto , y es cero solo en este conjunto, entonces su raíz cuadrada es una distancia para .[10] Al mismo tiempo cada distancia no corresponde necesariamente a un núcleo d.n. Esto solo es cierto para distancias hilbertianas, en las que la distancia se llama hilbertiana si se puede embeber el espacio métrico isométricamente en algún espacio de Hilbert.
Por otra parte, los núcleos d.n. se pueden identificar con una subfamilia de núcleos d.p. conocidos como núcleos infinitamente divisibles. Se dice que un núcleo de valor no negativo es infinitamente divisible si para cada existe un núcleo definido positivo tal que .
Otra relación es que un núcleo d.p. induce una pseudométrica, donde la primera restricción en la función de distancia se relaja para permitir que para . Dado un núcleo definido positivo , se puede definir una función de distancia como:
Los núcleos definidos positivos, a través de su equivalencia con la reproducción de espacios de Hilbert del núcleo, son particularmente importantes en el campo de la teoría del aprendizaje estadística debido al célebre teorema de representación que establece que cada función minimizadora en un EHRN se puede escribir como una combinación lineal de la función del núcleo evaluada en los puntos de entrenamiento. Este es un resultado útil en la práctica, ya que simplifica eficazmente el problema de minimización de riesgos empíricos de un problema de optimización de dimensión infinita a uno de dimensión finita.
Hay varias formas diferentes en las que surgen núcleos en la teoría de la probabilidad.
Supóngase ahora que una variable de ruido , con media cero y varianza , se agrega a , de modo que el ruido es independiente para diferentes e independiente de , entonces el problema de encontrar una buena estimación para es idéntico al anterior, pero con un núcleo modificado proporcionado por .
Una de las mayores áreas de aplicación de los llamados métodos sin malla es la solución numérica de ecuaciones en derivadas parciales. Algunos de los métodos populares sin malla están estrechamente relacionados con los núcleos definidos positivos (como el método sin malla local de Petrov Galerkin, el método de partícula del núcleo de reproducción y la hidrodinámica de partículas suavizadas). Estos procedimientos utilizan un núcleo de base radial con un método de colocación.[11]
En la literatura sobre experimentos informáticos[12] y otros experimentos de ingeniería, se encuentran cada vez más modelos basados en núcleos d.p., la función núcleo de base radial o el krigeaje. Uno de esos temas es la metodología de superficie de respuesta. Otros tipos de aplicaciones que se reducen al ajuste de datos son el prototipado rápido y los gráficos por computadora. Aquí, a menudo se usan modelos de superficie implícitos para aproximar o interpolar datos de nubes de puntos.
Aplicaciones de los núcleos definidos positivos en varias otras ramas de las matemáticas se encuentran en la integración multivariante, la optimización multivariante y en el análisis numérico y la computación científica, donde se estudian algoritmos rápidos, precisos y adaptables, idealmente desarrollados en entornos informáticos de alto rendimiento.[13]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.