Top 10 de los artículos

YouTube
Gmail
Goole
GayRomeo
Números chinos
Números romanos
Orkut
Costco
Sistema porta hepático
El mundo Factbook

News:

Recocido simulado

Recocido simulado (SA) es un genérico probabilistic meta-algoritmo para optimización global problema, a saber localizando una buena aproximación a grado óptimo global del dado función en un grande espacio de la búsqueda. Es de uso frecuente cuando el espacio de la búsqueda es discreto (e.g., todos los viajes que visitan un sistema dado de ciudades). Para ciertos problemas, el recocido simulado puede ser más eficaz que enumeración exhaustiva - a condición de que la meta es simplemente encontrar una solución aceptable buena en una cantidad de tiempo fija, más bien que la solución mejor.

El nombre y la inspiración vienen de recocido en metalurgia, una técnica que implica la calefacción y refrescarse controlado de un material para aumentar el tamaño de su cristales y reduzca su defectos. El calor causa átomos para hacer unstuck de sus posiciones de la inicial (un mínimo local de energía interna) y vague aleatoriamente a través de estados de una energía más alta; el refrescarse lento les da más ocasiones de encontrar configuraciones con una energía interna más baja que la inicial.

Por analogía con este proceso físico, cada paso del algoritmo del SA substituye la solución actual por una solución “próxima” al azar, elegida por una probabilidad que dependa de la diferencia entre los valores correspondientes de la función y de un parámetro global T (llamado temperatura), eso se disminuye gradualmente durante el proceso. La dependencia es tal que la solución actual cambia casi aleatoriamente cuando T es grande, pero cada vez más “cuesta abajo” como T va a cero. El permiso para los movimientos “ascendentes” ahorra el método de el pegarse en mínimos locales- de que es la perdición más codicioso métodos.

El método fue descrito independientemente por el S. Kirkpatrick, C. D. Gelatt y M. P. Vecchi en 1983, y por el V. Černý en 1985. El método es una adaptación del Algoritmo de la Metrópoli-Hastings, a Método de Monte Carlo para generar los estados de la muestra de un sistema termodinámico, inventados cerca N. Metrópoli y otros en 1953.

Contenido

Descripción

En el método simulado del recocido (SA), cada punto s a búsqueda el espacio es análogo a a estado de alguno sistema físico, y la función E(s) ser reducido al mínimo es análogo a energía interna del sistema en ese estado. La meta es traer el sistema, de un arbitrario estado inicial, a un estado con la energía posible mínima.

La iteración básica

En cada paso, el SA heurístico considera a algún vecino s del estado actual s, y probabilistically decide entre la mudanza del sistema al estado s o permaneciendo puesto en estado s. Se eligen las probabilidades de modo que el sistema tienda en última instancia para moverse a los estados de una energía más baja. Este paso se repite típicamente hasta que el sistema alcanza un estado que sea bastante bueno para el uso, o hasta el cómputo dado se ha agotado un presupuesto.

Los vecinos de un estado

Los vecinos de cada estado ( movimientos del candidato) son especificados por el usuario, generalmente en una manera application-specific. Por ejemplo, en problema del vendedor que viaja, cada estado se define típicamente como detalle viaje (a permutación de las ciudades que se visitarán); y uno podría definir a los vecinos de un viaje como esos viajes que se pueden obtener de él intercambiando cualquier par de ciudades consecutivas.

Probabilidades de la aceptación

La probabilidad de la fabricación transición del estado actual s a un nuevo estado del candidato s' es especificado por función de la probabilidad de la aceptación P(e,e',T), eso depende de las energías e = E(s) y e' = E(s') de los dos estados, y en un parámetro tiempo-que varía global T llamó temperatura.

Un requisito esencial para la función de la probabilidad P es eso que debe ser distinto a cero cuando e' > e, significarlo que el sistema puede moverse al nuevo estado aun cuando es peor (tiene una energía más alta) que la actual. Es esta característica que evita que el método el pegarse en a mínimo local- un estado que es peor que el mínimo global, con todo mejor que cualesquiera de sus vecinos.

Por otra parte, cuando T va a cero, la probabilidad P(e,e',T) debe tender a cero si e' > e, y a un valor positivo si e' < e. Esa manera, para los valores suficientemente pequeños de T, el sistema favorecerá cada vez más los movimientos que van “cuesta abajo” (bajar valores de la energía), y evita los que vayan “cuesta arriba”. Particularmente, cuando T se convierte 0, el procedimiento reducirá a algoritmo codicioso- que hace el movimiento solamente si va cuesta abajo.

En la descripción original del SA, la probabilidad P(e,e',T) fue definido como 1 cuando e' < e - es decir, el procedimiento movido siempre cuesta abajo cuando encontró una manera de hacer así pues, con independencia de la temperatura. Muchas descripciones y puestas en práctica del SA todavía toman esta condición como parte de la definición del método. Sin embargo, esta condición no es esencial para que el método trabaje, y uno puede discutir que sea ineficaz y contrario a su alcohol.

P la función se elige generalmente de modo que la probabilidad de aceptar un movimiento disminuya cuando la diferencia e' − e aumenta- that es, los movimientos ascendentes pequeños son más probables que los grandes. Sin embargo, este requisito no es terminantemente necesario, a condición de que los requisitos antedichos son met.

Dado estas características, la evolución del estado s depende crucial de la temperatura T. En línea general, la evolución de s es sensible a variaciones más gruesas de la energía cuando T es grande, y a variaciones más finas cuando T es pequeño.

El horario del recocido

Otra característica esencial del método del SA es que la temperatura está reducida gradualmente mientras que procede la simulación. Inicialmente, T se fija a un de alto valor (o al infinito), y se disminuye en cada paso según alguno horario del recocido- que se puede especificar por el usuario, pero debe terminar con T = 0 hacia el extremo del presupuesto asignado del tiempo. De esta manera, se espera que el sistema vague inicialmente hacia una amplia región del espacio de la búsqueda que contiene buenas soluciones, no haciendo caso de las características pequeñas de la función de la energía; entonces mandile hacia las regiones de poca energía que llegan a ser más estrechas y más estrechas; y finalmente movimiento cuesta abajo según la pendiente más escarpada heurístico.

Ejemplo que ilustra el efecto de refrescar horario en el funcionamiento del recocido simulado. El problema es cambiar pixeles de una imagen para reducir al mínimo un seguro energía potencial función, que causa similar colores para atraer en shortrange y rechazar en una distancia levemente más grande. El intercambio de los movimientos elementales dos pixeles adyacentes. Las imágenes fueron obtenidas con horario que se refrescaba rápido (a la izquierda) y retardan el horario que se refrescaba (derecho), produciendo los resultados similares a amorfo y sólidos cristalinos, respectivamente.

Puede ser demostrado que para cualquier problema finito dado, la probabilidad que el algoritmo que recuece simulado termina con óptimo global la solución acerca a 1 mientras que el horario que recuece es extendido. Este resultado teórico, sin embargo, no es particularmente provechoso, desde el tiempo requerido para asegurar una probabilidad significativa del éxito excederá generalmente el tiempo requerido para una búsqueda completa del espacio de la solución.

Pseudocode

El pseudocode siguiente pone recocer en ejecución simulado heurístico, como se describe anteriormente, a partir de estado s0 y continuando a un máximo de kmax pasos o hasta un estado con energía emax o se encuentra menos. La llamada vecinos debe generar a un vecino aleatoriamente elegido del dado indicaron s; la llamada al azar () debe volver un valor al azar en la gama [0,1). El horario del recocido es definido por la llamada temperatura (r), que debe rendir la temperatura al uso, dado la fracción r del presupuesto del tiempo que se ha expendido hasta ahora.

s: = s0; e: = E                           // Estado inicial, energía.
sb: = s; eb: = e                             // Mejor” solución de la inicial la “
k: = 0                                       // Cuenta de la evaluación de la energía.
mientras que k  < kmax y e  > emax                  // Mientras que sigue habiendo el tiempo y no bueno bastante:
sn: = vecinos                         //   Escoja a algún vecino.
en: = E (sn)                                //   Compute su energía.
si en  < eb entonces                            //   ¿Está esto un la mejor nuevo?
sb: = sn; eb: = en                       //     Sí, excepto él.
si P (e, en, temperatura (k/kmax))  > al azar () entonces  //   ¿Debemos trasladarnos a él?
s: = sn; e: = en                         //     Sí, estado del cambio.
k: = k + 1                                 //   Una más evaluación hecha
vuelta sb                                    // Vuelva la mejor solución encontrada.

Realmente, el algoritmo “puro” del SA no no pierde de vista la mejor solución encontrada hasta ahora: no utiliza las variables sb y eb, carece el primer si dentro del lazo, y, en el extremo, de él vuelve el estado actual s en vez de sb. Mientras que ahorrar el mejor estado es una optimización estándar, eso se puede utilizar en cualquier metaheuristic, él rompe la analogía con el recocido físico - puesto que una poder física “almacén” del sistema un solo estado solamente.

Ahorrar el mejor estado no es necesariamente una mejora, puesto que una puede tener que especificar un más pequeño kmax para compensar el coste más alto por la iteración. Sin embargo, el paso sb: = sn sucede solamente en una fracción pequeña de los movimientos. Por lo tanto, la optimización es generalmente de mérito, aun cuando estado-copiando es una operación costosa.

Seleccionar los parámetros

Para aplicar el método del SA a un problema específico, uno debe especificar los parámetros siguientes: el espacio del estado, la función de la energía (meta) E (), el procedimiento del generador del candidato vecino (), la función de la probabilidad de la aceptación P (), y el horario del recocido temperatura (). Estas opciones pueden tener un impacto significativo en la eficacia del método. Desafortunadamente, no hay opciones de estos parámetros que sean buenos para todos los problemas, y no hay manera general de encontrar las mejores opciones para un problema dado. Las secciones siguientes dan algunas pautas generales.

Diámetro del gráfico de la búsqueda

El recocido simulado se puede modelar como caminata al azar en a búsqueda gráfico, que cimas son todas estados posibles, y que bordes son el candidato se mueve. Un requisito esencial para vecino () la función es que debe proporcionar una trayectoria suficientemente corta en este gráfico del estado inicial a cualquier estado que pueda ser el grado óptimo global. (Es decir diámetro de búsqueda el gráfico debe ser pequeño.) en el ejemplo del vendedor que viaja arriba, por ejemplo, el espacio de la búsqueda para n = 20 las ciudades tienen n! = 2432902008176640000 (2.5 quintillón) estados; con todo la función vecina del generador que intercambian dos ciudades consecutivas puede conseguir de cualquier estado (viaje) a cualquier otro estado adentro n(n )/2 = 190 del − 1 pasos.

Probabilidades de la transición

Para cada borde (s,s') del gráfico de la búsqueda, uno define a probabilidad de la transición, que es la probabilidad que el algoritmo del SA moverá al estado s' cuando es su estado actual s. Esta probabilidad depende de la temperatura actual según lo especificado cerca temperatura (), por la orden en la cual el candidato se mueve son generados por vecino () función, y por la función de la probabilidad de la aceptación P (). (Nota que es la probabilidad de la transición no simplemente P(e,e',T), porque prueban a los candidatos en serie.)

Probabilidades de la aceptación

La especificación de vecino (), P (), y temperatura () es parcialmente redundante. En la práctica, es común utilizar la misma función de la aceptación P () para que haya muchos problemas, y ajuste las otras dos funciones según el problema específico.

En la formulación del método de Kirkpatrick y otros., la probabilidad de la aceptación P(e,e',T) fue definido como 1 si e' < e, y exp ((ee') / T) si no. Este fórmula corresponde a Algoritmo de la Metrópoli-Hastings, en el caso donde está simétrica la distribución de la oferta de la Metrópoli-Hastings. Sin embargo, esta probabilidad de la aceptación es de uso frecuente para el recocido simulado aun cuando vecino () la función, que es análoga el distribución de la oferta en Metrópoli-Hastings, no es simétrica, o no probabilistic en todos. Las transiciones individuales del algoritmo que recuece simulado no corresponden a la evolución a corto plazo de un sistema físico, pero los estados excesivos de la distribución a largo plazo del algoritmo en una temperatura particular corresponden algo a los estados excesivos de la distribución de la probabilidad de un sistema físico en una temperatura particular.

Generación eficiente del candidato

Al elegir el generador del candidato vecino (), uno debe considerar que después de algunas iteraciones del algoritmo del SA, se espera que el estado actual tenga energía mucho más baja que un estado al azar. Por lo tanto, como regla general, uno debe sesgar el generador hacia los movimientos del candidato donde la energía del estado de la destinación s' es probable ser similar a el del estado actual. Esto heurístico (que es el principio principal del Algoritmo de la Metrópoli-Hastings) tiende para excluir movimientos “muy buenos” del candidato tan bien como “mismo malo” unos; sin embargo, el últimos son mucho mas comunes que el anteriores, así que el heurístico es generalmente absolutamente eficaz.

En el problema del vendedor que viaja arriba, por ejemplo, intercambiando dos consecutivo se espera que las ciudades en un viaje de poca energía tengan un efecto modesto en su energía (longitud); mientras que intercambia dos arbitrario las ciudades son más probables lejano aumentar su longitud que disminuirla. Así, consecutivo-intercambie el generador vecino espera realizarse mejor que arbitrario-intercambie uno, aun cuando el último podría proporcionar una trayectoria algo más corta al grado óptimo (con n − 1 intercambie, en vez de n(n − 1) / 2).

Una declaración más exacta del heurístico es de que una intente los primeros estados del candidato s' para cuál P(E(s),E(s'),T) es grande. Para la función “estándar” de la aceptación P sobre, significa eso E(s') − E(s) está en la orden de T o menos. Así, en el ejemplo del vendedor que viajaba arriba, uno podía utilizar a vecino () funcione que intercambia dos ciudades al azar, en donde la probabilidad de elegir un par de la ciudad desaparece mientras que su distancia aumenta más allá T.

Evitación de la barrera

Al elegir el generador del candidato vecino () uno debe también intentar reducir el número de los mínimos locales “profundos” - los estados (o sistemas de estados conectados) que tienen energía mucho más baja que todos sus estados vecinos. Tal “se cerró captación los lavabos " de la función de la energía pueden atrapar el algoritmo del SA con la alta probabilidad (áspero proporcional al número de estados en el lavabo) y para un muy de largo plazo (áspero exponencial en la diferencia de la energía entre el estado circundante y el fondo del lavabo).

En general, es imposible diseñar un generador del candidato que satisfaga esta meta y también dé la prioridad a candidatos con energía similar. Por otra parte, uno puede mejorar a menudo sumamente la eficacia del SA por los cambios relativamente simples al generador. En el problema, por ejemplo, él del vendedor que viaja no es duro exhibir dos viajes A, B, con longitudes casi iguales, tales que (0) A es óptima, (1) cada secuencia del ciudad-par intercambia que los convertidos A a B pasa con los viajes que son mucho más largos que ambos, y (2) A puede ser transformado en B moviendo de un tirón (que invierte la orden de) un sistema de ciudades consecutivas. En este ejemplo, A y B mienta en diversos “lavabos profundos” si el generador realiza solamente al azar par-intercambia; pero serán en el mismo lavabo si el generador realiza al azar segmento-mueve de un tirón.

Horario que se refresca

La analogía física que se utiliza para justificar el SA asume que la tarifa que se refresca está bajo bastante para la distribución de la probabilidad del estado actual a estar cerca equilibrio termodinámico siempre. Desafortunadamente, tiempo de la relajación- el tiempo uno debe esperar el equilibrio que se restaurará después de un cambio en temperatura-fuerte depende de la “topografía” de la función de la energía y de la temperatura actual. En el algoritmo del SA, el tiempo de la relajación también depende del generador del candidato, de una manera muy complicada. Observe que todos estos parámetros están proporcionados generalmente como funciones de la caja negra al algoritmo del SA.

Por lo tanto, la tarifa que se refresca ideal no se puede determinar en la práctica de antemano, y se debe empírico ajustar según cada problema. La variante del SA conocida como recocido simulado termodinámico intenta evitar este problema dispensando con el horario que se refresca, y en lugar de otro automáticamente ajustando la temperatura en cada paso basado en la diferencia de la energía entre los dos estados, según los leyes de la termodinámica.

Recomenzar

Es a veces mejor moverse de nuevo a una solución que era perceptiblemente mejor más bien que siempre de mudanza desde el estado actual. Se llama esto recomienzo. Para hacer esto que fijamos s y e a sb y eb y quizás recomience el horario del recocido. La decisión a recomenzar se podía basar en un número fijo de pasos, o basar en la energía actual que era demasiado alta de la mejor energía hasta ahora.

Métodos relacionados

  • Recocido de Quantum las aplicaciones “fluctuaciones del quántum” en vez de fluctuaciones termales consiguen a través de colmo pero de barreras finas en la función de la blanco.
  • El hacer un túnel estocástico las tentativas de superar la dificultad de aumento simularon funcionamientos del recocido tienen en escaparse de mínimos locales como las disminuciones de la temperatura, “haciendo un túnel” a través de barreras.
  • Búsqueda del tabú normalmente los movimientos a los estados vecinos de una energía más baja, pero tomarán movimientos ascendentes cuando se encuentra pegado en un mínimo local; y evita ciclos manteniendo una “lista del tabú” de soluciones vista ya.
  • Algoritmos genéticos mantenga una piscina de soluciones más bien que apenas una. Las nuevas soluciones del candidato son generadas no sólo por la “mutación” (como en el SA), pero también por la “combinación” de dos soluciones de la piscina. Los criterios Probabilistic, similares a ésos usados en el SA, se utilizan para seleccionar a los candidatos para la mutación o la combinación, y para desechar exceso de soluciones de la piscina.
  • método de la cruz-entropía (CE) genera soluciones de los candidatos vía una distribución dada parámetros de la probabilidad. Los parámetros son actualizados vía la minimización de la cruz-entropía, para generar muestras mejores en la iteración siguiente.
  • Búsqueda de la armonía mímico a músicos en el proceso de la improvisación donde cada músico juega una nota para encontrar una mejor armonía toda junta.

Vea también

Referencias

  • S. Kirkpatrick y C. D. Gelatt y M. P. Vecchi, optimización por el recocido simulado, ciencia, vol. 220, número 4598, pagina 671-680, 1983. http://www.cs.virginia.edu/cs432/documents/sa-1983.pdf o http://citeseer.ist.psu.edu/kirkpatrick83optimization.html .
  • V. Cerny, acercamiento thermodynamical de A al problema del vendedor que viaja: un algoritmo eficiente de la simulación. Diario de la teoría y de los usos, 45:41 - 51, 1985 de la optimización
  • N. Metrópoli, A.W. Rosenbluth, M.N. Rosenbluth, A.H. Caja, y E. Caja. “Ecuaciones los cálculos de estado por las máquinas que computan rápidas”. Diario de la física química, 21 (6): 1087-1092, 1953. [1]
  • A. Das y B. K. Chakrabarti (Eds.), Recocido de Quantum y métodos relacionados de la optimización, Nota de la conferencia en la física, vol. 679, Springer, Heidelberg (2005)
  • E. Paisajes de Weinberger, correlacionado y sin correlación de la aptitud y cómo decir la diferencia, cibernética biológica, 63, no. 5, 325-336 (1990).
  • J. De Vicente, J. Lanchares, R. Hermida, “colocación por el recocido simulado termodinámico”, física letra A, vol. 317, edición 5-6, pp.415-423, 2003.

Acoplamientos externos

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence