Top 10 de los artículosYouTubeGmail Goole GayRomeo Números chinos Números romanos Orkut Costco Sistema porta hepático El mundo Factbook |
News: |
k-significa algoritmo está un algoritmo a racimo n objetos basados en cualidades en k particiones, k < n. Es similar a algoritmo de la expectativa-maximización para las mezclas de Gaussians en ése ambos procuran encontrar los centros de racimos naturales en los datos. Asume que el objeto atribuye la forma a espacio del vector. El objetivo que intenta alcanzar es reducir al mínimo la variación total del intra-racimo, o, la función de error ajustada
donde hay k racimos Si, i = 1, 2,…, k, y µi es del centro de figura o punto malo de todos los puntos xj ∈ Si.
La forma más común del algoritmo utiliza un heurístico iterativo del refinamiento conocido como Algoritmo de Lloyd. El algoritmo de Lloyd comienza repartiendo los puntos de la entrada en sistemas de la inicial de k, al azar o usando un ciertos datos heurísticos. Entonces calcula el punto malo, o el centro de figura, de cada sistema. Construye una partición nueva asociando cada punto al centro de figura más cercano. Entonces los centros de figura se recalculan para los racimos nuevos, y el algoritmo repetido por el uso alterno de estos dos pasos hasta la convergencia, se obtiene que cuando los puntos cambian no más racimos (o los centros de figura se cambian alternativomente no más).
El algoritmo de Lloyd y k-significa es de uso frecuente sinónimo, pero en Lloyd de la realidad el algoritmo es un heurístico para solucionar k-significa problema[1], pero con ciertas combinaciones de puntos de partida y de centros de figura, el algoritmo de Lloyd puede de hecho converger a la respuesta incorrecta (el IE una respuesta diversa y óptima a la función de la minimización arriba existe.)
Otras variaciones existen[2], solamente el algoritmo de Lloyd ha seguido siendo popular porque converge extremadamente rápidamente en la práctica. De hecho, muchos han observado que el número de iteraciones es típicamente mucho menos que el número de puntos. Recientemente, sin embargo, David Arturo y Sergei Vassilvitskii demostraron que existen ciertos sistemas del punto en los cuales k-signifique tomas tiempo superpolynomial: 2Ω (√n) para converger.[3]
Aproximado k-significa que se han diseñado los algoritmos que hacen uso coresets: subconjuntos pequeños de los datos originales.
En términos de funcionamiento el algoritmo no está garantizado para volver un grado óptimo global. La calidad de la solución final depende en gran parte del sistema inicial de racimos, y puede, en la práctica, ser mucho más pobre que el grado óptimo global.[la citación necesitó] Puesto que el algoritmo es extremadamente rápido, un método común es funcionar el algoritmo varias veces y volver mejor arracimar encontrado.
Una desventaja del k-significa que el algoritmo es que el número de racimos k es un parámetro de la entrada. Una opción inadecuada de k puede rendir resultados pobres. El algoritmo también asume que variación es una medida apropiada de la dispersión del racimo.
Contenido |
Las imágenes siguientes demuestran k-significan algoritmo que arracima en la acción, para el caso de dos dimensiones. Los centros iniciales se generan aleatoriamente para demostrar las etapas más detalladamente.
|
Demuestra los centros de figura seleccionados al azar iniciales y un número de puntos. |
Los puntos se asocian al centro de figura más cercano. |
Ahora los centros de figura se mueven al centro de sus racimos respectivos. |
Se repiten los pasos 2 y 3 hasta que un nivel conveniente de la convergencia se ha alcanzado. |
K-significa que el algoritmo que arracima es de uso general adentro visión de computadora como forma de segmentación de la imagen. Los resultados de la segmentación se utilizan para ayudar detección de la frontera y reconocimiento del objeto. En este contexto, el estándar distancia euclidiana es generalmente escaso en la formación de los racimos. En lugar, el utilizar cargado de la medida de la distancia pixel coordenadas, RGB el color y/o la intensidad del pixel, y la textura de la imagen es de uso general.[4]
Se ha demostrado recientemente[5][6] que la solución relajada de k-significa arracimar, especificado por los indicadores del racimo, es dado por el PCA (análisis del componente principal) los componentes principales, y el subspace de PCA atravesado por las direcciones principales es idénticos al subspace del centro de figura del racimo especificado por la matriz de la dispersión de la entre-clase.
En 2006 una nueva manera de elegir los centros de la inicial fue propuesta [1], “k-means++ doblado”. La idea es seleccionar centros de una manera que están ya inicialmente cerca de cantidades grandes de puntos. El uso de los autores L2 norma en seleccionar los centros, pero general Ln puede ser utilizado templar la agresividad de la sembradura.
Este método sembrador da hacia fuera mejoras considerables en el error final de k-significa. Aunque la selección inicial en el algoritmo toma el tiempo considerable, k-se significa que converge muy rápidamente después de esto que siembra y la sembradura baja así realmente el tiempo del cómputo también. Los autores probaron su método con datasets verdaderos y sintéticos y obtuvieron el doblez típicamente 2 a las mejoras de diez veces en velocidad, y para ciertos datasets cerca de 1000 mejoras del doblez en error. Sus pruebas demostraron casi siempre el nuevo método para ser por lo menos tan buenas como la vainilla k-significa en velocidad y error.
Además, los autores calculan un cociente de la aproximación para su algoritmo. Éste es algo que no se ha hecho con vainilla k-significa (aunque con varias variaciones de ella). Las garantías de k-means++ para tener cociente de la aproximación O(registro (k)) donde k es el número de los racimos usados.
El sistema de funciones de reducción al mínimo ajustadas del racimo del error también incluye K- medoids algoritmo, un acercamiento que fuerza el punto de centro de cada racimo para ser uno de los puntos reales.
|
Custom Search
|
© Copyright 2011 WorldLingo. Reservados todos los derechos.