Índice de Czekanowski

De Neotrópicos, plataforma colaborativa.
Revisión del 06:29 17 may 2016 de Lcgarcia (discusión | contribuciones) (Texto adicional)
Ir a la navegación Ir a la búsqueda

El índice de Czekanovski, denominado así en honor al antropólogo, lingüista y estadístico polaco Jan Czekanovski, quien se hizo famoso por engañar a los "científicos raciales" alemanes, mediante la interpretación de datos del grupo étnico Karaim de Polonia-Lituania a quienes logró excluir del exterminio del Holocausto. Mediante la aplicación del índice de similitud demostró que el pueblo karaim era de origen turco, a pesar de profesar la religión judía y de usar el hebreo como lengua litúrgica. Esto ayudó a la gente karaim a escapar del trágico destino de otros judios europeos y de los romaníes (gitanos).

El índice fue desarrollado por Czekanovski en 1913, para establecer relaciones entre dialectos y lenguas, pero realmente se puede aplicar a cualquier comparacion entre individuos calificados por múltiples atributos, e. g., razas, especies de plantas o de animales, biocenosis, biotopos y hábitats, culturas, etc. La calificación puede ser cuali- o cuantitativa y se basa en la comparación atributo por atributo de cada par de individuos de una colección.

El índice cualitativo (presencia/ausencia de un atributo en un individuo) es el índice de Czekanovski, el cuantitativo es denomionado índice de Bray-Curtis. Este índice fue derivado medio siglo más tarde (1948), independientemente, por el botánico TV Sørensen, en Dinamarca y el mastozoologo L. R. Dice en EUA y recibe el nombre de índice de Sørensen y Dice; las aplicaciones iniciales fueron en comparaciones sinecologicas en Groenlandia (Sørensen) y en el SO de EUA y en México (Dice).

Para otras aplicaciones véase e. g.: Soltysiak, A. and P. Jaskulski 1999. Czekanowski’s Diagram: a Method of Multidimensional Clustering, in: Barceló, J.A., I. Briz and A. Vila (eds.), New Techniques for Old Times. CAA98. Computer Applications and Quantitative Methods in Archaeology. Proceedings of the 26th Conference, Barcelona, March 1998 (BAR International Series 757). Archaeopress, Oxford, pp. 175-184. (pdf copy en Alluvia)

En una colección de dos individuos con múltiples atributos, la similitud entre ellos es:

Cz = 2a/(2a + b + c)

En donde:

Cz = índice de similitud de Czekanovski
a = atributos comunes a los dos individuos
b = atributos exclusivos del individuo 1
c = atributos exclusivos del individuo 2
d = atributos ausentes en común