Como muchos ya sabéis, Fantasy "murió" hace más de una década y, sin embargo, la comunidad mantuvo vivo el juego. En nuestro país continúa habiendo cientos de jugadores en docenas de eventos, prefiriendo muchos de ellos jugar a Sexta Edición o ediciones fan derivadas de este juego del año 2000, incluso tras la salida oficial de "The Old World". Nosotros desarrollamos Sexta Ampliada de manera colaborativa con diversos grupos de juego, y basándonos en gran medida en los Manuscritos de Nuth. Nuestra versión ya tiene un buen recorrido en el panorama "competitivo" nacional, es un sistema frecuentemente usado y que está en proceso de ser revisado para hacer pequeños ajustes de equilibrio, pero sin pretensión de enmendar el trabajo ya hecho. Por ello, he intentado recopilar todos los resultados de eventos competitivos a los que he podido acceder, ya fueran usando las reglas de Sexta Edición original (o pura), Manuscritos de Nuth o Sexta Ampliada. Con esto, pretendo aportar datos a este proceso de revisión para que las decisiones no se basen sólo en opiniones y experiencias personales, sino que tengamos una especie de foto del conjunto.
En este artículo se expondrán los resultados analizados, para que cada uno saque sus propias conclusiones. En cualquier caso, aquí no haré ninguna propuesta concreta para ninguna facción, unidad o regla. Eso lo dejo para otra entrada, si es posible. Aviso: esta va a ser una entrada larga y densa, así que pondré un índice, por si acaso.
(aviso tochopost)
ÍNDICE:
- Metodología
- La muestra
- Estadísticos descriptivos.
- Sexta Ampliada.
- Comparación entre sistemas.
- Clasificación por facciones.
- Conclusiones.
1. METODOLOGÍA
En primer lugar, traté de obtener los resultados de todos los eventos competitivos desarrollados estos últimos años usando las reglas de Sexta Pura, de Manuscritos de Nuth o de Sexta Ampliada. Sobre qué eventos han sido no me voy a extender en este punto, porque lo haré después, pero sí que vamos a ver las características que debían cumplir.
- Eventos competitivos. Sólo he recogido resultados de partidas desarrolladas en el entorno de un torneo. No he contado resultados de videoinformes, ni partidas amistosas entre amigos, ni demos ni batallas trasfondísticas. Se trata de partidas en un entorno en el que presumiblemente todos buscan ganar y se han preparado para ello, en mayor o menor grado. En todos estos eventos hay unas restricciones a la hora de elaborar listas que marca la organización del evento y siguiendo las reglas y limitaciones habituales que marque el sistema que usan, aunque hay mucha disparidad de criterios entre unos torneos y otros, de forma que no he podido tener en cuenta estas especificidades. El análisis de datos se ha hecho con los datos recogidos desde nuestro primer torneo hace 8 años hasta los últimos obtenidos el pasado 18 de abril de 2026 y quizás pueda actualizarlo en un futuro.
- Puntuaciones en el evento. Cada organizador clasifica los resultados de las partidas usando el sistema de puntuaciones que ha considerado. En Leyendas en Miniatura usamos el sistema de reparto de 6 puntos en cada partida que se corresponde con los resultados del reglamento (6 puntos si logras hacer una masacre a tu favor, 5 por victorias decisivas, 4 por victorias marginales, 3 por empates, 2 por derrotas marginales, 1 por derrotas decisivas y 0 por derrotas por masacre).
Otros organizadores usan un reparto de 20 o 22 puntos y algunos, además, añaden (o quitan) puntos extra en la clasificación general por pintura, deportividad, trasfondo u otros elementos. No se pueden comparar directamente eventos que han utilizado puntuaciones diferentes, así que he eliminado las puntuaciones extra que no se derivan de los resultados de las propias partidas y he transformado todas las puntuaciones al reparto que hacemos nosotros de 0-6 puntos por partida, 0-18 puntos totales por jugador y evento. - Construcción de listas. Casi todos los torneos analizados son enfrentamientos individuales entre dos jugadores con listas de 1500, 1999 o 2000 puntos, a tres rondas. Por tanto, obtengo una puntuación situada entre 0 y 18 para cada jugador, que se calcula de la suma de las tres partidas jugadas. No obstante, hay eventos de dos y de cinco rondas. En esos casos he sumado la puntuación obtenida y la he transformado como si hubieran jugado tres rondas. Sé que no es lo más adecuado, pero han sido muy pocos resultados del total y por tanto no los he eliminado por su bajo impacto. También he incluido los pocos torneos que permitían el uso de Personajes Especiales, se jugaban por parejas o tenían una puntuación superior a 2000 por el mismo motivo.
- Análisis y errores estadísticos. Sea como fuere, de cada evento he tratado de obtener una puntuación por jugador de 0-18 y esta puntuación la he dividido entre 3, ya que el análisis de datos lo he querido hacer tomando como referencia la puntuación por partida, creando una escala normalizada de entre 0-6 para todos los resultados a analizar. Quizás esté complicando demasiado la explicación, pero si no se entiende podéis decirlo en comentarios e intentaré mejorarlo. Teóricamente, si todo estuviera hecho sin errores situaría la puntuación media de todas las partidas en el valor de 3,00. Pero, como cualquiera que sepa estadística sabrá, es muy difícil tener todos los datos correctos y la media tiene un ligero margen de error, situándose la media total en 3,04. ¿A qué se debe esto? Pues no lo sé exactamente, pero creo que es porque hay un pequeño número de resultados que pueden estar mal anotados o que en un torneo no se registrara la puntuación de algún jugador, desviando ligeramente la media. También hay 9 partidas que no me ha contabilizado la hoja de cálculos y ahora mismo no sé por qué. Intentaré revisar todos los resultados, pero ahora mismo contamos con 1505 jugadores que han jugado un equivalente a 4515 partidas. No se trata de jugadores únicos, pues muchos han participado en varios eventos cosechando diferentes resultados con diferentes ejércitos, y por motivos ya explicados no siempre se jugaron 3 partidas en cada evento. Trataré de revisar todos los resultados para mejorar este error, pero no es algo que ahora me preocupe mucho. Es genial tener información perfecta, de igual manera que es mejor tener información conocida que simplemente la percepción individual de cada un@.
- Información recogida. En primer lugar, he recogido la facción que usaba cada jugador, pero no el nombre del jugador. Me han preguntado, pero no, no puedo saber quién es el mejor jugador del país ni de cada facción. También he recogido la Lista Alternativa usada, en caso de saberla. Este dato no afecta a los resultados de Facción, ya que no siempre me ha sido posible saber si había o no Lista Alternativa, y por tanto, no tendría sentido analizar qué Listas Alternativas son mejores o peores. Igualmente, su uso es minoritario, pues en muchos eventos directamente ni se permiten. Además de la Facción y la Lista Alternativa, he recogido la puntuación total del torneo, situada entre 0-18 como ya hemos expuesto. En los casos que he tenido acceso, he recogido la puntuación de cada ronda y la diferencia de puntos de victoria de cada partida, pero la realidad es que pocas veces he podido tener el detalle y no afecta al tipo de análisis que he hecho. Ordenando estos datos, también tengo la posición relativa de cada jugador (o más bien, de su facción usada) en cada evento, pero el orden es irrelevante para este análisis, ya que no podía comparar eventos de 8 jugadores con eventos de 100.
En este caso, el análisis del orden en un torneo no tiene sentido, pero sí el de resultados que hace cada facción por partida. ¿Por qué recojo datos de Sexta Pura, Manuscritos de Nuth y de Sexta Ampliada? Simplemente porque es a lo que jugamos. Nuestro juego matriz es Sexta, originalmente hicimos eventos de Manuscritos de Nuth y actualmente los hacemos de Sexta Ampliada. Como no jugamos Séptima Edición, Octava edición, otras iniciativas fan como Reforged, 9th Age o el oficial The Old World, no he querido recoger esa información. - Dificultades del análisis. También hay que tener en cuenta que, como cualquier sistema de comparación de juegos y de jugadores, no es una comparación exacta. Al final es una especie de diseño experimental "intersujetos" y por tanto no podemos tener en cuenta algunas variables importantes, como por ejemplo pueda ser que determinadas facciones sea más usadas por jugadores novatos y otras más reservadas a expertos que conocen mejor las reglas y la estrategia de la batalla o las misiones que cambian en cada evento. Además, los cambios que se producen entre los "metas" de las diferentes ediciones no se deben sólo a que una facción individualmente haya sido mejorada o empeorada, sino que las que están a su alrededor también han sufrido cambios.
- *Unidad de medida. Al recabar información no ha sido posible acceder a las listas y unidades que jugaba cada persona. Tampoco había unas bases comunes para cada evento y para construir los ejércitos. En algunos casos sólo se usaba la lista general de cada facción, mientras que en otros se ha permitido el uso de personajes especiales, monstruos arcanos, regimientos de renombre y/o listas alternativas. Y, en muchos casos, no puedo saber cuándo se usó cada cosa y por tanto su impacto. Todo este desconocimiento hace que la unidad de medida tenga que ser la mayor posible, es decir, cada uno de los 17 libros de ejército que se pueden usar individualmente. Por tanto, la unidad de medida es la facción y todo lo que incluye ese libro de ejército. Ojalá tener un nivel de detalle y profundidad mayor, pero no es posible.
2. LA MUESTRA
14-04-2018 I Leyendas en Miniatura15-12-2018 I Leyendas en Miniatura por Parejas06-04-2019 II Leyendas en Miniatura12-10-2019 I Panzerhammer18-09-2021 I Custodios de Morr23-10-2021 I Tablillas Sagradas19-12-2021 III Leyendas en Miniatura20-03-2022 0 Corona de Estalia09-04-2022 I Minas de Almadén18-06-2022 I Corona de Estalia16-09-2022 II Custodios de Morr (sábado)17-09-2022 II Custodios de Morr (domingo)24-09-2022 I Panzerhammer por Bandos24-09-2022 II Tablillas Sagradas10-12-2022 I Villa de Navaridas17-12-2022 IV Leyendas en Miniatura21-01-2023 I Parejas Tablillas Sagradas15-04-2023 I Clan Kharnuz15-04-2023 II Minas de Almadén30-04-2023 II Corona de Estalia Valencia03-06-2023 I Señor del Fin de los Tiempos (P. Especiales)24-9-2023 I Lanza de Myrmidia8-10-2023 I Wargames Granada21-10-2023 III Batalla por la Maisontaal18-11-2023 II Villa de Navaridas18-11-2023 III Tablillas Sagradas08-12-2023 I Caballeros de Estalia (viernes)09-12-2023 I Caballeros de Estalia (sábado)10-12-2023 I Caballeros de Estalia (domingo)16-12-2023 V Leyendas24-02-2024 I Málaga WaaaghGames03-03-2024 II Caballeros de Estalia06-04-2024 II Clan Kharnuz22-09-2024 I Torneo Interno LeM9-11-2024 III Villa de Navaridas16-11-2024 I Cofre del Pagador30-11-2024 VI Leyendas04-01-2025 I Santa Myrmidia22-02-2025 II Málaga WaaaghGames03-03-2025 Parejas Caballeros de Estalia26-04-2025 III Clan Kharnuz10-05-2025 IV Corona de Estalia20-09-2025 III Lanza de Myrmidia20-09-2025 II Torneo Interno LeM18-10-2025 IV Panzerhammer1-11-2025 II Cofre del Pagador15-11-2025 IV Villa de Navaridas29-11-2025 VII Leyendas27-12-2025 II Santa Myrmidia21-02-2026 III Málaga WaaghGames28-03-2026 II Wargames Granada18-04-2026 IV Clan Kharnuz18-04-2026 II Liderazgo 10
También he tenido información de docenas de eventos más, de algunos tengo muchos datos pero insuficientes para este análisis, así que no los he podido incluir. En este punto, querría hacer un llamamiento a la comunidad para hacernos llegar los resultados completos de todos los eventos que no están aquí incluidos, y así mejorar esta base de datos. Podéis enviarlo a leyendasenminiatura@gmail.com.
3. ESTADÍSTICOS DESCRIPTIVOS
- Sexta Pura. 335 jugadores no únicos y 1005 partidas equivalentes.
- Manuscritos de Nuth. 486 jugadores no únicos y 1458 partidas equivalentes.
- Sexta Ampliada. 684 no únicos y 2052 partidas equivalentes.
3.1. Sexta Ampliada
En cualquier caso, creo que algo a destacar muy positivamente de este juego es que si acudes a un torneo, puedes enfrentarte a cualquier facción. Aunque unas se usan más que otras, no encontramos la situación de otros sistemas donde hay facciones prácticamente desaparecidas y otras que tranquilamente son usadas por la mitad de la comunidad (hola ultrapitufos de 40k!).
4. COMPARACIÓN ENTRE SISTEMAS
Llegado a esta parte, quiero empezar haciendo una breve reflexión: ¿Qué juego es realmente equilibrado? Probablemente ni los colores del Risk o del Trivial, así que hasta aquí, nada nuevo. Y tampoco es lo que buscamos desde aquí. También es cierto, que aunque hay en total más de 4.000 resultados de partidas, al dividirlas entre 17 facciones y 3 sistemas, algunos resultados parecen poco robustos y menos fiables. Pero, con el análisis de estos datos, la cantidad de partidas y eventos que se juegan todos los años y nuestro bagaje como organizadores y jugadores, creo que, en términos generales, la experiencia de jugar a Fantasy con Sexta Edición merece la pena y es satisfactoria. No es frecuente que jugadores habituales abandonen el juego porque tienen la sensación de que es imposible ganar. O de todo lo contrario, que antes de empezar la partida ya tengan seguro que van a ganar sin esforzarse. En fin, entremos en materia:
Vimos en la imagen 5 el resumen de resultados de Sexta Ampliada. En las imágenes 9 y 10 veremos los resúmenes de resultados de Sexta Pura (la edición oficial de los años 2000) y de Manuscritos de Nuth (la versión elaborada por el equipo de Cargad!). Podemos ver que algunas facciones mantienen puestos similares independientemente del sistema (como Mortales del Caos), manteniéndose en puestos altos, medios o bajos. Otras facciones cambian notablemente su posición y puede que sus jugadores se frustren o alegren al cambiar de sistema. Pero, pediría a cualquiera interesado en esta materia que se abstenga de comentarios como: "mejorar mi facción que ha perdido 7 puestos", pues igual está muy cerca de la media y si queremos acercarnos a un juego equilibrado ese es el valor a tener en cuenta. En cualquier caso, sí es interesante conocer la distribución de Winrate (y dispersión) de cada facción en cada sistema.
En estas tablas podemos observar la posición relativa de cada facción en los diferentes sistemas, su frecuencia de uso y la dispersión relacionada con la media de cada sistema. Vistas las tres tablas en conjunto, creo que podemos abogar por el uso de Sexta Ampliada como el sistema menos desequilibrado relacionado con Sexta. Que cada uno use el sistema que le apetezca, y seguramente para partidas temáticas otros sistemas puedan ser incluso más atractivos o sencillos. Pero los datos son claros. Aunque Sexta Pura y en Manuscritos de Nuth son sistemas sólidos, la suma total de las dispersiones en Sexta Ampliada es de casi la mitad. Creo que esto se produce, en gran medida, por un factor que no hemos comentado hasta ahora. Warhammer Fantasy es un juego tremendamente complejo. 17 facciones con cientos (o miles) de unidades, perfiles y reglas. No hay dos enfrentamientos iguales recogidos (por iguales me refiero a la misma misión con listas idénticas en un mismo entorno). Eso y que el azar tiene un componente muy importante en este juego, haciendo que muchos desequilibrios se ajusten por mera suerte. Puedes tener la mejor estrategia y unidad del juego, que si sólo sacas 1s no llegará muy lejos ese día. Por tanto, hasta la lista más dura y difícil de enfrentar tiene muchas otras que la contrarrestan. En resumen, Sexta Ampliada es el sistema más equilibrado.
Pero, para quien quiera saber cómo de equilibrada está cada facción en cada sistema, hemos elaborado un gráfico, pero que tiene mucha información y puede resultar un poco confuso.
5. CLASIFICACIÓN POR FACCIONES
- *Tier 1. Facciones situadas por encima de dos desviaciones típicas (+0,62 puntos de dispersión respecto a la media).
- *Tier 2. Facciones situadas entre una y dos desviaciones típicas positivas (entre +0,31 y +0,62 puntos de dispersión respecto a la media).
- *Tier 3. Facciones situadas a menos de una desviación típica, es decir, muy cerca de la tendencia central o media (valores de dispersión respecto a la media situados entre -0,31 y +0,31).
- *Tier 4. Facciones situadas entre una y dos desviaciones típicas negativas (entre -0,31 y -0,62 puntos de dispersión respecto a la media).
- *Tier 5. Facciones situadas por debajo de dos desviaciones típicas (-0,62 puntos de dispersión respecto a la media).
- Tier 1. Enanos del Caos. Son la única facción que está en esta categoría (editado por tener un pequeño error de explicación).
- Tier 2. Demonios del Caos. Son la única facción que está en esta categoría.
- Tier 3. Bretonia, Skaven, Elfos Silvanos, Bestias del Caos, Mercenarios, Orcos y Goblins, Reinos Ogros, Elfos Oscuros, Condes Vampiro, Mortales del Caos, Hombres Lagarto, Altos Elfos y Enanos. Como buena distribución normal, la mayor parte de resultados se concentran cercanos a la tendencia central.
- Tier 4. Imperio y Reyes Funerarios. Sólo dos facciones cumplen este criterio (editado por tener un pequeño error de explicación).
- Tier 5. No hay ninguna facción en este apartado.
6. CONCLUSIONES
Finalmente, sólo puedo agradecer a los lectores que hayan continuado hasta aquí su tiempo invertido. En esta entrada he intentado sólo hacer una especie de foto del estado actual del juego. Pues, aunque he hecho alguna sugerencia, realmente ha sido superficial. Más adelante tengo intención de desarrollar esta entrada con otra nueva que explique algunos cambios que, en mi opinión personal, podrían mejorar el equilibrio de este juego. Y serán sugerencias personales, no del resto de personas que forman parte del equipo de Leyendas en Miniatura ni del proyecto colaborativo de Sexta Ampliada, cuyas decisiones son acordadas por numerosos grupos de juego. Cualquier comentario, sugerencia u observación sobre el contenido tratado en este artículo será bienvenido, pero os emplazo a que las ideas sobre revisiones de unidades, reglas y costes de Sexta Ampliada os las reservéis para esa futura entrada, o la que publicó Cordo sobre, precisamente, la revisión del proyecto, pues aquí podrían perderse al no ser el objetivo de hoy.
También, quiero agradecer a todos los organizadores de eventos que tan amablemente me han cedido los resultados de sus torneos, a los creadores de las páginas de https://torneoswarhammer.com y de https://wargamesywarcosas.wordpress.com donde he podido acceder fácilmente a muchos resultados y a mis compañeros de Leyendas en Miniatura que han tenido la ocasión de aguantarme y aportar contenido a este asunto.
Y ya para concluir este tochopost, quiero terminar agradeciendo a Cordo el trabajo que se pega siempre de revisar y corregir todas las publicaciones y al universitario eterno que es Fran el Calvo, cuya experiencia investigadora ha mejorado el contenido de este artículo. Y también al filósofo que tiene la verdad absoluta, aunque no le hagamos caso y los datos digan lo contrario.
Nos leemos próximamente,
Un saludo.
- Rass










Buen artículo, buen trabajo de recogida de datos y su análisis. Curioso lo de Reyes, estando en Sexta pura en el medio y en Nuth arriba, la bajada a 6+. Seguiré mirando la hoja de cálculo durante días, gracias por compartirlo!
ResponderEliminarMuchas gracias!
EliminarEl gran problema de las estadísticas está, sin duda, en la interpretación de sus datos, en tomarlos como conclusiones. Por poner un ejemplo sencillo: comparamos renta per cápita de Villarriba y Villabajo. En el primero vive un millonario. La estadística nos da el dato, bien calculado, de que en Villarriba la renta es superior. Y entonces nosotros concluimos que su población es más pudiente, y nos equivocamos.
ResponderEliminarAquí pasa lo mismo. Se mezclan datos de distintas versiones de cada juego (pre y post cambios importantes), de torneos con distintas restricciones en la fabricación de listas (que pueden afectar de forma diferente a cada facción), de facciones con muy distinta representación y sin tener en cuenta que, en muchos casos y dado el pequeño tamaño de la comunidad, es la misma persona jugando la misma facción una y otra vez, cuando el nivel de juego e incluso el objetivo al asistir a un torneo "competitivo" varía de forma dramática. De igual forma, se compara la dispersión estadística de facciones frente a la media, teniendo estas muy diferente número de observaciones (por lo que el peso del azar no impacta igual a todas), y también entre sistemas, los cuales tampoco han sido empatados en número de observaciones.
Todo esto envenena de forma decisiva cualquier conclusión que queramos sacar de "los datos", y explica revelaciones sorprendentes, como que condes vampiro esté en una posición media o incluso baja, cuando sabemos que es una de las facciones más competentes. ¿Por qué? Pues no podemos saber la causa exacta, pues la mezcolanza de datos lo impide, pero podría deberse a la presencia recurrente de listas de costa del vampiro en últimas posiciones, el diferente nivel de los jugadores que la llevan, etc.
Igual pasa con la conclusión final, previamente buscada al inicio del estudio, de que sexta ampliada es mejor que pura o manuscritos. Si no he entendido mal, la conclusión se basa en la dispersión frente a la media de los "winrates" de cada facción (contando, además, facciones que en sexta pura no tienen ni un libro como tal, como enanos del caos), pero partiendo de datos con distinto número de observaciones (ampliada tiene EL DOBLE que pura). ¿Cómo van a tener ambos la misma dispersión estadística? Pero no importa, llegamos a la conclusión de que ampliada (entiendo que el conjunto de sus versiones hasta el día de hoy, vs el conjunto de versiones del resto, que es lo que se ha comparado) es más equilibrada.
En definitiva, evaluar el equilibrio de un juego con winrates tiene muchísimos sesgos, y requiere mucha prudencia al interpretar los resultados. Si encima los datos de partida no son siquiera homogéneos, no vienen de un conjunto de reglas fijo, ni de un número gigantesco de jugadores ya previamente filtrados por una cierta "capacidad de juego", las facciones no están igualmente representadas y además un mismo jugador puede sesgar el resultado de la facción que juega siempre en un sentido o en otro, la tarea se plantea imposible.
Resulta desolador que un trabajo tan intenso como el presentado resulte tan difícilmente aprovechable
Hola Javier,
Eliminaren primer lugar, gracias por tomarte el tiempo de leer un artículo tan extenso y por elaborar un comentario tan detallado. Coincido contigo en la idea central de que una de las mayores dificultades del uso de estadísticas no está en el cálculo, sino en la interpretación de los datos, y precisamente por eso he intentado que el artículo sea lo más explícito posible respecto a la muestra, los sesgos y las limitaciones metodológicas desde el primer momento. Quizás pude remarcar más algunos aspectos, pero intenté dejarlos claros, ya que tenerlos en cuenta nos ayuda a tomar decisiones.
Este trabajo no pretende sentar cátedra ni presentar conclusiones definitivas, sino aportar una fotografía aproximada del metajuego real a partir de los datos disponibles, con la intención de ir sustituyendo gradualmente percepciones individuales por información compartida y discutible. Soy plenamente consciente de que la muestra es heterogénea, pues se mezclan versiones anteriores y posteriores a cambios, torneos con restricciones diferentes, comunidades locales con dinámicas propias y jugadores recurrentes con distintos niveles y objetivos competitivos. No he intentado ocultar estas limitaciones, al contrario, forman parte explícita del análisis.
Idealmente, contaríamos con muestras mucho más grandes y homogéneas que permitieran segmentar por puntos, restricciones concretas o incluso perfiles de jugador. Pero la realidad de una comunidad relativamente pequeña como la nuestra hace que eso no sea posible, al menos hoy. Aun así, trabajar con más de 4.500 resultados de partidas permite observar tendencias generales, pero algunos datos segmentados son menos robustos, claro. En ese sentido, el enfoque es similar al de muchos estudios observacionales, donde las limitaciones no necesariamente invalidan la información que se obtiene. Te animo, a que consultes el tamaño de muestra de encuestas tan conocidas como el barómetro del CIS, para ver cómo se trabaja con datos imperfectos y aun así se extraen conclusiones prudentes.
EliminarPor otro lado, hay algunos aspectos que señalas que yo no considero que sean una limitación. El hecho de que un mismo jugador repita facción en varios eventos, o tenga una actitud más o menos competitiva, no se ha tratado como un problema a corregir, sino como parte del propio ecosistema del juego. Medir y filtrar el “nivel” de los jugadores exigiría criterios extremadamente discutibles y difíciles de aplicar y, además, desplazaría el foco del análisis. Aquí no se evalúa el equilibrio de las facciones en manos de jugadores “pro”, sino su comportamiento agregado en el contexto real en el que se juega el sistema: con quien le apetece montar un ejército, con listas mejores o peores, y con motivaciones muy distintas para acudir a un evento. No hablamos de un equilibrio teórico, sino del resultado de las partidas.
Es cierto también que el número de observaciones difiere entre facciones y entre sistemas, y eso afecta a la robustez de algunos resultados individuales. Por ese motivo he insistido en no fijarse tanto en posiciones relativas como en la distancia respecto a la media dentro de cada sistema (centrándome especialmente en Sexta Ampliada) y en interpretar los datos con prudencia. Comparar muestras diferentes no equivale a decir que sean idénticas, sino a observar si, aun con esa heterogeneidad, existen patrones consistentes.
Sobre la comparación entre sistemas, en ningún momento se afirma que uno sea “mejor” que otro, sólo hablamos de mayor equilibrio respecto al winrate. Por tanto, te agradecería que te aplicaras la misma rigurosidad que pides, ya que en tu comentario se me atribuyen afirmaciones que no he hecho y eso es una forma de demagogia.
Siguiendo la misma linea argumental, podemos valorar, por ejemplo, tu comentario sobre los Condes Vampiro, donde afirmas que “sabemos” que esta facción es de las más competentes, ¿a quién representa ese “sabemos”? ¿En qué datos o información concreta se apoya esa afirmación? También explicas que los resultados de Condes Vampiro están influidos por el uso de la lista de Costa del Vampiro, pero ¿por qué no habría que incluirla? ¿No forman parte de la facción?
Aprovecho para aclarar, además, que tengo en alta estima el trabajo del equipo de Cargad! y de Manuscritos de Nuth. De hecho, el propio artículo señala que Sexta Pura y Manuscritos parecen sistemas relativamente equilibrados, como puedes ver resaltado en negrita en las conclusiones. Nuestro trabajo no pretende desacreditar a nadie, pues hablamos de juegos que se han diseñado con enfoques diferentes.
EliminarDicho esto, creo que es importante señalar algo que atraviesa buena parte de tu crítica. Se exige al análisis un nivel de control de variables que, sencillamente, no es aplicable a un juego vivo jugado por una comunidad real. ¿De qué manera propondrías medir de forma objetiva el nivel de cada jugador? ¿Establecerías el equilibrio de cada facción solo en manos de jugadores que consideremos “pro”, o nos valdrían todos? ¿Quién decide ese criterio? ¿Cuál sería, para ti, un “conjunto de reglas fijo”? ¿Solo partidas a 2.000 puntos? ¿Por qué habría que filtrar la capacidad de juego de los jugadores y cómo se haría de forma no arbitraria?
Planteo estas cuestiones porque, si exigiéramos ese grado de homogeneidad y pureza experimental, no solo sería inviable analizar este juego, sino también el metajuego de otros títulos más populares como son Warhammer 40k, Magic, League of Legends o prácticamente cualquier sistema competitivo real. En todos ellos, jugadores casuales, decisiones subóptimas y elecciones temáticas forman parte inseparable del conjunto de datos observados.
Nuestro enfoque no intenta describir el rendimiento óptimo teórico de una facción (o lista concreta) en condiciones ideales, sino cómo se comportan las facciones y los sistemas cuando se juegan de verdad, con jugadores reales, listas alternativas, errores, pruebas y motivaciones muy diversas. Ese conjunto, incluidos jugadores mediocres y listas poco afinadas, no es ruido que haya que eliminar, sino el ecosistema real del juego. Excluirlo sería describir otra cosa distinta y más arbitraria.
En resumen, los datos tienen fallos y, por tanto, las conclusiones deben leerse con cautela. Pero que la información disponible no sea perfecta no implica que apunte en sentido contrario, sino simplemente que describe una dirección provisional, abierta a revisión conforme se disponga de más y mejores datos.
De nuevo, gracias por el comentario y por enriquecer el debate. Espero ansioso tu respuesta, tu tono constructivo siempre nos es de ayuda.
Un saludo,
Rass
Hola Rass, gracias por tomarte la molestia de contestar. Son muchas cosas y no sé si podré retenerlas todas, así que voy a intentar ir a lo importante. En mi opinión, es mejor tener menos datos "buenos" que muchos "malos". Por ejemplo, el sistema de juego. Sexta ampliada dejó sus reglas fijas en 2023 si no recuerdo mal, y con ese mismo ruleset se han celebrado ya varios eventos, a 2000p, y se va a añadir Magritta. Utilizaría esos datos y descartaría todo lo demás, ue incluye versiones de ampliada que son literalmente iguales que manuscritos, partidas a 1500 que llevan otras dinámicas totalmente distintas, torneos de dos rondas, etc. Porque al final todos esos datos aportan "n" pero también multitud de sesgos.
EliminarLo mismo pasa con facciones poco representadas. Intentar adivinar el nivel de poder de un ejército con un número de observaciones muy bajas y casi siempre en manos del mismo jugador me parece un error, creo que confunde más que informa. Es como el ejemplo que ponía con Villarriba, tal vez ese pueblo cuente "con más maserattis" que el de al lado, pero la población es igual de pudiente, sólo envenena los datos un individuo.
Respecto al nivel de poder de los condes, esto me parece muy importante. Si estamos aceptando las enormes limitaciones del estudio, y el estudio arroja un dato "curioso", es imperativo ponerlo en cuarentena. ¿Qué cómo sé que condes vampiro es un ejército "top tier"? Pues porque lo he jugado decenas de veces, y también lo he tenido enfrente y he utilizado otros ejércitos, y la facilidad que tengo para ganar con él o la dificultad de vencerle es constante, robusta y muy evidente. Y esta experiencia no es sólo personal, es compartida por muchos. Tal vez no puedo generar números que demuestren que condes vampiro está fuerte, pero SÉ que lo está, y ese conocimiento "no medido numéricamente" tiene para mí muchísimo más valor que el dato obtenido de un winrate que ha salido de una mezcla heterogénea de resultados.
Por último, coincido plenamente contigo en la enorme dificultad que reviste el estudio estadístico de resultados de partidas en wargames (o más bien su interpretación), y por ese motivo nunca me han gustado los winrates como indicador del balance de un sistema. ¿Creo que son totalmente inútiles? No (mientras vengan de datos lo más homogéneos posibles), pero creo que no sirven para afirmar el balance de un juego, algo que creo que se hace aquí y que se ha hecho masivamente en 40k, en la época de 8a y 9a al menos. Pueden dar alguna información, creo que es positivo recogerlos (homogeneamente) y monitorizarlos, pero que no se deben jamás tomar como "la demostración" de que el juego está balanceado...que es lo que luego hace todo el mundo con ellos.
En definitiva: filtraría los datos, sacaría los winrates de esos datos filtrados (sólo de ampliada, porque es el juego de vuestro grupo y al que vais a seguir jugando), y utilizaría la información en conjunto con otros datos (uso de unidades concretas en torneos, por ejemplo un 80% de los OyG están usando despachurradores, mal tema) y con la propia experiencia de la comunidad para apoyar las decisiones que se tomen, teniendo en cuenta que, probablemente el valor de winrate es el menos informativo de todos, y no al revés.
Y por cierto, otra herramienta que debería explorarse para apoyar la toma de decisiones es la inteligencia artificial. De nuevo, sus juicios no deberían tomarse jamás como la Verdad Revelada, ni sustituir a la propia experiencia de juego, pero sí pueden aportar una visión muy interesante sobre temas de equilibrio, al tener una capacidad de cálculo gigantesca. Esto es algo que hemos hecho todos alguna vez: que es mejor, ¿una armadura de 1+ o una especial de 4+? Pues depende, contra F3 gana la primera, mientras contra F7 o golpe letal la segunda...hay mucha más F3 que 7, pero si tu personaje tiene R5, la F7 tiene muchas más opciones de herirlo, etc etc etc. Bueno, pues todos esos cálculos puede hacerlos una IA en segundos. También puede, de seguro, leerse el reglamento de sexta entero, todos los libros y los manuscritos de Altdorf, y proponerte un perfil para, pongamos, la mecroesfinge (en base a la miniatura, o al perfil que tuviese en octava) acorde a la edición. ¿Qué saldrá de ahí? No lo sé, yo no lo he probado y JAMÁS lo tomaría como un mandamiento divino, pero puede ser muy interesante verlo y nos puede ayudar a tomar decisiones más robustas que las que tomamos ahora
EliminarEnhorabuena por esta titánica tarea de análisis: pertenezco a ese segmento de jugadores a quienes la estadística y las tablas nos gustan mucho, y este artículo lo he podido disfrutar.
ResponderEliminarVoy a dar mi opinión personal y, tal vez con algo de suerte supere en extensión por una vez el texto de Javi Arteaga. Me sitúo a medio camino entre su pesimismo y el optimismo con cuidado de Rass. Los datos no tienen ni pretenden tener la robustez de, por ejemplo, un análisis clínico para un medicamento. Para ello habría que estandarizar las condiciones de medida: el nivel general de los jugadores, su experiencia con la facción, los escenarios —y su impacto en cada facción—, la exposición al azar de los dados y un sinfín de características adicionales. Eso no sería sencillo ni aunque el bueno de Rass fuese analista profesional de wargames y cobrase por ello. La mejor conclusión que se extrae es que la mayor parte de facciones se encuentran en un bloque de resultados relativamente homogéneos cuando se mira el conjunto sin controlar todas las variables que acabo de mencionar, y que asimismo tampoco media un abismo entre la mejor facción y la peor. Informa que la edición está, a grandes rasgos, relativamente bien equilibrada, o al menos que los desequilibrios existentes se diluyen cuando entran en juego el azar o la pericia de cada general. Creo que es algo que todos sabíamos de manera intuitiva cuando decidimos regresar a Warhammer y elegimos Sexta edición y no otras.
Coincido con Arteaga en que con estos datos no sé hasta qué punto es lícito indicar que Ampliada tiene el mejor equilibrio interfacción. Al tener el mayor tamaño muestral se podría estar inflando artificialmente la conclusión de que la dispersión de los datos es menor. Para que esta conclusión fuera estadísticamente válida habría que estudiar intervalos de confianza, cálculo de la p estadística y un test estadístico que ajuste el resultado en función del tamaño muestral. Si se quiere comparar con algo más de rigor, podría ser interesante unir los subconjuntos de Manuscritos+Pura VS Ampliada. Ahí sí que tendrán tamaños muestrales semejantes.
Por último, hay que tener cautela al extraer conclusiones. El propio Rass así lo advierte en su punto 6 Dificultades del análisis: «no podemos tener en cuenta algunas variables importantes, como por ejemplo pueda ser que determinadas facciones sea más usadas por jugadores novatos y otras más reservadas a expertos». Esto aplica con especial incidencia a los dos extremos. Enanos del Caos es un ejército de especialista. Nadie reinicia su andadura en Warhammer con miniaturas descatalogadas. De hecho, muy pocos lo tendrían en sus armarios cuando nos picó a todos la mosca nostálgica de Sexta y desempolvamos nuestras muñecos hace cerca de diez años. Es más, dudo que sea ni el segundo ni el tercer ejército de los jugadores que lo llevan hoy. A mí no me sorprende que estén en lo alto de la clasificación. Sería un error concluir solo en base a esto que hay que caparlos para acortar las diferencias.
A los Reyes funerarios podría sucederles otro fenómeno. Tampoco es un ejército de los más comunes a juzgar por los datos (obviando la sopa del Caos, Reyes sería el cuarto ejército menos jugado). De acuerdo con mi experiencia como jugador de Reyes, tienen una curva de aprendizaje más pronunciada que otros ejércitos. Yo tuve derrotas demoledoras en las primeras 3-4 partidas que los jugué, pero cuando interiorizas sus mecánicas se convierten en un ejército eficiente y tal vez en el menos sensible a caídas de mano. Jamás diría que son la peor facción del juego ni la que más mimo necesita como podría sugerir la tabla. Tal vez este efecto de la curva de aprendizaje haya influido en exceso las lecturas. Como buen acólito de Settra, dejo esta impresión personal por si os resulta de interés.
Un saludo a todos y, de nuevo, gracias por este artículo tan interesante.
BdP
Joer, mira que pregunté y me apoyé en compañeros de Leyendas que hicieron aportaciones muy chulas para este artículo, pero, si llego a saberlo, me pongo en contacto contigo. Quizás podamos contar contigo en un posible futuro vídeo del "Trono de Cucharas" sobre este tema.
EliminarTotalmente de acuerdo en que la pretensión de esto es hablar de un juego, luego no tenemos que ser tan rigurosos como si hiciéramos ciencia o trabajáramos sobre salud. Y sí, para mí el valor realmente importante de este artículo es que vemos que el juego parece relativamente equilibrado, o que al menos el componente de azar es suficientemente importante para no tener la sensación de que con una facción es imposible ganar y que con otra se hace sin siquiera tirar dados.
Respecto a los análisis que propones, la verdad es que no tenía mucho interés inicialmente en hacer algo tan elaborado, ya que requiere de tiempo y de otros programas más específicos que una simple hoja de cálculo. Me anoto tus aportaciones, quizás me ponga a ello y te pregunte sobre el tema.
Y sí, la verdad es que en el artículo intenté señalar las limitaciones de todo lo aquí recogido. Y, como bien dices, el caso de los Reyes Funerarios es muy particular. Pero toda la información que podamos usar para tomar decisiones puede ayudarnos.
Gracias por comentar.
Precioso artículo y muy interesante.
ResponderEliminarSabemos que como bien dices los datos de la muestra no son enteramente comparables, pero sí que da una idea de cómo se mueven los ejércitos en distintos escenarios.
Muy chulo y muchas gracias por el currazo
Exacto, esa es un poco la idea. Aportar algo de luz en un terreno que suele estar colmado por opiniones interesadas en la mejora de la facción propia.
EliminarGracias por comentar!
¡Enorme el currazo! Deberías linquear el articulo en la sección de Sexta Ampliada para que no se pierda entre tanta escalada de pintura y trasfondo (sin desmerecer tales artículos) y así tenerlo más a mano.
ResponderEliminarUn saludo.
Hecho!
EliminarLo he dejado al final del todo, pero quizás Cordo le encuentre un lugar más apropiado.
Increible trabajo señor. Me quito el sombrero.
ResponderEliminarGracias señor!
EliminarBuenas, desde luego es un currazo enorme y esta generando un montón de debate e ideas cruzadas. Creo que como en todos los analisis estadísticos se generan artefactos matemáticos que no siempre son la traslación de la realidad, como has comentado al igual que el lobby de los farmacéuticos (Javi y BdP).
ResponderEliminarHe de decir que un win rate tan diferente entre ejércitos no me parece equilibrado, pero no creo que sea solucionable en ningún caso, desde que la cohorte no puede tener en cuenta la habilidad del general ni la disposición con la que se va al torneo ni como es el juego en si mismo, donde hace facciones que son muy vulnerables al azar y otras que no lo son en absoluto.
Sobre el asunto no muerto, creo que Reyes sufre el efecto estadistico de que es un ejercito de todo o nada, ya que la posibilidad de que muera el hierofante (que tiene poca protección y es muy vulnerable a errores) modifica completamente la partida.
Sobre los Condes coincido con Arteaga son sin duda de las facciones mas potentes del juego y creo que un analisis estadistico que no lo demuestra presenta una incoherencia interna. Creo que puede deberse a varios factores:
- Incluir la costa del vampiro como una sub-facción de Condes (creo que se ha hecho así).
- El efecto generado en los resultados de jugadores poco experimentados que sufren masacres por muerte del general en turnos iniciales.
- Creo que para hablar del winrate de cada facción podría haber interesado ponderar de alguna manera los ejércitos que están en el cuartil superior de los torneos, ya que Condes suele estar ahí de manera constante y ese efecto nos e tiene en cuenta.
Añado que un efecto indeseado de este trabajo ha sido gente de naturaleza mas "apretadora" que quiere usar eso excusa para ir mas apretados o quejarse de su ejercito.
Con todo, viva el debate warhammeril
Hola hola!
EliminarGracias por el comentario. Me alegro que esté generando un debate sano y que intentemos, en cierta medida, abstraernos sólo de nuestra experiencia personal y tener una visión algo más amplia.
En primer lugar, quiero dejar claro que esto es solo un acercamiento a la realidad y que los datos incluyen limitaciones (hasta importantes), pero también es cierto que la mayor parte de gente comenta qué le parece algo mejor o peor en base a su experiencia personal o una muestra muy reducida de datos y eso me parece un sesgo y una limitación aún mayor, pues muchas veces ni siquiera son ampliamente compartidas esas opiniones.
Personalmente no me parece exagerada la diferencia de winrate entre facciones, pero al final esto es una cuestión de interpretación subjetiva y cada uno tendrá su propio baremo. Supongo que la conclusión lógica de pensar que no está equilibrado es buscar un mayor ajuste.
Hay cuestiones que apuntas tú, y otros, que yo también tenía mucho interés en valorar, pero el acceso a los datos que he tenido no me lo permite. Podría hacerlo con los de nuestros eventos de Leyendas y 2-3 más, pero la muestra queda tan pequeña que no tendría ningún valor estadístico. He tenido en cuenta las listas de Costa del Vampiro, al igual que el resto de listas alternativas porque me ha sido imposible saber en un número importante de eventos si los ejércitos llevaban o no listas alternativas o a quién se enfrentaron durante el evento. Descartar las que conozco hubiera supuesto que se eliminaran no sólo esos resultados, sino todos los del evento, pues sus rivales obtuvieron resultados enfrentándose a esas mismas listas y eso también estaría alterado, siguiendo la misma lógica. De todas formas, me parece que el peso de la lista alternativa es mucho más marcado en la facción de Demonios del Caos que en Condes Vampiro.
En resumen, he tenido que escoger la "facción" como unidad de medida. Y "facción" incluye la lista general y las listas alternativas, aunque me hubiera gustado escoger sólo la lista general. También incluye a los personajes especiales en los pocos eventos en que se usaron y todo aquello que se recoge en ese libro de ejército. Eso no quiere decir que determinadas unidades o listas de un ejército medio no superen con creces los resultados de otras partes de ese libro. No me ha sido posible medir la coherencia interna de cada libro y creo que en un sistema tan sumamente complejo, todas las posiblidades imaginables requerirían quizás de millones de datos para poder analizarlos tan al detalle.
EliminarPor otro lado, el fenómeno de jugadores poco experimentados no se puede controlar de ninguna manera. No podemos establecer qué derrotas se explican por este motivo, como tampoco cuáles fueron las victorias casuales por nivel de veteranía, al azar o incluso si se hicieron trampas o no se pudo terminar todos los turnos de una partida. El único entorno que se me ocurre donde esto se controla mucho más es en eventos como el Corona de Estalia, pero nuevamente es un entorno con pocas muestras y este juego no solo es propiedad de los veteranos, también hay que contemplar a jugadores casuales, por mucho que nos pese. Y eso implica que esos jugadores puedan tener cierta tendencia a jugar determinadas facciones.
Por otro lado, quizás podría tenerse en cuenta lo que propones del cuartil superior. Pero eso me genera importantes dudas metodológicas. ¿Tendría el mismo valor ese cuartil en eventos de 100 jugadores que en otros de 12? Y, ¿por qué no el cuartil inferior? ¿Y los demás? No quiero que parezca que menosprecio la idea, pues me parece muy interesante, pero igualmente difícil de operativizar. Y, en caso de hacerlo, no sé qué valor podrían tener esos resultados que tienen en cuenta sólo a "los mejores". Aquí hemos valorado el total de resultados, no el puesto en la clasificación. El artículo incluye acceso a los datos "en bruto", por si alguien con más tiempo y conocimientos es capaz de darle una vuelta y extraer mejor información.
En cualquier caso, quiero remarcar que este artículo no se centra en las causas de por qué cada facción obtiene estos resultados. Ese contenido lo tenía medio elaborado para otro artículo, pero con todas vuestras aportaciones creo que lo voy a rehacer por completo, en un futuro. Esto simplemente es una "foto" de los resultados. Cuestiones como que los Reyes Funerarios tengan una curva de aprendizaje superior o que los Condes Vampiro sean los más populares, y por tanto más usadas por jugadores novatos, pueden ser conocidas, valorables y tienen un valor informativo, pero no para la descripción de los resultados obtenidos. Esas causas son objeto de otro debate, enfocado a "qué hacer". Este artículo apunta a, en el mejor de los casos, a que "algo hay que hacer" y, quizás, "con quién".
Y ya para concluir, estoy de acuerdo que esto puede servir para que algunos se quejen más o pidan ciertas mejoras o nerfeos. Aunque esta sería sólo la excusa del momento, sino buscarían otra. Mi intención es resaltar que el juego no está tan mal como algunos puedan pensar y que, a diferencia de otros juegos, no influye tanto la facción escogida sino otras cuestiones como, quizás, el emparejamiento, el nivel de pericia, las misiones o el propio azar.
¡Un saludo!
Vaya currazo Rass, ya solo el compilar todos los resultados de torneos me da pereza, sin empezar a pensar cómo analizar todos esos datos jajaja. Me ha parecido también muy interesante leer las opiniones que ha suscitado el artículo. Especialmente relevante me parece la distinción entre el "rendimiento teórico" de una facción llevada de forma óptima y el "rendimiento real" que ha tenido al ser llevada por jugadores de diferentes niveles o con diferentes objetivos. El ejemplo más obvio son los condes vampiro, que bien llevados con una lista óptima todos coincidimos en que son muy muy fuertes, pero en manos inexpertas que arriesguen al general pronto, o con una lista como costa del vampiro, están muy lejos de ese rendimiento top. También me sorprende la posición de los Reyes, ya que los he llevado y creo que tienen herramientas muy poderosas (como la Necroesfinge o el Arca de las Almas). En cuanto a los enanos del Caos, posiblemente su análisis sea el menos fiable porque tienen muy pocos jugadores y, como ya se ha apuntado, es un ejército que se juega con experiencia. Sin embargo, es verdad que también en el plano teórico es una facción que aúna los puntos fuertes de enanos + cuerpos baratos + caballería ligera + monstruos + magia, por lo que sí que creo que cabría analizar un nerfeo.
ResponderEliminarMe he dado cuenta de que no terminé de comentar lo que iba a decir xD. Con la separación entre el "rendimiento teórico" y el real, lo que venía a decir es que los datos por sí mismos no creo que deban justificar cambios para mejorar o empeorar a una facción. Por ejemplo, el hecho de que Condes no esté abusando en los torneos no quiere decir que no pueda hacerlo, sino que tenemos una comunidad que castiga socialmente el abusar, y eso hace que se limiten cosas como llevar diquitimil dados de magia. Los datos son útiles, pero en las revisiones considero que deben acompañar a la teoría, no sustituirla.
Eliminar