Donnerstag, 6. September 2012

Sag Ja zum Originalitäts- und Unvorhersehbarkeitsindex!

Salut, und Grüße gehen schonmal ins liebe Franzmannland – ohne ihre Sprache wäre ein so einprägsames Akronym für mein jüngstes Spielzeug nur erheblich schwerer möglich gewesen.


(Quelle)

Ja, der Titel gibt's ja perfekt preis: Heute geht es genau um meinen Originalitäts- und Unvorhersehbarkeitsindex, kurz: OUI. Im Englischen funktioniert das auch ziemlich einfach: Originality and Unpredictability Index, oder wenn wir ein bisschen die Wortbedeutung verdrehen, dann geht mit viel Fantasie auch noch Overusage and Uniqueness Index (eigentlich nicht, weil der Index ein Team nicht nur mit Standardlisten abgleichen, sondern auch gewisse andere Faktoren beachten soll). Was aber eine französische Interpretation angeht, da bin ich noch auf der Suche... Hm, aber überhaupt schwierig, weil mir zumindest so viel bekannt ist, dass die Franzosen Abkürzungen gern umdrehen, weil sie die meisten Adjektive hinten haben und weil sie zusammengesetzte Wörter in der Regel mit Präpositionen bilden. (Man könnte meinen, der französischen Sprache würde Abzug nach OUI zustehen, haha.) ...Na gut, das dürfte für eine Einleitung ausreichen. Ran an die Bouletten! :P

Fangen wir am besten mal an mit der Grundidee und der Motivation. Die gegebene Situation ist das VGC 2012 Metagame im Gesamten, wobei man gerne auch die Erinnerungen an vorherige Formate einschalten kann. Eigentlich ein recht gesundes Metagame, wäre nicht, ja wäre nicht... Wäre da eben nicht diese manchmal gar Flashmob-artige, ich nenn sie jetzt mal, Kopierkultur, die auf jeden Fall mal das Abendland gewiss mehr prägt als Kreativität im Teambau. Oh, ich weiß noch, damals 2008, da baut das Weltmeister-Team auf ein Level 1 Farbeagle und 2009 gewinnen ähnliche Setups mehrere Regionals. 2010 guckt sich ein Ami Techniker-Kapoera von Japanern ab, stellt das neben Scarf Kyogre, gewinnt damit seine Regional – und tut dies bei Weitem nicht als Einziger. 2011 holt einer mit einem defensiven Voltolos den Titel und ein Jahr später sind über die Hälfte aller Voltolos defensiv. Und jetzt kommt der Gipfel, das muss ich definitiv zur Verteidigung unserer Kultur sagen: Die Japaner haben's genauso geklaut wie wir! Aber warte mal, als ob die Welt wirklich so einfach wäre... Ne ne ne, pass mal auf: Es gibt hier ganz sicher keinen Grund für irgendein Land, anzugeben, denn Fakt ist erstmal: Die Kombination aus Angeberei und Verwirrungsheilung bzw. -verhinderung für den Partner ist in etwa so alt wie der Doppelkampf selbst. Fakt ist aber auch: 2012 sind es auf der WM nicht mehr die lieben Japaner, die Leute damit wegputzen, nein, es sind die Amis und Europäer, die sich gar regelrechte Angeberkriege liefern!! Aber warum eigentlich erst jetzt!? Selbst das ach so innovative Sumpex der Spanier, nun ja, ich will ihnen wirklich nichts verderben (ich find's eine sehr würdige Idee, ehrlich), aber selbst diese Idee hat bereits 2009 bei der WM gespielt, mit japanischem Kopf wohlgemerkt. Ja, warum eigentlich erst jetzt, warum denn bloß erst jetzt, aber dann auch in einem total übertriebenen Ausmaß... Flashmob sag ich, Flashmob. Na ja, Japaner allerdings machen auf mich auch längst nicht mehr den kreativen Eindruck wie einst... Weiß nicht, vielleicht liegt das aber auch einfach daran, dass wir jetzt in Form von Zufallsmatches die totale Globalisierung haben und dadurch einfach nur jene Leichen sehen, die sie schon immer im Keller hatten, wer weiß.

Gut, also das war ein bisschen Geschichte. Worauf ich hinaus will: Metagame. Metagame und Metagaming. Wenn jetzt beispielsweise nur einer mit der Angeberei-Geschichte gekommen wäre, dann hätte der unterm Strich durchaus als kreativ gegolten. Meine Fresse, selbst wenn nur einer Latios gespielt hätte, hätte der ein tränenreicher Witz des Heldentums werden können! Oder anders: Wenn einer was alleine macht, hat er immer den Vorteil der Unbekanntheit bzw. Unerwartetheit auf seiner Seite. Sobald aber viele genau dasselbe machen wie er, wird er plötzlich für die Allgemeinheit deutlich lesbarer. Das „meta“-Präfix steht überhaupt für Veränderung, und entsprechend hat der Gute auch kein gottgegebenes Recht, dass seine Idee auf ewig im Schatten verweilt. (Zurück zum ergiebigen Angeberei-Beispiel: Ganz sicher geh ich so weit mit, dass es höchste Zeit war, dass die Masche endlich mal den Weg über den Pazifik (bzw. China und Russland) findet. Die Taktik ist einfach zu gut, um sie ein Leben lang zu leugnen!)

Mein Ziel, konkret und greifbar gefasst: Finde ein numerisches Maß, das ein Team auf den Grad seiner Lesbarkeit analysiert. Da zählt einerseits, wie schon gesagt, Kreativität beim Teambau rein. Ich will es aber nicht dabei belassen, weil ein Maß, das allein Kreativität bewerten würde, ganz sicher keinen praktischen Nutzen hätte. Ob ein Team kreativ oder langweilig ist, das sieht außerdem man eh, wenn man drauf guckt. Deshalb verheiraten wir doch mal das a-priori-Überraschungsmoment der Kreativität mit dem a-posteriori-Überraschungsmoment der Kampfführung selbst, denn in der liegt ja schließlich am Ende des Tages die Wahrheit. Demzufolge: Mein Maß soll Auskunft darüber geben, wie anspruchsvoll es ist, ein Team mit begrenzten Ressourcen auszukontern. Und nein, da komme mir bloß keiner mit „guten Pokémon“ und „schlechten Pokémon“ oder gar „overpowered Pokémon“ – letztere sind im Kontext der VGC frei erfunden, sprich, man kann jedes Pokémon auf der Welt unkompliziert genug lahmlegen. Und sobald eines besonders beliebt wird, steigt die Wahrscheinlichkeit, dass es lahmgelegt wird!

Aber jetzt mal Schluss mit den ganzen Herumpredigten, weil die Sache nicht ganz unkompliziert ist. Gebraucht werden etwa Grundrechenarten. Wer IVs, EVs usw. verstanden hat, der wird auch den OUI verstehen.

Definition: Der OUI sei ein positives Maß, das die Einzigartikeit eines Teams und die Berechenbarkeit im Kampfverlauf auf eine Skala von 0 bis 100 gegen den Kontext eines Metagames abbildet. Eingabeparameter sind Movesets und Grundattribute der einzelnen Pokémon, die genaue(n) Strategie(n) des Teams und das Bezugsmetagame.

Fangen wir mal an mit diesem Bezugsmetagame. Das ist so ziemlich der schwammigste Teil des Ganzen, aber dafür auch der, der noch am implizitesten ist. Die Beurteilung sollte sich eben einfach möglichst auf ein Metagame festlegen, und zwar idealerweise auf das, an dem das Team teilnehmen will, also auf Deutsch: „Gegen welche Leute will der Spieler mit dem Team antreten?“. Beispielsweise ist das Metagame der japanischen Landesmeisterschaft ein komplett anderes als das der europäischen Landesmeisterschaften, also ist es ganz sicher in Ordnung, zwischen denen zu unterscheiden. In meinem begleitenden Rechenbeispiel werde ich als Bezug das Metagame der Weltmeisterschaft nehmen, bzw. im weiteren Sinne überhaupt das globale Metagame dieses Sommers.

Es gibt also maximal 100 Punkte zu holen. Die sind folgendermaßen aufgeteilt: 25 auf die Außensicht des Teams (Situation Teamvorschau), 15 auf die Innensicht (II, Situation Viererwahl) und 60 auf die einzelnen Pokémon. Es läuft so, dass wir gerade mit einem Punktekonto von 100 beginnen und davon jedes Mal etwas abziehen, wenn eine Information gefunden wird, die leicht gegen das Team verwendet werden kann. Dabei ist zu beachten, dass die Abzüge das Startkapital nicht überschreiten dürfen, also, es können beispielsweise für die Schwächen und Resistenzen nicht mehr als 10 Punkte abgezogen werden – sollte man wirklich zu einer so schlechten Analyse kommen, springt das Teilergebnis einfach auf 0. Da das textuell etwas verwirrend sein mag, will ich zur Verdeutlichung schonmal die Teilwertungen mit ihren maximal möglichen Punkten zeigen – genau die bilden die angesprochenen Wertebereiche.

Außensicht Schwächen und Resistenzen (10)
Pokémon im Metagame und Abhängigkeiten (15)
Innensicht I Details zu Pokémon 1 (10)
Details zu Pokémon 2 (10)
Details zu Pokémon 3 (10)
Details zu Pokémon 4 (10)
Details zu Pokémon 5 (10)
Details zu Pokémon 6 (10)
Innensicht II Handicap-Auswahl (15)

Außensicht (25)

Schwächen und Resistenzen (10)

Der Einstieg ist leicht und steht über jeder Diskussion; er basiert auf absoluten und unantastbaren Fakten: den Typen, die die Pokémon mitbringen. Dieser feine Zehner maximal, der bewertet, wie schwer oder leicht diese Konstellation durch Verwendung von Attacken bestimmter Typen zu brechen ist. Weil das alles in allem nur eine sehr oberflächliche Betrachtung ist und gewiss jedes Team irgendwelche kleinen Probleme in der Hinsicht zu haben vermag, gibt es nur einen kleinen Anteil der Gesamtpunkte dafür. Außerdem ist der Einfluss dieses Parameters auf den Kampfverlauf selbst eher gering, wenn auf hohem Niveau gespielt wird.

Also, wie gesagt, wir starten mit voller Punktzahl – in diesem Fall 10 – und ziehen dann ab, wenn Kritikpunkte ans Licht kommen. Ich werde die Abzugskriterien stets tabellarisch darstellen:

-0,5 Jede Doppelschwäche (bspw. Despotar und Garados geben zusammen -1, kommen noch Brutalanda und Knakrack dazu, gibt es -2) auf einem Pokémon im Team erhält Abzug, weil sie mit entsprechenden Attacken deutlich einfacher als mit anderen zu schlagen sind.
-0,5 Jeder Typ, gegen den mehr Schwächen als Resistenzen/Immunitäten im Team sind, führt zu Abzug. Fähigkeiten (bspw. Gastrodons Sturmsog oder Bronzongs Hitzeschutz) dürfen einbezogen werden, sofern sie wirklich vorhanden sind. Items wie Luftballon oder Beeren zählen jedoch nicht, da ihre Wirkung nur beschränkt ist.
-0,5 Jeder Typ, gegen den weniger als zwei Resistenzen/Immunitäten im Team sind, führt ebenfalls zu Abzug. Es gelten die gleichen Zusatzbemerkungen.
-0,5 Jeder Typ, gegen den mehr als zwei Schwächen im Team sind, wird natürlich auch bestraft, genauso wie die Zusatzbemerkungen auch hier gelten.

Die Abzüge sind außerdem nicht exklusiv, sprich, wenn schon Abzug für nur eine Resistenz gegen Wasser gegeben wurde, beispielsweise, dann kann es obendrauf noch weiteren Abzug dafür geben, dass drei andere Pokémon schwach gegen Wasser sind. Da das hier alles nur halbe Punkte sind, wir aber im Endergebnis nur ganze Punkte wollen, ist es absolut in Ordnung, wenn bei ungeraden Abzügen der letzte erlassen wird. Also eine -4,5 in der Summe wird abgemildert zu einer -4, was unterm Strich zu 6 Punkten in der Kategorie führt.

Nun erstmalig zum Begleitbeispiel, an dem ich den gesamten Prozess demonstriere. Das wird genau das veröffentlichte Team von neuerdings, die Dinodorantes Raros, sein. Es sind die sechs Pokémon des Teams gegen alle 17 Typen zu testen. Wir finden: Gegen Flug sind die Schwächen in der Überzahl und es gibt keine zwei Resistenzen, also -1. Käfer trifft auf zu viele Schwächen und Stahl auf zu wenig Resistenzen, nächste -1. Wasser gleiches Problem wie Flug, nochmal -1. Drachen trifft auf eine Schwäche und keine Resistenz, -1. Außerdem gibt es gegen Elektro nur eine Resistenz und Despotar hat eine schwere Kampf-Schwäche (Rospelbeere ist wohlgemerkt zu ignorieren), nochmal -1. In der Summe führt das zu -5 und damit 5 von 10 im Endergebnis. Ein ziemlich mittelmäßiges Ergebnis offensichtlich, aber das ist nur natürlich: Teams, die kein Good Stuff aus dem Lehrbuch sind, haben nunmal sehr häufig eher „unreine“ Typenkonstellationen und es ist auch nicht allzu sinnvoll, sich krampfhaft dagegen zu wehren. Die praxisbezogene Implikation ist denn eben, dass Gegner auf dem Papier die Möglichkeit haben, mich mit Drachen und Käfern zu ärgern, beispielsweise. (Was sie auch garantiert nicht zu selten gemacht haben...)

Pokémon im Metagame und Abhängigkeiten (15)

So, und hier kommt der erste und gewiss nicht letzte Teil, der hochgradig subjektiv ist, weil wir schlichtweg keine vernünftigen Statistiken haben. Das soll uns aber nicht weiter stören, denn wenn Bauchgefühl schon beim Teambau involviert sein darf, dann kann es auch in der Teamanalyse nicht stören. Jedenfalls geht es jetzt darum, Abzüge dafür zu verteilen, dass Pokémon weit verbreitet in einem Metagame sind, und dafür, dass zwischen mehreren Pokémon starke Abhängigkeiten bestehen. Zunächst die Tabelle zu den Benutzungsraten der einzelnen Pokémon; die Abzüge sind pro Teammitglied exklusiv und können daher in der Addition nicht größer als -12 werden:

-2 Jedes extrem häufig benutzte Pokémon führt zu starkem Abzug; im Metagame der Weltmeisterschaft wären das beispielsweise Metagross, Kapoera oder Cresselia.
-1 Jedes andere häufig benutzte Pokémon führt zu etwas milderem Abzug; das können in etwa Pokémon wie Seedraking, Gastrodon oder Rexblisar sein.
-2 bis -1 Pokémon, die man (unabhängig von der Allgemeinheit) persönlich auffällig oft gebraucht, führen deshalb zu großem Abzug, weil nicht nur Teams berechenbar werden können, sondern auch Menschen. Wenn das Pokémon, obwohl man es so oft spielt, aber dabei in ganz verschiedenen Varianten gespielt wird, kann der Abzug auf -1 abgemildert werden.

Des Weiteren soll es potenzielle Abzüge für die Erscheinung des Teams im Gesamten geben; die Kriterien dafür lauten wie folgt:

-2 bis -1 Jede offensichtliche Abhängigkeit eines Teammitglieds von einem anderen bringt Abzug von -2 mit sich. Paradebeispiele sind vitale Wetterabhängigkeiten (Seedraking braucht Quaxo für Wassertempo, Glaziola braucht Rexblisar für Blizzard-Treffsicherheit usw.). Etwas indirektere Abhängigkeiten bringen -1 (beispielsweise Falterreigen-Ramoth mit Kapoera oder Bizarroraum-Skelabra mit Hutsassa). Wissen, das eigentlich aus der Innensicht kommt (etwa Movesets), darf herangezogen werden, denn es sollte keine Abzüge für Abhängigkeiten geben, die keine sind. Sollte ein Pokémon von mehreren gleichzeitig abhängig sein, ohne dass es von ihnen zusammen abhängig ist (das heißt, wenn eines gewählt wird, kann es auf das andere verzichten), kann es den Abzug nur einmal erhalten.
-2 bis -1 Das Team hat ein auffälliges Muster, sprich, man kann dem Sechser seine Strategie schon bei der Auswahl ansehen. Wenn es beispielsweise Quaxo und übermäßig viele Nutznießer des Regens hat oder ausschließlich aus langsamen Pokémon und typischem TR-Werkzeug besteht, ist es eine -2. Sollten solche Merkmale nicht das ganze Team, sondern nur Teile dessen betreffen (in anderen Worten: es benutzt Good Stuff oder schwer einordenbares exotisches Zeug zur Ergänzung – eben etwas, das auch nach einem anderen Plan als dem Muster spielen könnte), reicht -1.

So, es wird wieder Zeit für das Anwendungsbeispiel. Cresselia, Kapoera und Despotar sind Stoff, der das Metagame im Gesamten prägt, also -6 für die zusammen. Skelabra liefert als immer noch häufig gespieltes Pokémon -1. Trikephalo ebenso, wobei da auch eine -2 denkbar wäre, weil ich es eine Zeit lang in ((nicht) ungesund) vielen Teams benutzt hab. Das Argument kann ich allerdings dadurch abschmettern, dass es in jedem Team eine komplett andere Rolle spielt. Macht dann also insgesamt -8 für die einzelnen Pokémon.

Was Paarabhängigkeiten betrifft, wäre eine -1 für Skelabra angebracht, weil es ohne Kapoera Schwierigkeiten im Setup hat. Ich weigere mich jedoch, den Abzug tatsächlich zu geben, weil sich diese Abhängigkeit in erster Linie auf den Spielstart bezieht. Für den benutze ich dieses Duo viel zu selten und danach ist diese Abhängigkeit erfahrungsgemäß kaum noch relevant. Außerdem wird es an anderer Stelle noch ausreichend Abzüge für dieses Gegenargument an sich geben, also sei das hier erlassen. Stattdessen gibt es eine -1 für Machomeis ungesundes Verhältnis zum Bizarroraum, weil das ohne verzerrte Dimension einfach signifikant schlechter ist als mit. Die anderen Pokémon im Team sind des gleichen Abzugs unwürdig, weil bei ihnen diese Schere lang nicht so weit auseinander klappt.

Was Muster angeht, gibt es eine -1 für die Dominanz der langsamen Pokémon. Keine -2, weil man etwa Machomei gegen Knakrack austauschen könnte oder Vergleichbares, und schon wäre die Wahrscheinlichkeit, dass jemand an TR denkt, einen guten Zahn geringer – effektiv hat das Team fünf Good-Stuff-Pokémon und solang man sich als Gegner nicht mitten im Kampf befindet, hat man keine Sicherheit darüber, dass es Heavy TR ist. Trikephalo ist für das Urteil auch ein Faktor, denn das verhält sich zu TR so wie Äpfel zu Gemüse. Zusammengefasst merken wir uns also 5/15 für den Teil.

Innensicht I – die Pokémon im Detail (6*10)

Der Hauptteil vom OUI wird deutlich komplexer, deutlich subjektiver und deutlich... ach egal, mir fällt nichts Drittes ein. Da dieser Teil jedenfalls so schwierig ist, bin ich mir selbst schon nicht sicher, ob die Bewertungsvorschriften, die ich gleich vorstellen werde, wirklich optimal sind. Nun ja, im weiteren Sinne wollen wir jedem Pokémon samt Attributen eine Zahl zwischen 0 und 10 zuordnen, mit der offensichtlichen Semantik. Um das zu tun, wird es zunächst eine Reihe von Eigenschaften geben, für die es Abzüge oder neuerdings auch mal Gutschriften gibt. Da es aufgrund der Regeln immer unmöglich sein wird, in jedem Fall ein faires Ergebnis zu bekommen, soll es am Ende noch eine Art Ausgleichsabzug geben, der nahezu willkürlich gegeben werden kann.

Aber fangen wir erstmal an mit all den Dingen, die alleinstehend betrachtet stets immun gegen Abzüge sind:

±0 DVs werden grundsätzlich nicht mit Strafen belegt; Begründung: Bei den IVs hat man vernünftigerweise eben hauptsächlich 31 und es wäre ein bisschen zu einfach, „Innovationspunkte“ für Bizarroraum-Taktiken wegen absichtlich geringer Init auszuschütten oder Vergleichbares. Und dann gibt es bei Wesen, Fähigkeit und Geschlecht ebenfalls wenig kompetitive Auswahl.
±0 Schutzschild und Scanner sind immun gegen Abzüge. Sie sind schließlich die Butter auf dem Brot, bildlich gesprochen, also soll es nicht als uninnovativ gelten, wenn man darauf zurückgreift.
±0 STABs (unabhängig von der Anzahl, in der sie auftauchen) werden nicht mit Abzügen bedacht, weil es in nahezu jedem Fall schwachsinnig wäre, auf sie zu verzichten. Damit sind wohlgemerkt nur Angriffstechniken gemeint – natürlich bekommt Seedraking keinen STAB auf den manuellen Regentanz, oder sowas.
±0 Kraftreserven sind für Überraschungen erfunden worden und werden zurzeit auch in erster Linie genau dafür benutzt, wenn man realisiert, dass man tatsächlich nur selten den Typ wirklich im Voraus weiß bzw. sie überhaupt kommen sieht, also aus Prinzip keine Abzüge.

Nachdem das klar ist, können Punktabzüge folgendermaßen gegeben werden:

Abzüge für Fleißpunkte (exklusiv):
-3 Eine EV-Verteilung von 252/252/4 (oder gleiche Wirkung) bringt den höchstmöglichen Abzug für die Werte, weil sie nunmal in fast allen praktisch vorkommenden Fällen absolut generisch und ohne Hirnschmalz ist. Wenn eine Kraftreserve beteiligt ist, die die IVs so ändert, dass teils 248 oder 8 für den ähnlichen Effekt werden, ist es angebracht, ebenfalls -3 zu geben.
-2 Sämtliche EVs liegen zwischen 0 und 43 oder 232 und 255. Die Existenz dieses Kriteriums ist einfach darin begründet, dass solche praktisch wenig bewirkenden Geiergeschichten wie 4/236/4/0/12/252 oder sowas auch noch abgefangen werden. Andererseits sollen aber auch Verteilungen nicht zu hart bestraft werden, die wirklich einen besonderen Mehrwert haben.
-1 Rein defensive Konfigurationen, definiert durch EVs zwischen 0 und 23 in Angriff, Spezial-Angriff und Initiative und ein Wesen, das einen Verteidigungswert erhöht, mögen zwar schon öfter intelligente Hintergedanken haben als nicht, aber das ändert nichts dran, dass sie trotzdem auch ein bisschen anspruchslos sind. Um aus der Sache rauszukommen, reicht es wohlgemerkt schon, wenn man neben den defensiven EVs ein offensives Wesen benutzt, beispielsweise.
Betrachtung der Items:
-2 bis -1 Das getragene Item eines Pokémon entspricht der Erwartung im Metagame, oder tut dies weitestgehend. -2 gibt es für äußerst naheliegende Sachen wie Skelabra mit Fokusgurt oder Latios mit Drakojuwel. -1 bleibt für Items, die auch nichts Ungewöhnliches sind, aber einfach seltener vorkommen – entweder weil für das Pokémon viele Items verbreitet sind (Metagross), weil es ein anderes dominantes Item gibt (etwa Skelabra mit Feuerjuwel statt Fokusgurt) oder weil das Pokémon selbst eher wenig gespielt wird und keinen intuitiven Hinweis darauf gibt, was es trägt (wie zum Beispiel Togekiss mit Tsitrubeere).
(+1) Das Pokémon trägt eine Beere, die eine Schwäche lindert, also Kiroyabeere und Konsorten. Da diese Gruppe von Items überhaupt erst dafür entwickelt wurde, um Gegner zu überraschen, wird der Abzug nach dem vorherigen Kriterium einfach um 1 vermindert, wenn das Pokémon eine solche Beere trägt.
Abzüge für Techniken:
-1 Das Pokémon beherrscht weder Schutzschild noch Scanner und ist damit in der Regel offen gegen alle möglichen Angriffe.
-2 bis -1 Es gibt für jede nicht abzugsimmune Technik (sowohl Angriffs- als auch defensive Techniken), die Metagame-Erwartungen entspricht, Abzug. -2 ist dabei für die besonders offensichtlichen vorgesehen (Zapdos' Hitzewelle, Despotars Fußkick, Voltolos' Donnerwelle, Kapoeras Mogelhieb usw.), also jene, auf die wirklich nur die Wenigsten verzichten würden, und -1 ist entsprechend für welche, die an und für sich auch vollkommen erwartungsgemäß, aber aufgrund von größeren Movepools oder lockenderen Alternativen nicht so hochwahrscheinlich sind (Cresselias Bizarroraum, Metagross' Hammerarm, Ramoths Falterreigen usw.).

Sollte man nun bereits bei -11 oder schlimmer angekommen sein, wird es mal noch gemerkt, da alle Wertungen in beliebiger Reihenfolge vergeben werden dürfen. Die Sache ist nämlich die, dass die Pokémon-Details die einzige Stelle im Maß sind, wo Verluste sogar wiedergutgemacht werden können! Es soll also erst ganz am Ende das Ergebnis ins vorgesehene Intervall gerückt werden. Boni soll es jedenfalls nicht notwendigerweise oft geben, aber es gibt sie:

+3 bis +2 Die Pokémon-Spezies wird im Metagame nur selten benutzt. Die +3 soll es für klare Exoten geben und +2 ist für all jene, die nur lokal (bezogen auf beliebige Dimensionen) selten sind, aber denen zugetraut wird, dass sich das jeden Moment ändern könnte – etwa, weil man ihnen doch gelegentlich immer wieder begegnet.
+3 bis +1 Die Fähigkeit ist eine andere als die erwartete und der Bonus dafür ist entsprechend der Wichtigkeit und Wirkung zu vergeben. +3 sei in dem Ball eine „bahnbrechende“ Abweichung, für ich gerade kein Beispiel kenne (vielleicht Despotar mit Anspannung, aber keine Ahnung); +2 und +1 entsprechend für in der Regel relevante und +1 für kaum relevante. Der Kontext des Teams ist hier natürlich einzubeziehen.
+1 Verzicht auf einen STAB wird dann belohnt, wenn es im Set mindestens eine abzugsberechtigte Technik gibt, die jedoch keinen Abzug erhalten hat. (Ein aktuelles Beispiel ist eine neuartige Erscheinung von der WM namens Crunchless Tyranitar.)

So, wenn man die Tabellen alle durch hat, ist man schon sehr weit. Bleibt noch dieses schon erwähnte Mittel, das sich auf das Gesamtbild bezieht. Damit es nicht vergessen wird, widme ich ihm auch noch eine (effektiv sinnlose) Tabelle:

-3 bis -0 Der Gesamteindruck. Was aus irgendwelchen Serverstatistiken eins zu eins von den Spitzen kopiert wurde, darf geradewegs mit der -3 leben; -2 gilt als Standard mit marginalen Tricks, -1 gilt als grundsätzlich originell und kaum durchschaubar und -0 (praktisch kaum zu vergeben) ist für Pokémon, die sich selbst immer wieder neu erfinden können – Metronom oder sowas, wenn ein Beispiel gebraucht wird. Darüber hinaus kann diese Wertung auch verwendet werden, um Schwächen im System ein wenig auszugleichen. Wenn man es beispielsweise mit einem Pokémon zu tun hat, das für keine einzige Attacke überhaupt einen Abzug erhalten konnte, obwohl das Set tatsächlich nichts zu Besonderes hat (Paradebeispiel: Skelabra mit Hitzewelle, Hitzekoller, Spukball und Schutzschild/Kraftreserve), dann darf hier härter abgezogen werden, um auf ein Endergebnis zu kommen, das im Vergleich zu den anderen Team-Pokémon gerecht aussieht.

Jetzt ist denn erst Zeit, Ergebnisse, die 0 unterschreiten oder 10 überschreiten, entsprechend anzupassen. Tatsächlich könnte man sich auch überlegen, überschüssige Wertungen auf andere Pokémon zu transferieren, aber ich glaube das wäre im Allgemeinen dann doch zu hart: Es ist ja aus ganz natürlichen Gründen leichter, die 0 zu unterbieten, als die 10 zu überbieten. Oder alternativ hab ich auch eine ironisch gemeinte Entschuldigung: Wenn man schon 0/60 will, dann kann man sich ja wenigstens dabei Mühe geben! ;)

Damit kommen wir wieder zum Beispielteam. Machomei erhält +3, weil es selten ist, aber verliert sie gleich wieder wegen der EVs. Steinhagel und Eishieb sind so ziemlich erwartungsgemäße Non-STABs, sagen wir mal -3 für die beiden zusammen. Das Kampfjuwel ist ein intuitiv recht naheliegendes Item, -1. Für den Gesamteindruck gibt es eine -2, weil die große Besonderheit hier gerade mal in der Spezies selbst liegt, aber die Ausführung keine Innovation mitbringt. Nichtsdestotrotz ist zur Verteidigung zu sagen, dass es verdammt nervig ist, gegen die Wuchtschläge zu spielen – was jedoch durch die Sache mit der TR-Abhängigkeit auch wieder entschärft wird... Macht unterm Strich 4/10.

Cresselia sieht -1 jeweils für Bizarroraum und Rechte Hand. Zwei weitere -1 gibt es für das pure defensive Training und den (hier sogar weit verbreiteten) Mangel an Schutzschild. Damit war's das auch schon mit den konkreten Abzügen: Wenn ich das Team ein knappes Jahr früher auf OUI analysiert hätte, hätte ich schon die Chesto-Resto-Sache ankreiden können, aber was heutzutage außer Mode ist, das ist heutzutage außer Mode. Ich kann mich gar nicht mehr erinnern, wann ich das letzte Mal gegen jemand anderen damit auf Cresselia gespielt hab. (Stattdessen lieben's ironischerweise eine Handvoll Deutsche auf ihren Voltolossen heutzutage... aber das nur am Rande.) Der Gesamteindruck sagt wieder -2, weil es mit Sicherheit nirgendwo abgeschrieben wurde, aber ich denke, ich tu dem Set kein Unrecht, wenn ich es als vollkommen straightforward klassifiziere. Macht am Ende dann 4/10. Erwähnenswert ist noch, dass Cresselia allgemein kaum eine Chance hat, jemals eine 0/10 zu produzieren – das ist durchaus gewollt, weil der Movepool so schwer überfüllt ist, dass es schlichtweg unmöglich ist, erschöpfende Annahmen über Cresselia schon bei der Handicap-Auswahl zu treffen. Der Index geht ja schließlich nicht nur um „overusedness“, sondern auch um Live-Berechen- und Kontrollierbarkeit.

Weiter geht es mit Kapoera; das fängt sich -3 für die EVs, -2 für den Mogelhieb, -1 für den Tiefschlag und -1 für den Schutzschild-Mangel. Zum Abschluss gäbe es -1, weil es immer noch absolut vitale Dinge zum Team beiträgt und das Moveset in seiner Natur selbst einen hohen Unberechenbarkeitsgrad hat. Weil die vorherigen Abzüge in der Addition bezogen auf diese Tatsache schon arg unfair wirken, gibt es keinen Abzug mehr. Dann bleiben es insgesamt 3/10.

Despotar ist aber nun wirklich ein Kandidat, der jeden Abzug verdient. Die EVs machen immerhin mal nur noch -2. Ebenso der Fußkick, weil klar. Rospelbeere kommt auf -1, weil dominantes Item, aber eine besondere Beere wie erklärt. Der Gesamteindruck schlägt eine -3 auf, weil es hier absolut nichts Besonderes zu sehen gibt, wenn man dagegen spielt. Negativrekord im Team mit 2/10.

Skelabra sieht auch -2 für die EVs und -2 für den Fokusgurt. Bizarroraum ist eine -1 wert und Flammkörper +1. Die Schlusswertung schlägt auch hier wieder mit -3 zu Buche, weil das in den Augen vieler Leute schon genau das Set sein dürfte, was man erwartet, dem guten Movepool zum Trotz. Das gibt eine 3/10.

Trikephalo ist nun mal was, das die bisher miesen Wertungen ein wenig reinwäscht. Drakojuwel könnte prinzipiell eine -2 sein, aber ich lass mal eine -1 stehen, weil ich auch viel gegen fremde Kulturen gespielt habe und spiele, und etwa in Japan sind auf dem Dreikopf viele verschiedene Items gebräuchlich. Flammenwurf soll auch eine -1 sein – effektiv weiß man's vorher einfach nie, ob es den hat oder nicht, auch wenn es ihn oft hat, und die Antwort auf die Frage kann Situationen dramatisch ändern. Dazu gibt es +1, weil auf die STAB-Finsteraura verzichtet wird zugunsten eines Verhöhners, der ganz sicher keinen Abzug bekommt. Für das Gesamtbild gibt es auch -1, weil dieser Drachen im Kontext des Teams mit seiner Strategie einfach originell ist. 8/10.

Ich rechne die schonmal jetzt zusammen: gibt 24/60. Ich sag mal so: Wenn die EVs teils nicht so simplistisch wären, könnte das schon eine 30 sein. Wenn die 24 auch ernüchternd aussehen mag, wird sie von vielen Teams vom und im Kontext des Skarmbliss Servers mit Bravour unterboten.

Innensicht II – Handicap-Auswahl (15)

So, und auf zur letzten Schlacht. Dieser letzte Teil befasst sich damit, wie statisch oder variabel ein Team im Einsatz ist.

Variabilität in der Spieleröffnung (akkumulierbar; exklusiv pro Pokémon):
-5 Ein bestimmtes Pokémon muss in jedem Spiel starten. Sollte man gleich immer mit den zwei gleichen anfangen müssen, gäbe es also -10, was auch das Maximum ist. Aber auch ein einzelnes ist schon schlimm hinsichtlich dem, was wir messen wollen, denn sobald das einem Gegner bekannt ist, hat er einen dicken Vorteil.
-3 Ein bestimmtes Pokémon startet in mindestens zwei Drittel der Spiele. Es sei von keinem verlangt, jetzt unbedingt darüber Statistik führen zu müssen – Schätzung reicht.
Variabilität in der gesamten Auswahl (akkumulierbar; exklusiv pro Pokémon):
-5 Ein bestimmtes Pokémon wird nur in jedem zehnten Spiel oder seltener mitgenommen. Man spielt in der Konsequenz häufig effektiv mit fünf Pokémon; das kann logischerweise auch zu Nachteilen führen. Natürlich reicht es auch hier, die Quote zu schätzen.
-3 Ein bestimmtes Pokémon wird in weniger als einem Fünftel der Spiele mitgenommen; Weiteres dazu siehe oben.
-2 Ein bestimmtes Pokémon wird in weniger als einem Drittel der Spiele mitgenommen.

Erste Frage, die sich einem beim Anblick dieser Vorschriften stellen mag: „Warum eigentlich kein Abzug dafür, wenn man ein Mon immer mitnimmt?“ Antwort ist mit ein bisschen Nachdenken leicht: Es gibt ja zwei verschiedene Fälle dahinter – zum einen „ich nehm das Mon so oft mit, weil ich ohne es nicht funktionieren kann“ und zum andern „ich nehm das Mon so oft mit, weil es einfach zu gut ist, um nicht mitgenommen zu werden“. Wirklich „schlimm“ mit Betrachtung zum Index ist ja eigentlich nur der erste Fall, oder? Und der wird doch schon gut damit behandelt, dass es wahrscheinlich ist, dass irgendwelche anderen Mons dann deswegen „zu kurz“ kommen. So oder so soll es aber nicht gleich ein Beinbruch sein, irgendein Pokémon ständig mitzunehmen, weil vier aus sechs. Es ist bei der ohnehin beschränkten Auswahl kein Beleg für ein „schlechtes Team“, wenn es sein MVP gut kennt.

Da mir keine weiteren Fragen mehr einfallen (oder so), würd ich sagen, wird es wieder Zeit für das Beispiel. Cresselia nehm ich zwar tatsächlich so gut wie immer mit, aber die Leads hat sie nicht komplett übernommen, -3. Kapoera schätze ich an der Vorderposition grob auch über 2/3 ein, was dann nochmal -3 gibt (bin mir aber unsicher, ob das echt hinkommt – hab nur nichts zum Nachschlagen...). Für die Auswahl insgesamt ist bekannt, dass Skelabra nicht viel zum Einsatz kommt – -3 dafür (mehr als ein Zehntel sollte es schon auf jeden Fall sein; es sind einfach nur die etwas spezifischeren Gegner). Außerdem schaut auch Lady Dinodora #5 sich den Spaß des Öfteren mit Popcorn aus der dritten Reihe an, dafür noch -2. Zusammengerechnet sind das ein bisschen schlappe 4/15. Na ja, ähnlich wie das Typenzeug mag das auch wieder das Schicksal eines spezifischeren Teams sein... Wer ein Setup zur Pflicht hat, kann natürlich nicht seinen Vierer gefühlt auswürfeln, und dieses Team ist hinsichtlich Vielseitigkeit durchaus ein ordentliches Negativbeispiel.

Das Endergebnis

Einfach alles aufaddieren, nicht mehr und nicht weniger. 5 und 5 im Beispiel sind 10, 24 dazu sind 34, die letzten vier zum Schluss sind 38. 38/100. Sogar nochmal was in der Zwischenzeit verloren – hatte das Team ja noch mit 41/100 veröffentlicht... Der Unterschied kommt jedenfalls daher, dass ich in der Zwischenzeit noch das Schutzschild-Abwesenheitskriterium hinzugefügt hab und woanders hatte ich einfach ein Detail übersehen. So oder so ist das jedenfalls zweifellos genau die Region, in die das Team auch gehört. Es hat seine subtilen Tricks, aber es ist insgesamt nicht revolutionär und insbesondere ist es ein wenig limitiert.

Analyse

Um zu zeigen, dass ich mir die Zahlen nicht irgendwie ausgewürfelt hab, sollte ich noch ein wenig dazu erzählen, was allgemein für welche Sorte Team ungefähr rauskommen sollte. Zunächst mal ist natürlich vollkommen vernünftig, dass Movesets mit mehr als der Hälfte der Gesamtpunkte zu Buche schlagen. Dass die Teamstrategie im Vergleich dazu nur 30 Punkte geben soll, stimmt schon aus einem ganz einfachen Grund nicht: Sie befindet sich auch mitten in den Movesets statt nur in der Zusammenwirkung der Mons allein. Und auf der andern Seite, wer sich seine Sets nunmal nur zusammenkopiert, der kann einfach nicht erwarten, jemals nicht leicht durchschaubar zu sein.

Also gut, mal ein bisschen die Bereiche abschätzen. Schwächen/Resistenzen und Handicap-Auswahl (zusammen maximal 25) sind wie schon angedeutet bei Setup-Teams meistens schwach, bei Good-Stuff-Teams für gewöhnlich recht gut. Die 15 für die Pokémon im Metagame aus der Außensicht haben zu Teamarchetypen nur einen geringfügigen Zusammenhang. Geschätzt ist es so, dass Good Stuff dort die meisten Punkte für einzelne Pokémon verliert, wohingegen kompetitives Setup etwas weniger Punkte für die verliert, aber stattdessen welche für Abhängigkeiten und Muster. Und Lesbarkeit von Movesets hat mit den Archetypen sowieso nichts zu tun. Es zeigt sich also, dass Good Stuff grundsätzlich mehr Punkte als Setup erreichen kann. Das ist auch vollkommen korrekt so, denn das Credo hinter Good Stuff ist nunmal in erster Linie Vielseitigkeit des Spielplans und gute Antworten auf fremde Setups. Auf der andern Seite fahren Setups immer mit diesem Damokles-Schwert der „Grundvorhersehbarkeit“; soll heißen, sie können nicht einfach drauf los spielen, sondern brauchen bestimmte Dinge auf dem Feld, und häufig sieht man die dann auch schon irgendwie kommen. Insbesondere wenn man Best of Three spielt, ist es leicht zu erkennen, dass die Überraschungskurve für Good Stuff über die Zeit nur langsam abnimmt, während Setup vielleicht sogar bei einem hohen Wert starten mag, aber mit der Zeit stärker abnimmt und irgendwann auch geradewegs unter die Kurve vom Good Stuff fällt und da bleibt. Die Weltmeisterschaften sind übrigens mit dem Besten aus beiden Welten gewonnen worden: Good Stuff mit Setups.

Aber noch bin ich mit der Analyse nicht fertig. Der Index sagt, die Originalität und Unvorhersehbarkeit steht und fällt an den sechs Pokémon, die das Team bilden. 60 Punkte, nur knapp weniger als 2/3 der gesamten, und ja, natürlich können die so Einiges verschieben. Ich hab mir während der Entwicklung des Maßes auch mal andere Teams hinsichtlich dieser 60 genau angeguckt.
Da wäre zunächst mal mein Team damals von Paris: 17/60, wobei 7 dieser 17 allein von Nidoking kommen. Offensichtlich kein Ergebnis, auf das man neidisch sein sollte... In dem Team mögen zwar sehr wohl ein paar Ideem verankert gewesen sein, die nicht so offensichtlich waren und die für mich auch heute noch einen Wert haben, aber mit Zapdos, Despotar, Scherox und ihren jeweiligen Sets sind da einfach mal drei Mons dabei, die nicht mehr als 1/10 wert sind.

Das nächste Team ist genau das Weltmeisterteam von Ray R. Das kommt mit ungefähr 34/60 schon auf einen sehr ordentlichen Wert. Wie das, das Team sah doch so standardlastig aus? Na komm, das ist einfach: Wenn man halbblind draufguckt, klar ist's dann Standard – es ist fünfmal Club 600 und einmal Wasch-Rotom; das senkt die Erwartungen an Originalität nunmal. Der Teufel wohnt jedoch wie so oft im Detail und der sagt, dass es außer seinen Metagross und Cresselia (beide noch 4/10) keine Mons gibt, die weniger als 5/10 bekommen, so wie die alle so ihre kleinen Tricks haben – das summiert sich.

Wenn wir schon dabei sind, hab ich mir natürlich auch mal das andere Team vom Finale herausgepickt. Man sollte eigentlich erwarten, dass da eine klar höhere Wertung rauskommt, aber tatsächlich komm ich da gerade mal auf 37/60. Kokowei hat natürlich die einzige 10/10 von beiden Teams, aber die andern haben dann doch teils so ihre nur allzu herkömmlichen Elemente. Dass vier der sechs Pokémon keinen Schutzschild haben, ist auch etwas, das die Wertung ein wenig belastet, weil klar, sowas ist nunmal eine Einladung für Double-Targets und wenn er denen langfristig standhalten will, muss er seine Bedroher und Krafttausche weise verwalten und darf sich mit der Taktik gleichzeitig nicht von Metagross unter Druck setzen lassen. Tatsächlich geh ich so weit und sage, dass es keine zehn Spieler auf der Welt geben kann, die mit genau dem Team auch ins Finale gekommen wären, denn es ist äußerst anspruchsvoll zu spielen – noch mehr als ein „eggszelenter“ Teambauprozess steht hinter diesem Erfolg eine herausragende Spielerleistung.

Was noch höhere Werte für die Sets angeht, hab ich neuerdings ein Team mit 45/60 gebaut; es ist gemessen am VGC 2012 Metagame nur begrenzt kompetitiv. Worauf ich mit diesen Aussagen hinaus will, wird offensichtlich sein, sobald das Team bekannt ist, aber für den Moment muss es noch geheim bleiben. Wie kommt man dann aber nun auf 60/60? – Mit Spielverlauf natürlich. Kompetitive Teams sind gewiss nicht für eine perfekte Beurteilung nach OUI gemacht, weil man einfach für jedes kompetitive Moveset ganz sicher mindestens einen Abzug finden wird. Die 10/10-Höchstwertung für ein Pokémon ist daher allein für exotische wie eben beispielsweise jenes Kokowei überhaupt erreichbar. Wenn das Team, mit dem man ein Turnier bestreiten will, jedenfalls mehr als 30/60 hat, dann gibt es ganz sicher keinen Grund, sich darüber Sorgen zu machen, man hätte es aus Plätzchenformen gestochen.

Bei der Aussage bezüglich Spielverlauf sollte man eigentlich so schon hellhörig werden, aber ich sag es trotzdem nochmal ganz offen: Der OUI trifft keine Aussage darüber, welche Siegchancen man mit einem Team bei einem Turnier hat! Genau genommen kann man einem Team damit nichtmal bescheinigen, in der Masters Division der WM keine Chance zu haben, denn Ruben P. ist 2011 mit einem so gut wie ausnahmslosen Standard-Team Dritter geworden. Faustregel ist jedenfalls, dass pure Standard-Teams bei der WM einfach im Allgemeinen weniger erfolgreich sind als originelle Teams. Wieso sonst hat es noch kein einziges in der höchsten Altersklasse in ein Finale geschafft, zum Beispiel? Ich denke, man kann es als Fakt betrachten, dass man, wenn man zum wichtigsten Turnier des Jahres fliegt, gut damit beraten ist, seinen OUI nicht leiden zu lassen, denn da weiß jeder, was er tut. Ansonsten kann ich nur dazu ermutigen, dass in Europa und Deutschland doch irgendwann auch mal die Dominanz der niedrigen OUIs in den Tops ein Ende nehme. Die USA haben's ja bei ihren eigenen Turnieren auch geschafft und sind nun die für den Moment unanfechtbare Nummer eins in der Welt.

Etwas anderes, das ich noch erwähnen sollte, ist, dass ein Team am besten genau von seinem Schöpfer nach OUI bewertet wird. Mit fremden Teams ist das so eine Sache, weil einem da gern mal irgendwelches Detailwissen fehlt (deshalb hab ich auch darauf verzichtet, die Finalisten über die 60 hinaus zu analysieren, aber ich bin mir sicher, es werden gute Reste sein für sie). Nichtsdestotrotz, man kann es natürlich tun, wenn einem der Sinn danach steht. Wird nur ungenau und Vergleiche fremder zu eigenen Teams sind daher nicht unbedingt angebracht. Lassen wir's zwei Klassen sein, aber verzichten auf den Klassenkampf, sozusagen. ;) Bleibt mir nur noch, viel Spaß mit dem ganzen Ding zu wünschen. Vielleicht bringt es ja jemandem neue Erkenntnisse.


Ach, ich kann schon ein echter Clown sein. Ich meinte einst noch, ich würde nicht mehr so komplexe Einträge wie den Japan Cup schreiben wollen, aber der hier hat mich noch weit mehr gekostet... Was tut man nicht für alles für sich und seine Leser. Nächste Woche kommt jedenfalls ein Eintrag (mit ganz sicher leichterer Kost), in dem die Weltmeisterschaft 2012 das Hauptthema sein wird.

Que la paix soit avec Vous.

Keine Kommentare:

Kommentar veröffentlichen