Aber wie zum Teufel kommt man zum Beispiel darauf, dass in Szene x oder y eine Trefferquote von so oder so erwartet wurde?
Kleiner Exkurs, deshalb im Spoiler. aber als Semi-Fachmann, der ein bisschen mit Machine Learning gebastelt hat kann ich dir das versuchen zu erklären:
Du hast zwei Probleme: Berechnung und Daten. Solche Modelle aufzustellen ist nicht das Problem. All die Faktoren, die du genannt hast, lassen sich irgendwie verwursten, das sind am Ende 20, 50 oder 100 Parameter in ner Berechnung. So ein Modell kann dir in jeder Firma, die was mit Daten macht, ein Data-Scientist basteln. Wo findet der Abschluss statt, wie steht der Spieler, woher kommt der Ball, sogar physikalische Modelle lassen sich da einbauen.
Du brauchst jetzt a) diese Parameter als Zahlen und b) viele Daten.
A) löst man, in dem man irgendwo in Fernost gigantische menschliche Analyse-Strukturen schafft. Jedes Datenanalyse-Zentrum (sowohl Anbieter, die wirklich nur stumpf Daten wie Ballbesitz, Zweikampfquote, usw angibt, wie das Büro, die die berühmt-berüchtigte Packing-Statistik vermarktet, als auch die Großen wie Amazon und Google) hat Büros auf den Philippinen, in Indonesien, usw. Die bewerten Tore auf exakt diese Fragen. Ist nicht immer 100%ig korrekt, aber viel hilft viel. Welche Parameter wichtig sind, darüber gibts schon seit 20 Jahren wissenschaftliche Untersuchungen
B) gibts schon zahlreich und seit Ewigkeiten. Du kannst seit Jahren sämtliche Spiele der höheren Ligen komplett digital abrufen. Wenn man bedenkt, dass man pro Jahr 20-40 Torschüsse pro Spiel hat, bei 9-10 Spielen pro Spieltag über 34-38 Spieltage in 20+ Ligen hat, kriegen die einiges zu tun.
Jetzt trainiere ich zwei Maschinen. Die erste gibt eine Wahrscheinlichkeit an, dass der Ball ins Tor geht oder nicht. Sind nur zwei Zustände, so schwierig ist das gar nicht. Das ist ein bisschen Clustering, ein bisschen Optimieren und wenn ich genug Daten habe nur noch ne Frage von Rechenleistung und -zeit. Die zweite soll die Parameter, die die erste verwurstet, aus Bildmaterial selbst bestimmen. Wenn ein Mensch unterscheiden kann, ob ein Bild ne Katze oder nen Hund zeigt. muss es Faktoren geben, die das Ergebnis auch errechnen lassen. Wenn ein Mensch bestimmen kann, aus welcher Richtung ein Ball kommt oder wo ein Abschluss statt findet, kann das ein Modell auch. Unter Vorbehalt, dass die Daten soweit passen, krieg ich jetzt ein Analysetool, das sicherlich nicht in Echtzeit, aber mit überschaubarem Zeitaufwand so einen Wert berechnen kann.
Wie schon oft gesagt, dass Ganze ist kein prophetisches Werkzeug und auch keine Hexerei, aber sicherlich ne interessante Spielerei. Durch die Möglichkeiten, die man heutzutage relativ einfach bekommen kann, wird da auch noch viel mehr passieren. Daten im Fussball gibt es überall die werden uns aktuell sogar direkt auf den Fernseher übertragen. Spannend wirds erst, wenn solche Modelle nicht nur Vergangenes analysieren, sondern Vorhersagen machen.