יצא לי לחשוב על זה הרבה מאוד פעמים, הלוואי שתצליח להכניס את זה איכשהו למועדון.
לב העניין פה הוא השאלה איך מודדים מידת התאמה של שחקן? מה הפרמטר או הפרמטרים שמנסים לנבא?
יכול לשתף בכמה מחשבות כלליות שעלו לי לאורך הזמן, אם כי אני אגיד מראש שאני מבין קטן מאוד בתחום (לא יותר מקורס ML בסיסי באוניברסיטה).
- דבר אחד שניסיתי פעם לעשות זה ללכת על גישה של unsupervised learning (ספציפית clustering). לקחת מידע למשל מכל הליגות שיש איזושהי היתכנות ריאלית להביא מהן שחקנים לישראל, לקחת את כל הנתונים שיש בwyscout לגבי אותם שחקנים בטווח של 3 השנים האחרונות ולתת לאלגוריתם לזהות קלאסטרים במידע. לאחר מכן לקחת בצורה ידנית שחקן שנחשב לטופ של הליגה (למשל דור פרץ) ולראות אילו שחקנים נמצאים בקלאסטר שלו שאפשר להביא. המחשבה היא להביא שחקנים שהם "כמו דור פרץ" מבחינת הנתונים הסטטיסטיים שלהם. בסופו של דבר לא ממש עשיתי עם זה כלום.
- לגבי טכניקות שהן יותר supervised יש שני דברים שאפשר לעשות בגדול לדעתי. האחד הוא לנסות לנבא נתונים סטטיסטיים עתידיים על סמך נתונים סטטיסטיים קודמים ולתת איזשהו ציון על בסיס הניבוי, כאשר הפונקציה שמחשבת את הציון תשתנה בהתאם לתפקיד (תתן משקל שונה לפרמטרים שונים). אין לי מושג עד כמה זה יהיה יעיל. אפשרות אחרת, בסיסית יותר, היא ליצור אלגוריתם שמנבא את שווי השוק (לפי טרנספרמרקט) של שחקן מסויים בעונה הבאה בהסתמך על העונות הקודמות. הרעיון כאן הוא לנסות להבין אילו שחקנים "אמורים" לחוות עליות ערך ולהביא אותם לפני שזה קורה.
זה מאוד בסיסי אבל אולי יעזור לך איכשהו.
בכל מקרה כשמדברים על שחקנים שעברו למשל את גיל 23 לא יודע עד כמה זה מעניין להסתכל על מה שהם עשו בגילאי נוער. לא הייתי מתאבסס על זה יותר מדי.
בקשר ללינקים שימושיים הייתי בודק את זה :
https://opensource.pysport.org/. יש שם כל מיני ספריות פייתון ו-R שעוסקות בעיבוד של נתונים סטטיסטיים בכדורגל. ראיתי פעם שיש שם API ל-transfermarkt שיכול לחסוך הרבה כאב ראש אם אתה רוצה להסתמך על מידע משם.
הלוואי שתצליח להכניס את האנליזה להפועל באיזושהי צורה, שיהיה בהצלחה.