بازی زیبا یا «بازی اعداد» (The Numbers Game)؟ دومی نامی است که کریس اندرسون (Chris Anderson) و دیوید سالی (David Sally) بر روی کتابشان گذاشتهاند. البته آنها به همین هم بسنده نکردهاند؛ در تیتر دوم کتاب این جمله به چشم میخورد: «چرا هر آنچه که در مورد فوتبال میدانید، اشتباه است». همین چند کلمه برای من کافی بود تا تصمیم بگیرم این کتاب را بخوانم. سالی یک اقتصاددان رفتاری و دنبالکنندهی فوتبال است و اندرسون پیش از آنکه استاد علوم سیاسی در مدرسهی اقتصاد لندن باشد، در لیگ دسته چهارم آلمان فوتبال بازی میکرد. برای شخص من، به عنوان یک دانشمند داده، این موضوع که بازی پیچیدهای چون فوتبال را میتوان به شیوهی روشمند مطالعه کرد، همواره جالب توجه بوده است. این کتاب به صورت مشخص به ما نشان میدهد که این امر نه تنها ممکن، که کمککننده هم هست؛ به خصوص هنگامی که پای کلیشههای فوتبالی وسط میآید که اکثریت، آنها را به عنوان واقعیت پذیرفتهاند، اما آمار و داده آنها را رد میکند.
برای مثال بارها از گزارشگران فوتبال شنیدهایم که یک تیم بلافاصله پس از گلزنی در آسیبپذیرترین شرایط قرار دارد. اندرسون و سالی به کمک داده نشان میدهند که این موضوع نه تنها درست نیست، که دقیقا عکس آن برقرار است. یا برخلاف باور عامه، ضربات کرنر در افزایش شانس گلزنی تیم تاثیر چندانی ندارند و حتی داشتن شوتهای بیشتر به سمت دروازه متضمن موفقیت نیست. نویسندگان با بررسی ۸،۳۲۳ مسابقه در لیگهای بزرگ اروپایی بین سالهای ۲۰۰۵ تا ۲۰۱۱ دریافتند که تیمی که تعداد شوت بیشتری به سمت دروازه داشته باشد، تنها بین ۵۰ تا ۵۸ درصد از مواقع – بسته به لیگ – برنده میشود.
هدف اصلی من از این نوشتار، نقد و بررسی کلی این اثر نیست. علیرغم نکات آموزندهای که هر یک از فصول کتاب برای خواننده دارد، فصلی که من میخواهم به صورت مشخص به آن بپردازم، فصل آخر این کتاب است؛ فصلی که در آن اندرسون و سالی ۱۰ مورد از پیشبینیهای خود را در رابطه با فوتبال و علم داده که فکر میکردند در دههی پیشرو به حقیقت خواهد پیوست، ارائه میکنند. نظر به اینکه این کتاب در سال ۲۰۱۳ نوشته شده است و هماکنون در سال ۲۰۲۴ هستیم، فکر میکنم زمان خوبی باشد تا درستی و نادرستی برخی از این پیشبینیها را به بوتهی آزمایش بگذاریم و ببینیم این دو تا چه اندازه آیندهی تحلیل داده در حوزهی فوتبال را به درستی پیشبینی کردهاند.
اما پیش از آنکه مستقیم سر اصل مطلب بروم، ابتدا به صورت خلاصه به ساختار کتاب و سرفصلهایی که پوشش داده میشود، اشاره میکنم؛ با این امید که مخاطبان علاقهمند به این موضوع پس از آشنایی بیشتر با آن، به سراغش بروند.
مرور کلی کتاب
کتاب کارش را با اشاره به مقاومت تاریخی مربیان در برابر استفاده از تحلیلهای آماری آغاز و برای تبیین منظور خود آن را با «مانیبال» (Moneyball– نام کتابی به همین نام از مایکل لوییس که در فرهنگ عامه با استفادهی هوشمندانه از علوم داده برای کسب موفقیت ورزشی عجین شده است) در بیسبال مقایسه میکند. فصل اول این کتاب، که احتمالا یکی از جذابترین فصول کتاب برای من بود، میزان «تصادفی بودن» فوتبال را با سایر ورزشها به روش علمی مقایسه میکند؛ پدیدهای که ربط مستقیم به کمگل بودن ورزش فوتبال در قیاس با سایر ورزشها دارد. نویسندگان از شواهد زیادی برای توضیح این موضوع بهره میبرند که گراف زیر یکی از آنها است. در بین فوتبال، هندبال، بسکتبال، و فوتبال آمریکایی، احتمال برنده شدن تیمی که پیش از شروع بازی تیم برتر محسوب میشود، در بازی فوتبال تنها اندکی بیش از ۵۰ درصد است. این عدد برای هندبال فراتر از ۷۰ درصد است. در واقع پیشبینی برنده در سایر ورزشهای گروهی از جمله بسکتبال و فوتبال آمریکایی به مراتب راحتتر از فوتبال است.
در فصول میانی، نویسندگان روندهای مختلف در لیگهای فوتبال را مطالعه میکنند و با اشاره به کاهش تعداد متوسط گل در بازیها، بیش از هر چیزی آن را به پیشرفتهای حاصل شده در خطوط دفاعی (با سرعت بیشتر نسبت به خطوط حمله) نسبت میدهند. با این حال، نکتهی بدیهی که نویسندگان بر آن انگشت میگذارند این است که گرچه «گلها» باارزش هستند، اما ارزش همهی گلها یکی نیست. این نکته به خودی خود هوشمندانه نیست، اما نویسندگان با استفاده از تحلیل داده نشان میدهند که به طور متوسط، دومین گل هر تیم باارزشترین گل است و بیشترین اثر جزئی (marginal) را بر روی نتیجهی نهایی میگذارد. این نکته احتمالا میتواند مواجههی ما با نحوهی ارزیابی کارآمدی مهاجمان را تغییر دهد.
فصول پایانی کتاب توجه ویژهای به تحقیقات مستقل این دو نویسنده دارد، جایی که آنها با وام گرفتن از تئوری اورینگ [1] (O-ring) و بررسی دیتای فوتبال به صورت سیستماتیک نشان میدهند که یک تیم فوتبال به اندازهی ضعیفترین بازیکنش قوی است. با استفاده از روشهای رگرسیونی، اندرسون و سالی نشان دادند که اگر تیمی کیفیت «بهترین» بازیکن خود را از ۸۲ درصد به ۹۲ درصد افزایش دهد، در نتیجهی این کار در طول فصل تفاضل گل تیم ۱۰ گل بهبود میيابد. از سوی دیگر اما، اگر تیمی کیفیت «ضعیفترین» بازیکن خود را از ۳۸ درصد به ۴۸ درصد افزایش دهد، نتیجهی این تغییر چیزی در حدود ۱۳ گل و ۹ امتیاز بیشتر در جدول خواهد بود.
فصل ۱۰ نیز جزو فصول خواندنی کتاب است. نویسندگان در این فصل یافتههای کوپر و ژیمانسکی را در کتاب ساکرنامیکس، مبنی بر اینکه سطح دستمزدهای بازیکنان در یک تیم، ۸۹ درصد موفقیت تیم را توضیح میدهد، به چالش میکشند؛ تئوریای که نقش و تاثیر مربیان بر موفقیت تیمها را کمتر از آنچه تصور میشود، نشان میدهد. اندرسون و سالی با انجام دوبارهی این آنالیز نشان میدهند که این عدد به جای ۸۹، چیزی در حدود ۸۱ درصد است. همچنین آنها ادعا میکنند که وقتی حرف از دستمزد بازیکنان میزنیم، نمیتوانیم دستمزد مربیان را نادیده بگیریم. تیمهای ثروتمند نه تنها بازیکنان گرانی به خدمت میگیرند، بلکه مربیان آنها هم مربیان کارکشته و تراز اولی هستند که دستمزد بالایی دارند. تیم بولتون قادر نیست گاس هیدینگ را به خدمت بگیرد و تیم چلسی هم سکان خود را به دستان سمی لی (Sammy Lee) نمیسپارد. ایراد سومی که نویسندگان به یافتههای ساکرنامیکس وارد میکنند این است که دستمزد یک بازیکن را نمیتوان تماما به استعداد و توانایی ذاتی او نسبت داد. هر بازیکنی محصول آموزشهایی که توسط مربیان پیشین و فعلی خود دریافت کرده است و از همین رو، نادیده گرفتن نقش مربیان کوتهنظرانه است.
فصل آخر: فوتبال در عصر داده و تکنولوژی
کنفرانس Sloan Sports Analytics که توسط دانشگاه MIT در شهر بوستون برگزار میشود، هر ساله پذیرای تعداد بسیار زیادی از آنالیزورها، مربیان، کارشناسان و مدیران فوتبالی از سرتاسر جهان است که به دنبال آشنایی بیشتر با آخرین پیشرفتهای تکنولوژی و تحلیل داده در حوزهی ورزش هستند. تعداد کمپانیهایی که سرویسهای مربوط به جمعآوری و تحلیل دادههای فوتبالی را هم انجام میدهند، روز به روز رو به افزایش است. آنچه که امروز در مورد نقش تکنولوژی و تحلیل داده در فوتبال میدانیم، میتواند به ما کمک کند که آیندهی این دو را تا حدی پیشبینی کنیم و این کاری است که اندرسون و سالی در فصل آخر کتاب خود انجام دادند. در اینجا از بین ۱۰ پیشبینیای که نویسندگان در کتاب خود برشمردند، دو مورد اصلی را بررسی میکنیم و سعی میکنیم آنها را با اطلاعات بیشتری که پس از یک دهه از زمان چاپ این کتاب به دست آمده، تطبیق دهیم.
پیشبینی ۱
***
«پیشرفتهای بزرگ حوزهی تحلیل داده در منچستر یونایتد، منچستر سیتی، رئال مادرید، بارسلونا یا هیچ یک از بیست باشگاه ثروتمند فهرست شده در گزارشهای مالی دیلویت (Deloitte) رخ نخواهد داد.»
***
نکتهای که گاهی در مورد مانیبال و موفقیت بیلی بین در تیم اوکلند اتلتیکز نادیده گرفته میشود این است که این تیم در شرایط بسیار بدی به سر میبرد و حتی طرفداران از رفتن به استادیوم خودداری میکردند؛ به زبان دیگر، «آنها چیزی برای از دست دادن نداشتند.» و احتمالا همین نکتهی مهم این اجازه را به بین میداد تا با خلاقیت و نوآوری به دنبال راهی برای فرار از منجلاب باشد. ایدههای نوآورانهی او در حوزهی استفاده از تحلیل داده اگر با شکست مواجه میشد، آسمان به زمین نمیآمد و وضعیت آنها از آنچه که بود بدتر نمیشد. این موضوع در مورد باشگاههای بزرگ ورزشی صادق نیست. اگر یک استراتژی یا سرمایهگذاری به خصوص در بارسلونا یا بایرن مونیخ جواب ندهد، این باشگاهها هزینهی مالی و معنوی بسیار زیادی میپردازند. هنگامی که ابعاد پیامدهای ناشی از شکست بزرگ باشد، فضا برای نوآوری و امتحان راههای جدید تنگتر میشود. از طرفی تیمهایی که با محدودیت پول و سرمایه روبهرو هستند و نمیتوانند گرانترین مربیان و بازیکنان را به خدمت بگیرند، باید هوشمندانهتر از منابع محدود خود استفاده کنند.
یکی از باشگاههایی که بسیار در مورد آن میشنویم، باشگاه دانمارکی میجیلند است. پس از گذر از چالشهای مالی فراوان و خطر ورشکستگی، آنها توانستند به لطف خدمات متیو بنهام – یکی از سهامداران اصلی باشگاه و مالک کمپانی اسمارتآدز (Smartodds) که یک کمپانی تحلیل دادههای ورزش به منظور شرطبندی است – قهرمان لیگ دانمارک شوند. راسموس انکرسن، رئیس هیئت مدیرهی باشگاه، در مصاحبههای فراوانی به نقش تحلیل داده در موفقیتهای تیم اشاره کرده است. تد کنوتسان، مدیر اجرایی کمپانی StatsBomb، که یکی از بزرگترین و پیشروترین شرکتها در زمینهی تجزیه و تحلیل دادههای فوتبال است، بخش مهمی از هستهای بود که بنهام در سال ۲۰۱۴ در میجیلند شکل داد. آنها با استخدام گروهی از تحلیلگران داده و آنالیزورها، رویکرد خود را در بسیاری از زمینهها، از جمله آنالیز بازی، جذب بازیکن، ضربات آزاد و … به یک رویکرد مبتنی بر داده و مدلسازی ریاضی تبدیل کردند. در مورد ضربات آزاد، این تیم طی فصول اخیر توانسته آمار مربوط به درصد گلهای خود را از روی ضربات آزاد بهبود ببخشد. آنها طی چندین فصل حدود ۴۰ درصد از گلهای خود را از روی ضربات آزاد به ثمر رساندند. در بین لیگهای اروپایی، این عدد به طور متوسط چیزی بین ۲۰ تا ۲۶ درصد است.
یکی دیگر از تیمهایی که باید به آن اشاره کرد، تیم لیگ برتریِ برنتفورد است. اگر یک کار سختتر از صعود به لیگ برتر وجود داشته باشد، آن کار ماندن در لیگ برتر است. برنتفورد در فصل ۲۱-۲۰۲۰ پس از شکست سوانزی در مسابقات پلیآف، خود را به بالاترین سطح فوتبال انگلیس رساند. در دو فصل ابتدایی حضور این تیم در این رده، آنها به ترتیب رتبههای سیزدهم و نهم را به خود اختصاص دادند. در سال ۲۰۱۶ تیم برنتفورد یک تصمیم عجیب گرفت. رابرت رووان، مدیر فنی وقت برنتفورد (که در سال ۲۰۱۸ در ۲۸ سالگی بر اثر نارسایی قلبی جان خود را از دست داد)، این طور گفت: «مدل فوتبالی مبتنی بر آکادمی برای برخی باشگاهها کار میکند، اما برای برنتفورد تصمیم درستی نبود.» این تیم در ماه می ۲۰۱۶ آکادمی فوتبال خود را تعطیل کرد. دلیل آنها برای این کار این بود که با توجه به ارزش مالی و درآمدهای آن موقع باشگاه، هزینههای مربوط به گرداندن آکادمی سرسامآور است و همچنین آنها قادر نیستند به موقع بازیکنان مستعد جوان خود را بفروشند و تولید درآمد کنند. از همین رو، برنتفورد میبایست در شیوههای خود در خرید بازیکن تغییرات انقلابی ایجاد میکرد تا بتواند با سایر تیمها همچنان رقابت کند. برنتفورد تصمیم گرفت تا بر روی دو نوع از بازیکنان تمرکز کند: اول بازیکنان آزاد شده توسط سایر تیمهای انگلیسی که دیگر در تیمشان جایی نداشتند و دوم بازیکنان خارجی که میتوانستند برنتفورد را سکوی پرتابی برای راهیابی به فوتبال انگلیس ببینند. انجام این کار نیازمند یک سیستم دقیق آنالیز داده بود که بتواند در ابعاد بزرگ پروفایل بازیکنان را بررسی و گزینههای مناسب را شناسایی کند. برای این کار باشگاه از کمپانی اسمارتآدز و سایر تحلیلگران داده در این حوزه کمک گرفت. شاید جالب باشد که بدانید متیو بنهام، مالک کمپانی اسمارتآدز و سهامدار عمدهی باشگاه میجیلند، مالک باشگاه برنتفورد نیز است! از سال ۲۰۱۶ تا سال ۲۰۲۲ برنتفورد ۷۵ میلیون پوند برای جذب بازیکن هزینه کرد، اما از سوی دیگر توانست ۱۹۰ میلیون پوند بابت فروش بازیکن به دست بیاورد (خرید نیل ماوپی به قیمت ۱.۶ میلیون پوند و فروش او به برایتون به مبلغ ۲۰ میلیون پوند، خرید اولی واتکینز به قیمت ۶.۵ میلیون و فروش او به استون ویلا به قیمت ۳۰ میلیون و همچنین خرید آیوان تونی با ۴.۸ میلیون که بنا به ارزیابی وبسایت ترنسفر مارکت هماکنون ۳۰ میلیون پوند ارزشگذاری میشود، نمونههایی از سرمایهگذاریهای پربازده این باشگاه هستند.) سود ناشی از فروش بازیکن به برنتفورد کمک کرد تا به لیگ برتر صعود کنند و یک ورزشگاه جدید نیز برای خود بسازند.
با مشاهدهی چنین نمونههایی ترغیب میشویم که با اندرسون و سالی در مورد پیشبینیشان موافقت کنیم، اما این داستان روی دیگری هم دارد. باشگاه لیورپول در سال ۲۰۱۲ یان گراهام را که یک فیزیکدان و فارغالتحصیل دانشگاه کمبریج بود، به استخدام خود در آورد و مدیریت دپارتمان دادهی خود را به او سپرد. از گراهام به عنوان کسی که آنالیزها و مدلهای آماریاش زیربنای به خدمت گرفتن ستارگان بسیاری برای این تیم بود، یاد میشود. اما شاید مهمترین خرید گراهام خودِ یورگن کلوپ باشد. بروسیا دورتموند، در فصل ۱۵-۲۰۱۴ با رتبهی هفتمی و در حالی که ۳۳ امتیاز با تیم قهرمان یعنی بایرن مونیخ فاصله داشت، کارش را تمام کرد و یورگن کلوپ ۴۸ ساله با انتقادات فراوانی از سوی رسانهها مواجه شد. مدلها و آنالیزهای گراهام اما نشان میداد که عملکرد دورتموند بسیار بهتر از رتبهشان در جدول بوده و آنها فقط بیش از اندازه بدشانس بودند؛ به بیان دقیقتر یافتههای گراهام پس از آنالیز دورتموند در طی ۱۰ فصل نشان میداد که آنها دومین تیم بدشانس در طی آن ۱۰ سال بودهاند! در واقع از نظر او کلوپ مربی بسیار توانمندی بود و میتوانست به پروژهی لیورپول کمک کند. گراهام معتقد بود خط سیر عملکرد (trajectory) دورتموند چیزی است که اهمیت دارد و نه فقط نتایج یک فصل. شاید به همین خاطر هم بود که گراهام در اولین ملاقاتش با کلوپ پس از به اشتراک گذاشتن نتایج تحقیقاتش به او گفت که به ندرت ویدیویی از بازیهای فصل آخر دورتموند دیده است! از بازیکنانی که دپارتمان دادهی لیورپول و در رأس آن، گراهام، زمینهی به خدمت گرفتنشان را فراهم کردند میتوان به محمد صلاح، سادیو مانه و روبرتو فیرمینو اشاره کرد. هنگامی که لیورپول احتیاج به یک مهاجم داشت، گراهام از دپارتمان دادهی خود درخواست کرد تا لیستی متشکل از ۱۰ بازیکن ایجاد کرده و در اختیار کلوپ قرار دهند. در صدر این لیست محمد صلاح قرار داشت. کلوپ لیست را رد کرد و گفت که فکر نمیکند هیچ کدام از آن گزینهها برای لیورپول مناسب باشند. دوران کمفروغ صلاح در چلسی او را به یک گزینهی نامحبوب در انگلیس تبدیل میکرد. گراهام و تیمش اما بر روی یافتههایشان تاکید کردند و باشگاه نهایتا به قیمت ۴۲ میلیون یورو او را به خدمت گرفت. صلاح تا به امروز موفق شده در همهی رقابتها بیش از ۲۰۰ گل برای لیورپول به ثمر برساند.
از سوی دیگر، باشگاه منچستر سیتی طی چند سال اخیر با استخدام گروهی از اخترفیزیکدانان و دانشمندان موشکی (بله درست خواندید!)، دپارتمان آنالیز دادهی خود را تقویت کرده است. آنها همچنین با مشارکت شرکت گوگل یک رقابت هوش مصنوعی ترتیب دادند که در آن محققان و علاقهمندان به هوش مصنوعی بر سر توسعهی یک مدل شبیهسازی که رفتار بازیکنان فوتبال را تحت شرایط مختلف مدل میکرد، رقابت میکردند.
باشگاه آرسنال نیز با استفاده از سیستم « رهگیری بهینه» که یک تکنولوژی رهگیری موشکها محسوب میشود، موقعیت دقیق بازیکنان را نسبت به توپ، سایر همتیمیها و بازیکنان حریف، ۲۵ بار در هر ثانیه ثبت میکند. گفته میشود آنها از این مجموعه داده برای بررسی عملکرد تیم در فازهای مختلف بازی – مالکیت، عدم مالکیت و فاز انتقالی – و مقایسهی آن با آنچه در تمرینها از آنها خواسته شده، استفاده میکنند.
در اینجا میتوان به بسیاری از ابرباشگاههای اروپایی دیگر هم اشاره کرد، اما نکتهی حائز اهمیت این است که باشگاههای بزرگ بسیار کمتر از باشگاههای کوچکتر – تیمهایی چون میجیلند و برنتفورد – علاقه دارند در مورد اقدامات و پیشرفتهای خود در حوزهی دادههای فوتبال صحبت کنند. در بسیاری از موارد حتی به طور قطع مشخص نیست که یک باشگاه با کدام کمپانی تجزیه و تحلیل داده همکاری میکند و بسیاری از آنالیزورهای داده که به استخدام این باشگاهها در میآیند، بنا به قراردادشان، نمیتوانند همکاریشان را با باشگاه موردنظر علنی کنند. آرسنال به صورت مشخص در این زمینه حتی پا را فراتر گذاشت و کمپانی تحلیل دیتای StatDNA را در دسامبر ۲۰۱۲ با قیمتی کمی بیش از ۲ میلیون پوند خرید؛ آنها با این کار، امکان مطلع شدن از تلاشهای باشگاه در حوزهی دیتا را تقریبا برای اشخاص خارج از مجموعه نامقدور کردهاند. نکتهای که میخواهم به آن تاکید کنم این است که گرچه پیشروان استفاده از آنالیز داده در فوتبال تیمهای کوچکتر هستند، اما تیمهای بزرگ هم بیکار ننشستهاند. باشگاههای ثروتمند همواره بخش ولو کوچکی از سرمایهی خود را میتوانند به حوزههای توسعهای اختصاص دهند و حتی در صورت شکست پروژه هم آسیب مالی زیادی نبینند. اگر خرید بازیکنانی چون آنتونی، جیدن سانچو و بسیاری بازیکنهای ناامیدکنندهی دیگر – که صدها میلیون هزینه بر روی دست باشگاه گذاشتهاند و ارزشی که از آنها انتظار میرفت را به تیم اضافه نکردهاند – باعث ورشکستگی منچستر یونایتد نمیشود، سرمایهگذاری بخش اندکی از آن مقدار پول بر روی توسعهی دپارتمان تحلیل داده هم احتمالا حتی در صورت شکست پروژه، باشگاه را در لبهی پرتگاه قرار نمیدهد.
از سوی دیگر، در فوتبال برتریها (و عدم برتریهای) جزئی هستند که تعیینکنندهاند. در فصل گذشته، تیم آرسنال با ۲۴۸ روز در صدر جدول بودن، با دو شکست در هفتههای پایانی رقابت را به منچستر سیتی واگذار کرد؛ اتفاقی که رکورد جدیدی در تاریخ لیگ برتر محسوب میشد. تیمهای در حال رقابت برای قهرمانی، معمولا همگی دسترسی به پول، امکانات، بازیکنان مستعد و مربیان کارکشته دارند – اینکه هر باشگاهی چطور از این منابع استفاده میکند، نکتهی دیگری است که حتما جای بحث دارد. در چنین شرایطی، استفاده از آخرین تکنولوژیهای مربوط به جمعآوری داده و الگوریتمها و مدلهای پیچیدهی ریاضی و آماری ابزاری است که میتواند به تیمها مزیت رقابتی بدهد. نتیجهای که از این نکات میخواهم بگیرم این است که در مجموع باشگاههای کوچکتر راحتتر اخبار مربوط به نوآوریهای جدیدشان، از جمله استفادهی گسترده از تحلیل داده، را با رسانهها در میان میگذارند. مخفی نگه داشتن این موضوع که باشگاه برنتفورد آکادمی خود را تعطیل کرده است، ممکن به نظر نمیرسد! از طرفی این اخبار، به هر چه بیشتر شناخته شدن این باشگاهها کمک میکند، چیزی که باشگاههای بزرگتر کمتر به آن نیاز دارند. از سوی دیگر، قابل درک است که باشگاهی چون منچستر سیتی دلش نخواهد باشگاه آرسنال بداند که آنها با چه کمپانی تحلیل دادهای کار میکنند، چه نوع دادهای را چگونه جمعآوری میکنند و از چه الگوریتمها و مدلهایی برای تبدیل داده به دانش استفاده میکنند، چون این موضوع به معنای از دست دادن مزیت رقابتیای است که سیتی در چنته دارد. این موضوع در بسیاری عرصههای دیگر هم مشاهده میشود. شرکتهایی مانند آمازون، نتفلیکس یا اسپاتیفای از الگوریتمهای بسیار پیشرفته و پیچیده برای طراحی سامانههای توصیهگر خود (recommendations system) برای شخصیسازی (personalization) تجربیات کاربران خود استفاده میکنند. شرکتها اطمینان حاصل میکنند که این الگوریتمها و مدلها به صورت اختصاصی و انحصاری در هر کمپانی باقی بماند تا تقلید از موفقیتشان را برای سایر رقبا چالشبرانگیز کند.
پیشبینی ۲
***
«شکاف دستمزدی و ارقام نقل و انتقالات پرداختشده برای مهاجمان در قیاس با مدافعان و دروازهبانها به صورت قابلتوجهی کاهش خواهد یافت.»
***
برای سالیان سال بسیاری بر این عقیده بودند که: بیشتر گل زدن همواره بهتر از کمتر گل خوردن است. سزار لوئیس منوتی (César Luis Menotti)، سرمربی آرژانتین در قهرمانی جام جهانی ۱۹۷۸ احتمالا این جمله را روی کاغذی نوشته و روی دیوار اتاق کارش نصب کرده بود. بر این اساس، احتمالا عجیب نیست که گرانقیمتترین مهاجم تاریخ فوتبال ۲.۵ برابرِ گرانترین مدافع تاریخ ارزشگذاری و خریداری شده است. شبکههای اجتماعی نیز پر است از صحنههای برتر گلزنی بهترین مهاجمان. طرفداران پیراهن مهاجمان را بسیار بیشتر از مدافعان خریداری میکنند. اینکه مدافعان پس از یک دفاع جانانه خوشحالی کنند (چیزی شبیه به خوشحالی پس از گل مهاجمان)، همچنان چیزی جدید و به چشم بینندگان تلویزیونی نامأنوس است.
گرچه در دهههای اخیر، بسیار دیگر از مربیان فوتبال، خوزه مورینیوها و دیگو سیمئونهها، منزلت فوتبال نتیجهگرا را در چشم هواداران فوتبال بالاتر بردند و موفقیتهای دامنهداری کسب کردند، اما اندرسون و سالی کاری را که در آن تبحر داشتند، انجام دادند: آنالیز دادههای موجود به روش علمی به منظور رد یا قبول [2] یک فرضیه. آنها فرضیهی خود را اینگونه طرحریزی کردند: حملات بیشتر منجر به پیروزیهای بیشتر و دفاع گستردهتر منجر به بردهای کمتر و مساویهای بیشتر میشود. به منظور راستیآزمایی این فرضیه، نویسندگان از دادههای مربوط به لیگ برتر بین سالهای ۲۰۰۱ تا ۲۰۱۱ استفاده کرده و نشان دادند در طول یک فصل به ثبت رساندن ۱۰ گل بیشتر (اگر سایر فاکتورها ثابت در نظر گرفته شود)، ارزشی برابر با ۲.۳۰ پیروزی بیشتر دارد. از سوی دیگر، ۱۰ گل کمتر دریافت کردن هم مترادف با ۲.۱۶ برد بیشتر برای یک تیم است. در واقع، در لیگ برتر انگلیس ۱۰ گل بیشتر زدن و ۱۰ گل کمتر خوردن کمابیش به یک میزان به تعداد بردهای یک تیم میافزاید.
اما روی دیگر سکه را نباید نادیده گرفت. ۱۰ گل بیشتر زدن و ۱۰ گل کمتر خوردن، به طور متوسط چه تاثیری بر روی تعداد باختهای یک تیم دارد؟ نویسندگان نشان دادند که با اولی تعداد شکستهای یک تیم در طول فصل به طور متوسط ۱.۷۶ باخت کاهش مییابد؛ ۱۰ گل کمتر خوردن اما میتواند این آمار را به عدد زیبای ۲.۳۵ برساند! بنابراین اگر بنا به نباختن باشد، گلهای نخورده ۳۳ درصد ارزش بیشتری نسبت به گلهای زده دارند. این یافتهها نشان میدهد که منوتی حداقل در این طرز فکر که «حمله رمز پیروزی است» اشتباه میکرد! فارغ از اینکه مهاجمان چند گل به ثمر میرسانند، این یک خط دفاع مستحکم است که باعث قهرمانی و مانع از سقوط تیمها میشود؛ یا به زبان سر الکس فرگوسن، «مهاجمان بازیها را میبرند و مدافعان جامها را».
تصور میکنم که احتمالا بسیاری از دپارتمانهای داده در باشگاههای اروپایی نتایج مشابهی را مشاهده کرده باشند؛ پس با این وجود چرا همچنان بین قیمت و دستمزد مهاجمان و مدافعان شکاف قابلتوجهی وجود دارد؟ مسئله اینجا است که حتی اگر مهاجمان بازیها را ببرند و مدافعان جامها را، فقط و فقط یک تیم میتواند قهرمان یک تورنمنت شود. درصد قابلتوجهی از تیمهای حاضر در یک لیگ، شانس بسیار زیادی برای دستیابی به مقام قهرمانی ندارند و با کاهش متوسط طول عمر هر مربی در یک باشگاه (این عدد در لیگ برتر انگلیس چیزی در حدود ۱.۶۶ فصل است)، عجیب نیست که آنها تمرکز خود را بر روی اهداف دستیافتنیتری بگذارند، یعنی بردن بازیها.
به علاوه، سوگیریای (bias) که به سمت مهاجمان وجود دارد دلایل سادهای دارد. نتیجهی کار مهاجمان راحتتر از مدافعان قابلمشاهده است: تعداد گلها. تعداد گل متریکی است که از ابتدای شکلگیری ورزش فوتبال، آمار مربوط به آن همواره به سادگی در دسترس بوده است. اگر نگاهی به تاریخچهی توپ طلا بیاندازید، میبینید که سهم مدافعان کمتر از ۷.۵٪ است (بکنباوئر (۲)، لوتار ماتیوس، ماتیاس سامر و کاناوارو). لو یاشین، دروازهبان افسانهای شوروی نیز تنها دروازهبانی است که توانسته برندهی توپ طلا شود. در ۶۷٪ موارد، توپ طلا سهم مهاجمان شده و حتی در ۲۴.۵٪ مربوط به هافبکها، همهی آنها به جز یکی هافبک تهاجمی هستند.
مشاهدهی اینکه یک مدافع مانع از دریافت چند گل شده است – جز در مواردی که مدافع در نقش شبهدروازهبان توپ را از روی خط دروازه در میآورد – کار راحتی نیست (یا حداقل نبوده است). متریکهایی چون تعداد قطع توپ و تعداد تکل موفق به مرور به منظور کمیسازی عملکرد دفاعی بازیکنان ایجاد شد، که خود قدمی رو به جلو محسوب میشد، اما این معیارها دارای ضعفهای ذاتی هستند. فرض کنید یک مدافع مهارت بالایی در جاگیری دارد (positional play). آمار مربوط به تعداد قطع توپ و تعداد تکل برای چنین بازیکنی احتمالا پایین است، چرا که او همواره میداند که موقعیت درست قرارگیریاش نسبت به توپ و سایر بازیکنان کجا است و مجبور به تکلزنی و یا قطع توپ نمیشود.
در همین جا اما استفاده از ریاضیات و تحلیل داده سبب شده تا بیش از پیش ارزش کار مدافعان در جاگیری و بازی بدون توپ روشن شود. نمودار ورونویی نموداری است که زمین بازی را به نواحیای تقسیمبندی میکند که در هر لحظه تحت پوشش یک بازیکن است. اگر این نمودار را برای تمامی ثانیههای بازی پیدا کنید، به چیزی شبیه به ویدیوی زیر دست پیدا خواهید کرد که به صورت پویا به شما نشان میدهد هر بازیکن و کل تیم به عنوان یک مجموعهی واحد چطور فضا را در زمین کنترل میکنند. تولید چنین نمودارهایی – سپس خلاصهسازی و تبدیل آنها به متریکهای عددی – تنها به لطف آخرین پیشرفتهای تکنولوژی در زمینهی جمعآوری دادههای موقعیتی (positional) و پیشامدی (event)، از جمله سیستمهای ردیابی مبتنی بر GPS و سیستمهای ردیابی نوری (که دقیقتر اما پرهزینهتر هستند) ممکن است. کمپانیهای بزرگی چون کینکسون (Kinexon) و اسکیلکرنر (SkillCorner) جزو سرآمدان در این حوزه هستند. نمودارهای ورونویی و تحلیلهای مبتنی بر آنها، کاربردهای فراوانی دارند، از جمله اندازهگیریِ: میزان موفقیت یک بازیکن در پوشش فضا، میزان موفقیت یک بازیکن در پیدا کردن فضا، میزان موفقیت یک بازیکن در پیدا کردن همتیمیها در فضا، واکنش تیمی در پی از دست دادن مالکیت، میزان موفقیت در عریض کردن زمین و … .
یک نمونهی دیگر که دوست دارم به آن اشاره کنم مربوط به آگاهی محیطی است. یکی از معیارهایی که میتواند به ما در کمیسازی آن کمک کند، نرخ اسکن (scan rate) است. این متریک نشان میدهد که یک بازیکن طی ده ثانیه قبل از دریافت توپ، چند بار فضای اطراف خود و سایر بازیکنان را برانداز (اسکن) میکند. به صورت شهودی، نرخ اسکن میتواند ارتباط معناداری با درصد موفقیت پاس داشته باشد (البته همه میدانیم که این همهی ماجرا نیست و تحلیلگران حوزهی داده هم چنین ادعایی نمیکنند. به همین خاطر است که ما همیشه از «متریکها» حرف میزنیم و نه از «متریک».)
مهارتهای لیونل مسی در مهارت ردیابی (اسکن)
دستگاههای پیشرفتهی ضبط حرکات چشم (eye movement tracking)، سیستمهای پیچیدهی ردیابی حرکات سر، سیستمهای ردیابی نوری و دوربینهای بسیار دقیق در ورزشگاهها، امکان جمعآوری چنین دادههایی را فراهم کردهاند. کمپانیهای بزرگی چون کاتاپالت اسپورتس (Catapult Sports) و بی یور بست (Be Your Best) ادعا میکنند که میتوانند با تحلیل این دادهها، تصویر روشنی از نرخ اسکن، زمانبندی اسکن و به طور کلی میزان آگاهی محیطی هر بازیکن، ارائه کنند. این دادهها نه تنها میتوانند به ارزشگذاری دقیقتر و منصفانهتر ما نسبت به بازیکنانی که وظیفهی اصلیشان گل زدن نیست، کمک کند، بلکه باعث میشوند ما به ارزش بازیکنانی چون فیرمینو هم پی ببریم.
فرضیهی من این است که گرچه همچنان شکاف قیمتی و دستمزدی بین مهاجمان و مدافعان وجود دارد و گرچه میتوان دلایل قابلتوضیحی برای وجود چنین شکافی آورد، اما همنظر با اندرسون و سالی، من هم فکر میکنم که طی دههی اخیر این شکاف ولو با شیب کم، کوچکتر شده است. به منظور راستیآزمایی این فرضیه، یک کار آماری کوچک انجام دادهایم. پیش از توضیح جزئیات این آنالیز، میبایست محدودیتهای آن را بربشمرم: این آنالیز تنها بر روی لیگ برتر انگلیس انجام شده است و تنها بر مبلغ خرید بازیکنان تمرکز دارد و سطح دستمزدها را در نظر نمیگیرد. این تحلیل محدود به دههی اخیر است و مقایسهای تنها بین مهاجمان و مدافعان انجام میدهد.
دادههای استفاده شده در اینجا از وبسایت ترنسفر مارکت استخراج شده است. در ابتدا، برای هر دوره از فصل ۱۳-۲۰۱۲ تا ۲۴-۲۰۲۳ برای مجموع تیمهای حاضر در لیگ برتر، مجموع هزینهی انجامشده برای خرید مهاجمان و مجموع هزینهی انجامشده برای خرید مدافعان توسط تیمها و سپس نسبت این دو را که متریک مدنظر ما است، محاسبه کردیم.
همانطور که در گراف بالا میبینید، علیرغم وجود نوسانهای فصل به فصل، در مجموع یک روند کاهشی در نسبت هزینهی خرید مهاجمان به هزینهی خرید مدافعان دیده میشود. خط نقطهچین که نشانگر میانگین متحرک (Moving average) این نسبتها است، اثر این نوسانات فصلی را کم میکند و روند نزولی بهتر دیده میشود. برای اینکه مطمئن شویم روند نزولیای که مشاهده میکنیم به لحاظ آماری نیز معنادار است، از آزمون من-کندال (Mann-Kendall) استفاده میکنیم که یک تست آماری است برای تعیین وجود یا عدم وجود روند در دادههای سری زمانی. علت انتخاب این آزمون (در مقایسه با روشهای رگرسیونی) این است که این یک آزمون غیر-پارامتریک است و نیازمند هیچ فرض اساسیای مبنی بر پیروی کردن داده از توزیع نرمال نیست. مقدار احتمال یا p-value حاصل از این آزمون برابر با ۰.۰۱۶ است که بیانگر آن است که شواهدی مبنی بر وجود ترند در این دادهها وجود دارد.
آنالیز بالا به علت محدودیتهایی که شرح آنها رفت به ما اطمینان کامل را در قبول پیشبینی سالی و اندرسون نمیدهد، اما حداقل میتوان گفت که شواهد قابلاعتنایی مبنی بر اینکه شکاف موجود بین هزینهی نقل و انتقالات مهاجمان و مدافعان رو به کاهش است، وجود دارد. بررسی دقیقتر این پیشبینی را به مقالهی دیگری موکول میکنم تا با استفاده از دادههای بیشتر از سایر لیگها و همینطور روشهای سیستماتیکتر تحلیل داده، بتوانم نظر دقیقتری در مورد این پیشبینی ارائه کنم.
جمعبندی
اندرسون و سالی در کتاب «بازی اعداد» ما را به سفر جدیدی به مقصد فوتبال میبرند؛ سفری که در آن خواننده سوار بر «داده» و «تحلیل داده» قادر خواهد بود نگاه متفاوتی به این بازی زیبا داشته باشد. علیرغم استفادهی بسیار از ریاضیات و علم آمار، نویسندگان وظیفهی هدایت خواننده را بدون آنکه برای مخاطب حوصلهسربر شود، به خوبی انجام میدهند. آنها نشان میدهند که فوتبال بنا به دلایل منطقی و قابلتوضیح، به اندازهی ورزشهایی چون بیسبال و فوتبال آمریکایی، پذیرای انقلاب تحلیل داده نبوده، اما از سوی دیگر بسیار خوشبین هستند که ورزش فوتبال هم در آیندهی نزدیک به این موج خواهد پیوست: «طوفانی در [دنیای] فوتبال در حال شکلگیری است؛ طوفانی که تمام قطعیتها را از بین میبرد و بازیای را که میشناسیم و آن را دوست داریم، تغییر میدهد.»
در این مقاله سعی کردم به دو پیشبینیای که نویسندگان ۱۰ سال پیش انجام دادهاند، بپردازم و با توجه به اینکه دقیقا یک دهه از چاپ این کتاب میگذرد، آنها را با استفاده از شواهد و دادههای موجود راستیآزمایی کنم. هشت پیشبینی دیگر هم در این کتاب وجود دارد که بررسی آنها میتواند برای بسیاری جالب و خواندنی باشد. در انتها، به فوتبالدوستانی که علاقهمند به حوزهی تحلیل داده هستند و یا حتی زوایای جدی با استفاده از تحلیل داده در فوتبال دارند!، خواندن این کتاب را توصیه میکنم. دستهی دوم احتمالا پس از خواندن این کتاب خیالشان از این بابت راحت میشود که تحلیلگران داده در حوزهی فوتبال (حداقل هنوز!) به دنبال این نیستند که سرمربی را اخراج و مدل ریاضی خود را روی نیمکت بنشانند؛ احتمالا به همان دلیل که بزرگترین شرکت تکنولوژی و فناوری دنیا، گوگل، همچنان توسط سوندار پیچای، مدیر عامل اجراییاش اداره میشود و نه یک مدل هوش مصنوعی!
***
[1] تئوری اورینگ یک تئوری مدل اقتصادی است که در سال ۱۹۹۳ توسط مایکل کرمر ارائه شد. این تئوری پیشنهاد میکند که برای بازدهی بالای یک بخش از کار تولید، باید همه وظایفی که به نوعی با هم در ارتباط هستند با بازده بالا انجام شوند، در غیر این صورت هیچکدام از آنها – فارغ از بازدهی خود آن بخش از کار – به کیفیت مورد نظر نمیرسند.
[2] به زبان دقیقتر، در علم آمار، ما فرضیهای را «قبول» نمیکنیم. پس از امتحان یک فرضیه، دو نتیجه ممکن است: (۱) بنا به شواهد قادر به رد فرضیه نیستیم (که این گذاره با اینکه فرضیه را قبول میکنیم متفاوت است) و (۲) بنا به شواهد موجود، فرضیه را رد میکنیم.
منابع
- https://www.theguardian.com/football/2015/jul/27/how-fc-midtjylland-analytical-route-champions-league-brentford-matthew-benham
- https://theathletic.com/1103112/2019/08/07/how-set-piece-kings-midtjylland-and-their-former-celtic-star-have-left-even-the-likes-of-manchester-city-behind/?access_token=4831937&redirected=1
- https://bleacherreport.com/articles/2718752-brentfords-moneyball-way-to-beat-football-teams-with-huge-budgets
- https://analyisport.com/insights/who-are-footballs-star-data-analysts/
- https://bleacherreport.com/articles/1719218-are-strikers-really-worth-more-than-defenders-in-the-transfer-market
2 پاسخ
فوقالعاده بود 👌👌👌👍👍👍
عالی واقعا فوق العاده.
خوشحالم که این سایت وجود داره که مقالههای درست حسابی داره بین این همه سایت زرد و حاشیهدار.