نگاهی به کتاب «بازی اعداد» اثر کریس اندرسون و دیوید سالی

بازی اعداد، نوشته‌ی کریس اندرسون و دیوید سالی، کتابی است که با استفاده از علم تحلیل داده نگاه متفاوتی به ورزش فوتبال دارد. در مقاله‌ی پیش رو، این کتاب را به صورت کلی مرور کرده‌‌ایم و برخی از پیش‌بینی‌هایی را که این کتاب در مورد آینده‌ی علمِ داده در حوزه‌ی فوتبال انجام داده، مورد بررسی قرار داده‌ایم. […]
کتاب بازی اعداد

بازی زیبا یا «بازی اعداد» (The Numbers Game)؟ دومی نامی است که کریس اندرسون (Chris Anderson) و دیوید سالی (David Sally) بر روی کتاب‌شان گذاشته‌اند. البته آنها به همین هم بسنده نکرده‌اند؛ در تیتر دوم کتاب این جمله به چشم می‌خورد: «چرا هر آنچه که در مورد فوتبال می‌دانید، اشتباه است». همین چند کلمه برای من کافی بود تا تصمیم بگیرم این کتاب را بخوانم. سالی یک اقتصاددان رفتاری و دنبال‌کننده‌ی فوتبال است و اندرسون پیش از آنکه استاد علوم سیاسی در مدرسه‌ی اقتصاد لندن باشد، در لیگ دسته چهارم آلمان فوتبال بازی می‌کرد. برای شخص من، به عنوان یک دانشمند داده، این موضوع که بازی پیچیده‌ای چون فوتبال را می‌توان به شیوه‌ی روشمند مطالعه کرد، همواره جالب توجه بوده است. این کتاب به صورت مشخص به ما نشان می‌دهد که این امر نه تنها ممکن، که کمک‌کننده هم هست؛ به خصوص هنگامی که پای کلیشه‌های فوتبالی وسط می‌آید که اکثریت، آن‌ها را به عنوان واقعیت پذیرفته‌اند، اما آمار و داده آن‌ها را رد می‌کند.

برای مثال بارها از گزارشگران فوتبال شنیده‌ایم که یک تیم بلافاصله پس از گل‌زنی در آسیب‌پذیرترین شرایط قرار دارد. اندرسون و سالی به کمک داده نشان می‌دهند که این موضوع نه تنها درست نیست، که دقیقا عکس آن برقرار است. یا برخلاف باور عامه، ضربات کرنر در افزایش شانس گلزنی تیم تاثیر چندانی ندارند و حتی داشتن شوت‌های بیشتر به سمت دروازه متضمن موفقیت نیست. نویسندگان با بررسی ۸،۳۲۳ مسابقه در لیگ‌های بزرگ اروپایی بین سال‌های ۲۰۰۵ تا ۲۰۱۱ دریافتند که تیمی که تعداد شوت بیشتری به سمت دروازه داشته باشد، تنها بین ۵۰ تا ۵۸ درصد از مواقع – بسته به لیگ – برنده می‌شود.

هدف اصلی من از این نوشتار، نقد و بررسی کلی این اثر نیست. علی‌رغم نکات آموزنده‌ای که هر یک از فصول کتاب برای خواننده دارد، فصلی که من می‌خواهم به صورت مشخص به آن بپردازم، فصل آخر این کتاب است؛ فصلی که در آن اندرسون و سالی ۱۰ مورد از پیش‌بینی‌های خود را در رابطه با فوتبال و علم داده که فکر می‌کردند در دهه‌ی پیش‌رو به حقیقت خواهد پیوست، ارائه می‌کنند. نظر به اینکه این کتاب در سال ۲۰۱۳ نوشته شده است و هم‌اکنون در سال ۲۰۲۴ هستیم، فکر می‌کنم زمان خوبی باشد تا درستی و نادرستی برخی از این پیش‌بینی‌ها را به بوته‌ی آزمایش بگذاریم و ببینیم این دو تا چه اندازه آینده‌ی تحلیل داده در حوزه‌ی فوتبال را به درستی پیش‌بینی کرده‌اند.

اما پیش از آنکه مستقیم سر اصل مطلب بروم، ابتدا به صورت خلاصه به ساختار کتاب و سرفصل‌هایی که پوشش داده می‌شود، اشاره می‌کنم؛ با این امید که مخاطبان علاقه‌مند به این موضوع پس از آشنایی بیشتر با آن، به سراغش بروند.

مرور کلی کتاب

کتاب کارش را با اشاره به مقاومت تاریخی مربیان در برابر استفاده از تحلیل‌های آماری آغاز و برای تبیین منظور خود آن را با «مانی‌بال» (Moneyball– نام کتابی به همین نام از مایکل لوییس که در فرهنگ عامه با استفاده‌ی هوشمندانه از علوم داده برای کسب موفقیت ورزشی عجین شده است) در بیسبال مقایسه می‌کند. فصل اول این کتاب، که احتمالا یکی از جذاب‌ترین فصول کتاب برای من بود، میزان «تصادفی بودن» فوتبال را با سایر ورزش‌ها به روش علمی مقایسه می‌کند؛ پدیده‌ای که ربط مستقیم به کم‌گل بودن ورزش فوتبال در قیاس با سایر ورزش‌ها دارد. نویسندگان از شواهد زیادی برای توضیح این موضوع بهره می‌برند که گراف زیر یکی از آن‌ها است. در بین فوتبال، هندبال، بسکتبال، و فوتبال آمریکایی، احتمال برنده شدن تیمی که پیش از شروع بازی تیم برتر محسوب می‌شود، در بازی فوتبال تنها اندکی بیش از ۵۰ درصد است. این عدد برای هندبال فراتر از ۷۰ درصد است. در واقع پیش‌بینی برنده در سایر ورزش‌های گروهی از جمله بسکتبال و فوتبال آمریکایی به مراتب راحت‌تر از فوتبال است.

احتمال برنده شدن تیمی که پیش از شروع بازی تیم برتر محسوب می‌شود در فصل ۱۱-۲۰۱۲ (منبع: کتاب بازی اعداد)
احتمال برنده شدن تیمی که پیش از شروع بازی تیم برتر محسوب می‌شود در فصل ۱۱-۲۰۱۲ (منبع: کتاب بازی اعداد)

در فصول میانی، نویسندگان روندهای مختلف در لیگ‌های فوتبال را مطالعه می‌کنند و با اشاره به کاهش تعداد متوسط گل در بازی‌ها، بیش از هر چیزی آن را به پیشرفت‌های حاصل شده در خطوط دفاعی (با سرعت بیشتر نسبت به خطوط حمله) نسبت می‌دهند. با این حال، نکته‌ی بدیهی که نویسندگان بر آن انگشت می‌گذارند این است که گرچه «گل‌ها» باارزش هستند، اما ارزش همه‌ی گل‌ها یکی نیست. این نکته به خودی خود هوشمندانه نیست، اما نویسندگان با استفاده از تحلیل داده نشان می‌دهند که به طور متوسط، دومین گل هر تیم باارزش‌ترین گل است و بیشترین اثر جزئی (marginal) را بر روی نتیجه‌ی نهایی می‌گذارد. این نکته احتمالا می‌تواند مواجهه‌ی ما با نحوه‌ی ارزیابی کارآمدی مهاجمان را تغییر دهد.

فصول پایانی کتاب توجه ویژه‌ای به تحقیقات مستقل این دو نویسنده دارد، جایی که آن‌ها با وام گرفتن از تئوری اورینگ [1] (O-ring) و بررسی دیتای فوتبال به صورت سیستماتیک نشان می‌دهند که یک تیم فوتبال به اندازه‌ی ضعیف‌ترین بازیکنش قوی است. با استفاده از روش‌های رگرسیونی، اندرسون و سالی نشان دادند که اگر تیمی کیفیت «بهترین» بازیکن خود را از ۸۲ درصد به ۹۲ درصد افزایش دهد، در نتیجه‌ی این کار در طول فصل تفاضل گل تیم ۱۰ گل بهبود می‌يابد. از سوی دیگر اما، اگر تیمی کیفیت «ضعیف‌ترین» بازیکن خود را از ۳۸ درصد به ۴۸ درصد افزایش دهد، نتیجه‌ی این تغییر چیزی در حدود ۱۳ گل و ۹ امتیاز بیشتر در جدول خواهد بود.

فصل ۱۰ نیز جزو فصول خواندنی کتاب است. نویسندگان در این فصل یافته‌های کوپر و ژیمانسکی را در کتاب ساکرنامیکس، مبنی بر اینکه سطح دستمزدهای بازیکنان در یک تیم، ۸۹ درصد موفقیت تیم را توضیح می‌دهد، به چالش می‌کشند؛ تئوری‌ای که نقش و تاثیر مربیان بر موفقیت تیم‌ها را کمتر از آنچه تصور می‌شود، نشان می‌دهد. اندرسون و سالی با انجام دوباره‌ی این آنالیز نشان می‌دهند که این عدد به جای ۸۹، چیزی در حدود ۸۱ درصد است. همچنین آنها ادعا می‌کنند که وقتی حرف از دستمزد بازیکنان می‌زنیم، نمی‌توانیم دستمزد مربیان را نادیده بگیریم. تیم‌های ثروتمند نه تنها بازیکنان گرانی به خدمت می‌گیرند، بلکه مربیان آن‌ها هم مربیان کارکشته و تراز اولی هستند که دستمزد بالایی دارند. تیم بولتون قادر نیست گاس هیدینگ را به خدمت بگیرد و تیم چلسی هم سکان خود را به دستان سمی لی (Sammy Lee) نمی‌سپارد. ایراد سومی که نویسندگان به یافته‌های ساکرنامیکس وارد می‌کنند این است که دستمزد یک بازیکن را نمی‌توان تماما به استعداد و توانایی ذاتی او نسبت داد. هر بازیکنی محصول آموزش‌هایی که توسط مربیان پیشین و فعلی خود دریافت کرده است و از همین رو، نادیده گرفتن نقش مربیان کوته‌نظرانه است.

فصل آخر: فوتبال در عصر داده و تکنولوژی

کنفرانس Sloan Sports Analytics که توسط دانشگاه MIT در شهر بوستون برگزار می‌شود، هر ساله پذیرای تعداد بسیار زیادی از آنالیزورها، مربیان، کارشناسان و مدیران فوتبالی از سرتاسر جهان است که به دنبال آشنایی بیشتر با آخرین پیشرفت‌های تکنولوژی و تحلیل داده در حوزه‌ی ورزش هستند. تعداد کمپانی‌هایی که سرویس‌های مربوط به جمع‌آوری و تحلیل داده‌های فوتبالی را هم انجام می‌دهند، روز به روز رو به افزایش است. آنچه که امروز در مورد نقش تکنولوژی و تحلیل داده در فوتبال می‌دانیم، می‌تواند به ما کمک کند که آینده‌ی این دو را تا حدی پیش‌بینی کنیم و این کاری است که اندرسون و سالی در فصل آخر کتاب خود انجام دادند. در اینجا از بین ۱۰ پیش‌بینی‌ای که نویسندگان در کتاب خود برشمردند، دو مورد اصلی را بررسی می‌کنیم و سعی می‌کنیم آن‌ها را با اطلاعات بیشتری که پس از یک دهه از زمان چاپ این کتاب به دست آمده، تطبیق دهیم.

پیش‌بینی ۱

***

«پیشرفت‌های بزرگ حوزه‌ی تحلیل داده در منچستر یونایتد، منچستر سیتی، رئال مادرید، بارسلونا یا هیچ یک از بیست باشگاه ثروتمند فهرست شده در گزارش‌های مالی دیلویت (Deloitte) رخ نخواهد داد.»

***

نکته‌ای که گاهی در مورد مانی‌بال و موفقیت بیلی بین در تیم اوکلند اتلتیکز نادیده گرفته می‌شود این است که این تیم در شرایط بسیار بدی به سر می‌برد و حتی طرفداران از رفتن به استادیوم خودداری می‌کردند؛ به زبان دیگر، «آن‌ها چیزی برای از دست دادن نداشتند.» و احتمالا همین نکته‌ی مهم این اجازه‌ را به بین می‌‌داد تا با خلاقیت و نوآوری به دنبال راهی برای فرار از منجلاب باشد. ایده‌های نوآورانه‌ی او در حوزه‌ی استفاده از تحلیل داده اگر با شکست مواجه می‌شد، آسمان به زمین نمی‌‌آمد و وضعیت آن‌ها از آنچه که بود بدتر نمی‌شد. این موضوع در مورد باشگاه‌های بزرگ ورزشی صادق نیست. اگر یک استراتژی یا سرمایه‌گذاری به خصوص در بارسلونا یا بایرن مونیخ جواب ندهد، این باشگاه‌ها هزینه‌ی مالی و معنوی بسیار زیادی می‌پردازند. هنگامی که ابعاد پیامدهای ناشی از شکست بزرگ باشد، فضا برای نوآوری و امتحان راه‌های جدید تنگ‌تر می‌شود. از طرفی تیم‌هایی که با محدودیت پول و سرمایه روبه‌رو هستند و نمی‌توانند گران‌ترین مربیان و بازیکنان را به خدمت بگیرند، باید هوشمندانه‌تر از منابع محدود خود استفاده کنند.

یکی از باشگاه‌هایی که بسیار در مورد آن می‌شنویم، باشگاه دانمارکی میجیلند است. پس از گذر از چالش‌های مالی فراوان و خطر ورشکستگی، آن‌ها توانستند به لطف خدمات متیو بنهام – یکی از سهام‌داران اصلی باشگاه و مالک کمپانی اسمارت‌آدز (Smartodds) که یک کمپانی تحلیل داده‌های ورزش به منظور شرط‌بندی است – قهرمان لیگ دانمارک شوند. راسموس انکرسن، رئیس هیئت‌ مدیره‌ی باشگاه، در مصاحبه‌های فراوانی به نقش تحلیل داده در موفقیت‌های تیم اشاره کرده است. تد کنوتسان، مدیر اجرایی کمپانی StatsBomb، که یکی از بزرگ‌ترین و پیشروترین شرکت‌ها در زمینه‌ی تجزیه و تحلیل داده‌های فوتبال است، بخش مهمی از هسته‌ای بود که بنهام در سال ۲۰۱۴ در میجیلند شکل داد. آن‌ها با استخدام گروهی از تحلیل‌گران داده و آنالیزورها، رویکرد خود را در بسیاری از زمینه‌ها، از جمله آنالیز بازی، جذب بازیکن، ضربات آزاد و … به یک رویکرد مبتنی بر داده و مدلسازی ریاضی تبدیل کردند. در مورد ضربات آزاد، این تیم طی فصول اخیر توانسته آمار مربوط به درصد گل‌های خود را از روی ضربات آزاد بهبود ببخشد. آن‌ها طی چندین فصل حدود ۴۰ درصد از گل‌های خود را از روی ضربات آزاد به ثمر رساندند. در بین لیگ‌های اروپایی، این عدد به طور متوسط چیزی بین ۲۰ تا ۲۶ درصد است.

یکی دیگر از تیم‌هایی که باید به آن اشاره کرد، تیم لیگ برتریِ برنتفورد است. اگر یک کار سخت‌تر از صعود به لیگ برتر وجود داشته باشد، آن کار ماندن در لیگ برتر است. برنتفورد در فصل ۲۱-۲۰۲۰ پس از شکست سوانزی در مسابقات پلی‌آف، خود را به بالاترین سطح فوتبال انگلیس رساند. در دو فصل ابتدایی حضور این تیم در این رده، آن‌ها به ترتیب رتبه‌های سیزدهم و نهم را به خود اختصاص دادند. در سال ۲۰۱۶ تیم برنتفورد یک تصمیم عجیب گرفت. رابرت رووان، مدیر فنی وقت برنتفورد (که در سال ۲۰۱۸ در ۲۸ سالگی بر اثر نارسایی قلبی جان خود را از دست داد)، این طور گفت: «مدل فوتبالی مبتنی بر آکادمی برای برخی باشگاه‌ها کار می‌کند، اما برای برنتفورد تصمیم درستی نبود.» این تیم در ماه می ۲۰۱۶ آکادمی فوتبال خود را تعطیل کرد. دلیل آن‌ها برای این کار این بود که با توجه به ارزش مالی و درآمدهای آن موقع باشگاه، هزینه‌های مربوط به گرداندن آکادمی سرسام‌آور است و همچنین آن‌ها قادر نیستند به موقع بازیکنان مستعد جوان خود را بفروشند و تولید درآمد کنند. از همین رو، برنتفورد می‌بایست در شیوه‌های خود در خرید بازیکن تغییرات انقلابی ایجاد می‌کرد تا بتواند با سایر تیم‌ها همچنان رقابت کند. برنتفورد تصمیم گرفت تا بر روی دو نوع از بازیکنان تمرکز کند: اول بازیکنان آزاد شده توسط سایر تیم‌های انگلیسی که دیگر در تیم‌شان جایی نداشتند و دوم بازیکنان خارجی که می‌توانستند برنتفورد را سکوی پرتابی برای راهیابی به فوتبال انگلیس ببینند. انجام این کار نیازمند یک سیستم دقیق آنالیز داده بود که بتواند در ابعاد بزرگ پروفایل بازیکنان را بررسی و گزینه‌های مناسب را شناسایی کند. برای این کار باشگاه از کمپانی اسمارت‌آدز و سایر تحلیل‌گران داده در این حوزه کمک گرفت. شاید جالب باشد که بدانید متیو بنهام، مالک کمپانی اسمارت‌‌آدز و سهام‌دار عمده‌ی باشگاه میجیلند، مالک باشگاه برنتفورد نیز است! از سال ۲۰۱۶ تا سال ۲۰۲۲ برنتفورد ۷۵ میلیون پوند برای جذب بازیکن هزینه کرد، اما از سوی دیگر توانست ۱۹۰ میلیون پوند بابت فروش بازیکن به دست بیاورد (خرید نیل ماوپی به قیمت ۱.۶ میلیون پوند و فروش او به برایتون به مبلغ ۲۰ میلیون پوند، خرید اولی واتکینز به قیمت ۶.۵ میلیون و فروش او به استون‌ ویلا به قیمت ۳۰ میلیون و همچنین خرید آیوان تونی با ۴.۸ میلیون که بنا به ارزیابی وبسایت ترنسفر مارکت هم‌اکنون ۳۰ میلیون پوند ارزش‌گذاری می‌شود، نمونه‌‌هایی از سرمایه‌گذاری‌های پربازده این باشگاه هستند.) سود ناشی از فروش بازیکن به برنتفورد کمک کرد تا به لیگ برتر صعود کنند و یک ورزشگاه جدید نیز برای خود بسازند.

با مشاهده‌ی چنین نمونه‌هایی ترغیب می‌شویم که با اندرسون و سالی در مورد پیش‌بینی‌شان موافقت کنیم، اما این داستان روی دیگری هم دارد. باشگاه لیورپول در سال ۲۰۱۲ یان گراهام را که یک فیزیکدان و فارغ‌التحصیل دانشگاه کمبریج بود، به استخدام خود در آورد و مدیریت دپارتمان داده‌ی خود را به او سپرد. از گراهام به عنوان کسی که آنالیزها و مدل‌های آماری‌اش زیربنای به خدمت گرفتن ستارگان بسیاری برای این تیم بود، یاد می‌شود. اما شاید مهم‌‌ترین خرید گراهام خودِ یورگن کلوپ باشد. بروسیا دورتموند، در فصل ۱۵-۲۰۱۴ با رتبه‌ی هفتمی و در حالی که ۳۳ امتیاز با تیم قهرمان یعنی بایرن مونیخ فاصله داشت، کارش را تمام کرد و یورگن کلوپ ۴۸ ساله با انتقادات فراوانی از سوی رسانه‌ها مواجه شد. مدل‌ها و آنالیزهای گراهام اما نشان می‌داد که عملکرد دورتموند بسیار بهتر از رتبه‌شان در جدول بوده و آن‌ها فقط بیش از اندازه بدشانس بودند؛ به بیان دقیق‌تر یافته‌های گراهام پس از آنالیز دورتموند در طی ۱۰ فصل نشان می‌داد که آن‌ها دومین تیم بدشانس در طی آن ۱۰ سال بوده‌اند! در واقع از نظر او کلوپ مربی بسیار توانمندی بود و می‌توانست به پروژه‌ی لیورپول کمک کند. گراهام معتقد بود خط سیر عملکرد (trajectory) دورتموند چیزی است که اهمیت دارد و نه فقط نتایج یک فصل. شاید به همین خاطر هم بود که گراهام در اولین ملاقاتش با کلوپ پس از به اشتراک گذاشتن نتایج تحقیقاتش به او گفت که به ندرت ویدیویی از بازی‌های فصل آخر دورتموند دیده است! از بازیکنانی که دپارتمان داده‌ی لیورپول و در رأس آن، گراهام، زمینه‌ی به خدمت گرفتن‌شان را فراهم کردند می‌توان به محمد صلاح، سادیو مانه و روبرتو فیرمینو اشاره کرد. هنگامی که لیورپول احتیاج به یک مهاجم داشت، گراهام از دپارتمان داده‌ی خود درخواست کرد تا لیستی متشکل از ۱۰ بازیکن ایجاد کرده و در اختیار کلوپ قرار دهند. در صدر این لیست محمد صلاح قرار داشت. کلوپ لیست را رد کرد و گفت که فکر نمی‌کند هیچ کدام از آن گزینه‌ها برای لیورپول مناسب باشند. دوران کم‌فروغ صلاح در چلسی او را به یک گزینه‌ی نامحبوب در انگلیس تبدیل می‌کرد. گراهام و تیمش اما بر روی یافته‌هایشان تاکید کردند و باشگاه نهایتا به قیمت ۴۲ میلیون یورو او را به خدمت گرفت. صلاح تا به امروز موفق شده در همه‌ی رقابت‌ها بیش از ۲۰۰ گل برای لیورپول به ثمر برساند.

از سوی دیگر، باشگاه منچستر سیتی طی چند سال اخیر با استخدام گروهی از اخترفیزیکدانان و دانشمندان موشکی (بله درست خواندید!)، دپارتمان آنالیز داده‌ی خود را تقویت کرده است. آن‌ها همچنین با مشارکت شرکت گوگل یک رقابت هوش مصنوعی ترتیب دادند که در آن محققان و علاقه‌مندان به هوش مصنوعی بر سر توسعه‌ی یک مدل شبیه‌سازی که رفتار بازیکنان فوتبال را تحت شرایط مختلف مدل می‌کرد، رقابت می‌کردند.

باشگاه آرسنال نیز با استفاده از سیستم « رهگیری بهینه» که یک تکنولوژی رهگیری موشک‌ها محسوب می‌شود، موقعیت دقیق بازیکنان را نسبت به توپ، سایر هم‌تیمی‌ها و بازیکنان حریف، ۲۵ بار در هر ثانیه ثبت می‌کند. گفته می‌شود آن‌ها از این مجموعه داده برای بررسی عملکرد تیم در فازهای مختلف بازی – مالکیت، عدم مالکیت و فاز انتقالی – و مقایسه‌ی آن با آنچه در تمرین‌ها از آن‌ها خواسته شده، استفاده می‌کنند.

در اینجا می‌توان به بسیاری از ابرباشگاه‌های اروپایی دیگر هم اشاره کرد، اما نکته‌ی حائز اهمیت این است که باشگاه‌های بزرگ بسیار کمتر از باشگاه‌های کوچک‌تر – تیم‌هایی چون میجیلند و برنتفورد – علاقه دارند در مورد اقدامات و پیشرفت‌های خود در حوزه‌ی داده‌های فوتبال صحبت کنند. در بسیاری از موارد حتی به طور قطع مشخص نیست که یک باشگاه با کدام کمپانی تجزیه و تحلیل داده همکاری می‌کند و بسیاری از آنالیزورهای داده که به استخدام این باشگاه‌ها در می‌آیند، بنا به قراردادشان، نمی‌توانند همکاری‌شان را با باشگاه موردنظر علنی کنند. آرسنال به صورت مشخص در این زمینه حتی پا را فراتر گذاشت و کمپانی تحلیل دیتای StatDNA را در دسامبر ۲۰۱۲ با قیمتی کمی بیش از ۲ میلیون پوند خرید؛ آن‌ها با این کار، امکان مطلع شدن از تلاش‌های باشگاه در حوزه‌ی دیتا را تقریبا برای اشخاص خارج از مجموعه نامقدور کرده‌اند. نکته‌ای که می‌خواهم به آن تاکید کنم این است که گرچه پیشروان استفاده از آنالیز داده در فوتبال تیم‌های کوچک‌تر هستند، اما تیم‌های بزرگ هم بیکار ننشسته‌اند. باشگاه‌های ثروتمند همواره بخش ولو کوچکی از سرمایه‌‌ی خود را می‌توانند به حوزه‌های توسعه‌ای اختصاص دهند و حتی در صورت شکست پروژه هم آسیب مالی زیادی نبینند. اگر خرید بازیکنانی چون آنتونی، جیدن سانچو و بسیاری بازیکن‌های ناامیدکننده‌ی دیگر – که صدها میلیون هزینه بر روی دست باشگاه گذاشته‌اند و ارزشی که از آن‌ها انتظار می‌رفت را به تیم اضافه نکرده‌اند – باعث ورشکستگی منچستر یونایتد نمی‌شود، سرمایه‌گذاری بخش اندکی از آن  مقدار پول بر روی توسعه‌ی دپارتمان‌ تحلیل داده هم احتمالا حتی در صورت شکست پروژه، باشگاه را در لبه‌ی پرتگاه قرار نمی‌دهد.

از سوی دیگر، در فوتبال برتری‌ها (و عدم برتری‌های) جزئی هستند که تعیین‌کننده‌اند. در فصل گذشته، تیم آرسنال با ۲۴۸ روز در صدر جدول بودن، با دو شکست در هفته‌های پایانی رقابت را به منچستر سیتی واگذار کرد؛ اتفاقی که رکورد جدیدی در تاریخ لیگ برتر محسوب می‌شد. تیم‌های در حال رقابت برای قهرمانی، معمولا همگی دسترسی به پول، امکانات، بازیکنان مستعد و مربیان کارکشته دارند – اینکه هر باشگاهی چطور از این منابع استفاده می‌کند، نکته‌ی دیگری است که حتما جای بحث دارد. در چنین شرایطی، استفاده از آخرین تکنولوژی‌های مربوط به جمع‌آوری داده و الگوریتم‌‌ها و مدل‌های پیچیده‌ی ریاضی و آماری ابزاری‌ است که می‌تواند به تیم‌ها مزیت رقابتی بدهد. نتیجه‌ای که از این نکات می‌خواهم بگیرم این است که در مجموع باشگاه‌های کوچک‌تر راحت‌تر اخبار مربوط به نوآوری‌های جدیدشان، از جمله استفاده‌ی گسترده از تحلیل داده، را با رسانه‌ها در میان می‌گذارند. مخفی نگه داشتن این موضوع که باشگاه برنتفورد آکادمی خود را تعطیل کرده است، ممکن به نظر نمی‌رسد! از طرفی این اخبار، به هر چه بیشتر شناخته شدن این باشگاه‌ها کمک می‌کند، چیزی که باشگاه‌های بزرگ‌تر کمتر به آن نیاز دارند. از سوی دیگر، قابل درک است که باشگاهی چون منچستر سیتی دلش نخواهد باشگاه آرسنال بداند که آن‌ها با چه کمپانی تحلیل داده‌ای کار می‌کنند، چه نوع داده‌ای را چگونه جمع‌آوری می‌کنند و از چه الگوریتم‌ها و مدل‌هایی برای تبدیل داده به دانش استفاده می‌کنند، چون این موضوع به معنای از دست دادن مزیت رقابتی‌ای است که سیتی در چنته دارد. این موضوع در بسیاری عرصه‌های دیگر هم مشاهده می‌شود. شرکت‌هایی مانند آمازون، نتفلیکس یا اسپاتیفای از الگوریتم‌های بسیار پیشرفته و پیچیده برای طراحی سامانه‌‌های توصیه‌گر خود (recommendations system) برای شخصی‌سازی (personalization) تجربیات کاربران خود استفاده می‌‌کنند. شرکت‌ها اطمینان حاصل می‌کنند که این الگوریتم‌ها و مدل‌ها به صورت اختصاصی و انحصاری در هر کمپانی باقی بماند تا تقلید از موفقیت‌‌شان را برای سایر رقبا چالش‌برانگیز کند.

پیش‌بینی ۲

***

«شکاف دستمزدی و ارقام نقل و انتقالات پرداخت‌شده برای مهاجمان در قیاس با مدافعان و دروازه‌بان‌ها به صورت قابل‌توجهی کاهش خواهد یافت.»

***

برای سالیان سال بسیاری بر این عقیده بودند که: بیشتر گل زدن همواره بهتر از کمتر گل خوردن است. سزار لوئیس منوتی (César Luis Menotti)، سرمربی آرژانتین در قهرمانی جام جهانی ۱۹۷۸ احتمالا این جمله را روی کاغذی نوشته و روی دیوار اتاق کارش نصب کرده بود. بر این اساس، احتمالا عجیب نیست که گران‌قیمت‌ترین مهاجم تاریخ فوتبال ۲.۵ برابرِ گران‌ترین مدافع تاریخ ارزش‌گذاری و خریداری شده است. شبکه‌های اجتماعی نیز پر است از صحنه‌های برتر گل‌زنی بهترین مهاجمان. طرفداران پیراهن مهاجمان را بسیار بیشتر از مدافعان خریداری می‌کنند. اینکه مدافعان پس از یک دفاع جانانه خوشحالی کنند (چیزی شبیه به خوشحالی پس از گل مهاجمان)، همچنان چیزی جدید و به چشم بینندگان تلویزیونی نامأنوس است.

گرچه در دهه‌‌های اخیر، بسیار دیگر از مربیان فوتبال، خوزه مورینیوها و دیگو سیمئونه‌ها، منزلت فوتبال نتیجه‌گرا را در چشم هواداران فوتبال بالاتر بردند و موفقیت‌های دامنه‌داری کسب کردند، اما اندرسون و سالی کاری را که در آن تبحر داشتند، انجام دادند: آنالیز داده‌های موجود به روش علمی به منظور رد یا قبول [2] یک فرضیه. آن‌ها فرضیه‌ی خود را اینگونه طرح‌ریزی کردند: حملات بیشتر منجر به پیروزی‌های بیشتر و دفاع گسترده‌تر منجر به بردهای کمتر و مساوی‌های بیشتر می‌شود. به منظور راستی‌آزمایی این فرضیه، نویسندگان از داده‌های مربوط به لیگ برتر بین سال‌های ۲۰۰۱ تا ۲۰۱۱ استفاده کرده و نشان دادند در طول یک فصل به ثبت رساندن ۱۰ گل بیشتر (اگر سایر فاکتورها ثابت در نظر گرفته شود)، ارزشی برابر با ۲.۳۰ پیروزی بیشتر دارد. از سوی دیگر، ۱۰ گل کمتر دریافت کردن هم مترادف با ۲.۱۶ برد بیشتر برای یک تیم است. در واقع، در لیگ برتر انگلیس ۱۰ گل بیشتر زدن و ۱۰ گل کمتر خوردن کمابیش به یک میزان به تعداد بردهای یک تیم می‌افزاید.

اما روی دیگر سکه را نباید نادیده گرفت. ۱۰ گل بیشتر زدن و ۱۰ گل کمتر خوردن، به طور متوسط چه تاثیری بر روی تعداد باخت‌های یک تیم دارد؟ نویسندگان نشان دادند که با اولی تعداد شکست‌های یک تیم در طول فصل به طور متوسط ۱.۷۶ باخت کاهش می‌یابد؛ ۱۰ گل کمتر خوردن اما می‌تواند این آمار را به عدد زیبای ۲.۳۵ برساند! بنابراین اگر بنا به نباختن باشد، گل‌های نخورده ۳۳ درصد ارزش بیشتری نسبت به گل‌‌های زده دارند. این یافته‌ها نشان می‌دهد که منوتی حداقل در این طرز فکر که «حمله رمز پیروزی است» اشتباه می‌کرد! فارغ از اینکه مهاجمان چند گل به ثمر می‌رسانند، این یک خط دفاع مستحکم است که باعث قهرمانی و مانع از سقوط تیم‌ها می‌‌شود؛ یا به زبان سر الکس فرگوسن، «مهاجمان بازی‌ها را می‌برند و مدافعان جام‌ها را».

تصور می‌کنم که احتمالا بسیاری از دپارتمان‌های داده در باشگاه‌های اروپایی نتایج مشابهی را مشاهده کرده باشند؛ پس با این وجود چرا همچنان بین قیمت و دستمزد مهاجمان و مدافعان شکاف قابل‌توجهی وجود دارد؟ مسئله اینجا است که حتی اگر مهاجمان بازی‌ها را ببرند و مدافعان جام‌ها را، فقط و فقط یک تیم می‌تواند قهرمان یک تورنمنت شود. درصد قابل‌توجهی از تیم‌های حاضر در یک لیگ، شانس بسیار زیادی برای دست‌یابی به مقام قهرمانی ندارند و با کاهش متوسط طول عمر هر مربی در یک باشگاه (این عدد در لیگ برتر انگلیس چیزی در حدود ۱.۶۶ فصل است)، عجیب نیست که آن‌ها تمرکز خود را بر روی اهداف دست‌یافتنی‌تری بگذارند، یعنی بردن بازی‌ها.

به علاوه، سوگیری‌ای (bias) که به سمت مهاجمان وجود دارد دلایل ساده‌ای دارد. نتیجه‌ی کار مهاجمان راحت‌تر از مدافعان قابل‌مشاهده است: تعداد گل‌ها. تعداد گل متریکی است که از ابتدای شکل‌گیری ورزش فوتبال، آمار مربوط به آن همواره به سادگی در دسترس بوده است. اگر نگاهی به تاریخچه‌ی توپ طلا بیاندازید، می‌بینید که سهم مدافعان کمتر از ۷.۵٪ است (بکن‌باوئر (۲)، لوتار ماتیوس، ماتیاس سامر و کاناوارو). لو یاشین، دروازه‌بان افسانه‌ای شوروی نیز تنها دروازه‌بانی است که توانسته برنده‌ی توپ طلا شود. در ۶۷٪ موارد، توپ طلا سهم مهاجمان شده و حتی در ۲۴.۵٪ مربوط به هافبک‌ها، همه‌ی آن‌ها به جز یکی هافبک تهاجمی هستند.

 تعداد برندگان توپ طلا به تفکیک پست بازی

مشاهده‌ی اینکه یک مدافع مانع از دریافت چند گل شده است – جز در مواردی که مدافع در نقش شبه‌دروازه‌بان توپ را از روی خط دروازه در می‌آورد – کار راحتی نیست (یا حداقل نبوده است). متریک‌هایی چون تعداد قطع توپ و تعداد تکل موفق به مرور به منظور کمی‌سازی عملکرد دفاعی بازیکنان ایجاد شد، که خود قدمی رو به جلو محسوب می‌شد، اما این معیارها دارای ضعف‌های ذاتی  هستند. فرض کنید یک مدافع مهارت بالایی در جاگیری دارد (positional play). آمار مربوط به تعداد قطع توپ و تعداد تکل برای چنین بازیکنی احتمالا پایین است، چرا که او همواره می‌داند که موقعیت درست قرارگیری‌اش نسبت به توپ و سایر بازیکنان کجا است و مجبور به تکل‌زنی و یا قطع توپ نمی‌شود.

در همین جا اما استفاده از ریاضیات و تحلیل داده سبب شده تا بیش از پیش ارزش کار مدافعان در جاگیری و بازی بدون توپ روشن شود. نمودار ورونویی نموداری است که زمین بازی را به نواحی‌ای تقسیم‌بندی می‌کند که در هر لحظه تحت پوشش یک بازیکن است. اگر این نمودار را برای تمامی ثانیه‌های بازی پیدا کنید، به چیزی شبیه به ویدیوی زیر دست پیدا خواهید کرد که به صورت پویا به شما نشان می‌دهد هر بازیکن و کل تیم به عنوان یک مجموعه‌ی واحد چطور فضا را در زمین کنترل می‌کنند. تولید چنین نمودارهایی – سپس خلاصه‌سازی و تبدیل آن‌ها به متریک‌های عددی – تنها به لطف آخرین پیشرفت‌‌های تکنولوژی در زمینه‌ی جمع‌آوری داده‌های موقعیتی (positional) و پیشامدی (event)، از جمله سیستم‌های ردیابی مبتنی بر GPS و سیستم‌های ردیابی نوری (که دقیق‌تر اما پرهزینه‌تر هستند) ممکن است. کمپانی‌های بزرگی چون کینکسون (Kinexon) و اسکیل‌کرنر (SkillCorner) جزو سرآمدان در این حوزه هستند. نمودارهای ورونویی و تحلیل‌های مبتنی بر آن‌ها، کاربردهای فراوانی دارند، از جمله اندازه‌گیریِ: میزان موفقیت یک بازیکن در پوشش فضا، میزان موفقیت یک بازیکن در پیدا کردن فضا، میزان موفقیت یک بازیکن در پیدا کردن هم‌تیمی‌ها در فضا، واکنش تیمی در پی از دست دادن مالکیت، میزان موفقیت در عریض کردن زمین و … .

نمودار ورونویی
نمودار ورونویی (منبع: Will Sutton)

یک نمونه‌‌ی دیگر که دوست دارم به آن اشاره کنم مربوط به آگاهی محیطی است. یکی از معیارهایی که می‌تواند به ما در کمی‌سازی آن کمک کند، نرخ اسکن (scan rate) است. این متریک نشان‌ می‌دهد که یک بازیکن طی ده ثانیه قبل از دریافت توپ، چند بار فضای اطراف خود و سایر بازیکنان را برانداز (اسکن) می‌کند. به صورت شهودی،‌ نرخ اسکن می‌تواند ارتباط معناداری با درصد موفقیت پاس داشته باشد (البته همه می‌دانیم که این همه‌ی ماجرا نیست و تحلیل‌گران حوزه‌ی داده هم چنین ادعایی نمی‌کنند. به همین خاطر است که ما همیشه از «متریک‌ها» حرف می‌زنیم و نه از «متریک».)

مهارت‌های لیونل مسی در مهارت ردیابی (اسکن)

دستگاه‌های پیشرفته‌ی ضبط حرکات چشم (eye movement tracking)، سیستم‌های پیچیده‌ی ردیابی حرکات سر، سیستم‌های ردیابی نوری و دوربین‌های بسیار دقیق در ورزشگاه‌ها، امکان جمع‌آوری چنین داده‌هایی را فراهم کرده‌اند. کمپانی‌های بزرگی چون کاتاپالت اسپورتس (Catapult Sports) و بی یور بست (Be Your Best) ادعا می‌کنند که می‌توانند با تحلیل این داده‌ها، تصویر روشنی از نرخ اسکن، زمان‌بندی اسکن و به طور کلی میزان آگاهی محیطی هر بازیکن، ارائه کنند. این داده‌ها نه تنها می‌توانند به ارزش‌گذاری دقیق‌تر و منصفانه‌تر ما نسبت به بازیکنانی که وظیفه‌ی اصلی‌شان گل زدن نیست، کمک کند، بلکه باعث می‌شوند ما به ارزش بازیکنانی چون فیرمینو هم پی ببریم.

تعداد اسکن بر ثانیه در لیگ برتر انگلیس
از مقاله‌ی گِیر یوردت و همکاران (فصل ۱۸-۲۰۱۷)

فرضیه‌ی من این است که گرچه همچنان شکاف قیمتی و دستمزدی بین مهاجمان و مدافعان وجود دارد و گرچه می‌توان دلایل قابل‌توضیحی برای وجود چنین شکافی آورد، اما هم‌نظر با اندرسون و سالی، من هم فکر می‌کنم که طی دهه‌ی اخیر این شکاف ولو با شیب کم، کوچک‌تر شده است. به منظور راستی‌آزمایی این فرضیه، یک کار آماری کوچک انجام داده‌ایم. پیش از توضیح جزئیات این آنالیز، می‌بایست محدودیت‌های آن را بربشمرم: این آنالیز تنها بر روی لیگ برتر انگلیس انجام شده است و تنها بر مبلغ خرید بازیکنان تمرکز دارد و سطح دستمزدها را در نظر نمی‌گیرد. این تحلیل محدود به دهه‌ی اخیر است و مقایسه‌ای تنها بین مهاجمان و مدافعان انجام می‌دهد.

داده‌های استفاده شده در اینجا از وبسایت ترنسفر مارکت استخراج شده است. در ابتدا، برای هر دوره از فصل ۱۳-۲۰۱۲ تا ۲۴-۲۰۲۳ برای مجموع تیم‌های حاضر در لیگ برتر، مجموع هزینه‌ی انجام‌شده برای خرید مهاجمان و مجموع هزینه‌ی انجام‌شده برای خرید مدافعان توسط تیم‌ها و سپس نسبت این دو را که متریک مدنظر ما است، محاسبه کردیم.

نسبت مجموع هزینه‌ی خرید مهاجمان به مجموع هزینه‌ی خرید مدافعان در لیگ برتر انگلیس

همان‌طور که در گراف بالا می‌بینید، علی‌رغم وجود نوسان‌های فصل به فصل، در مجموع یک روند کاهشی در نسبت هزینه‌ی خرید مهاجمان به هزینه‌ی خرید مدافعان دیده می‌شود. خط نقطه‌چین که نشان‌گر میانگین متحرک (Moving average) این نسبت‌ها است، اثر این نوسانات فصلی را کم می‌کند و روند نزولی بهتر دیده می‌شود. برای اینکه مطمئن شویم روند نزولی‌ای که مشاهده می‌کنیم به لحاظ آماری نیز معنادار است، از آزمون من-کندال (Mann-Kendall) استفاده می‌کنیم که یک تست آماری است برای تعیین وجود یا عدم وجود روند در داده‌های سری زمانی. علت انتخاب این آزمون (در مقایسه با روش‌های رگرسیونی) این است که این یک آزمون غیر-پارامتریک است و نیازمند هیچ فرض اساسی‌ای مبنی بر پیروی کردن داده از توزیع نرمال نیست. مقدار احتمال یا p-value حاصل از این آزمون برابر با ۰.۰۱۶ است که بیان‌گر آن است که شواهدی مبنی بر وجود ترند در این داده‌ها وجود دارد.

آنالیز بالا به علت محدودیت‌هایی که شرح آن‌ها رفت به ما اطمینان کامل را در قبول پیش‌بینی سالی و اندرسون نمی‌دهد، اما حداقل می‌توان گفت که شواهد قابل‌اعتنایی مبنی بر اینکه شکاف موجود بین هزینه‌ی نقل و انتقالات مهاجمان و مدافعان رو به کاهش است، وجود دارد. بررسی دقیق‌تر این پیش‌بینی را به مقاله‌ی دیگری موکول می‌کنم تا با استفاده از داده‌های بیشتر از سایر لیگ‌ها و همین‌طور روش‌های سیستماتیک‌تر تحلیل داده، بتوانم نظر دقیق‌تری در مورد این پیش‌بینی ارائه کنم.

جمع‌بندی

اندرسون و سالی در کتاب «بازی اعداد» ما را به سفر جدیدی به مقصد فوتبال می‌برند؛ سفری که در آن خواننده سوار بر «داده» و «تحلیل داده» قادر خواهد بود نگاه متفاوتی به این بازی زیبا داشته باشد. علی‌رغم استفاده‌ی بسیار از ریاضیات و علم آمار، نویسندگان وظیفه‌ی هدایت خواننده را بدون آنکه برای مخاطب حوصله‌سربر شود، به خوبی انجام می‌دهند. آن‌ها نشان می‌دهند که فوتبال بنا به دلایل منطقی و قابل‌توضیح، به اندازه‌ی ورزش‌هایی چون بیسبال و فوتبال آمریکایی، پذیرای انقلاب تحلیل داده نبوده، اما از سوی دیگر بسیار خوش‌بین هستند که ورزش فوتبال هم در آینده‌ی نزدیک به این موج خواهد پیوست: «طوفانی در [دنیای] فوتبال در حال شکل‌گیری است؛ طوفانی که تمام قطعیت‌ها را از بین می‌برد و بازی‌ای را که می‌شناسیم و آن را دوست داریم، تغییر می‌دهد.»

در این مقاله سعی کردم به دو پیش‌بینی‌ای که نویسندگان ۱۰ سال پیش انجام داده‌‌اند، بپردازم و با توجه به اینکه دقیقا یک دهه از چاپ این کتاب می‌گذرد، آن‌ها را با استفاده از شواهد و داده‌های موجود راستی‌آزمایی کنم. هشت پیش‌بینی دیگر هم در این کتاب وجود دارد که بررسی آن‌ها می‌تواند برای بسیاری جالب و خواندنی باشد. در انتها، به فوتبال‌دوستانی که علاقه‌مند به حوزه‌ی تحلیل داده هستند و یا حتی زوایای جدی با استفاده از تحلیل داده در فوتبال دارند!، خواندن این کتاب را توصیه می‌کنم. دسته‌ی دوم احتمالا پس از خواندن این کتاب خیال‌شان از این بابت راحت می‌شود که تحلیل‌گران داده در حوزه‌ی فوتبال (حداقل هنوز!) به دنبال این نیستند که سرمربی را اخراج و مدل ریاضی خود را روی نیمکت بنشانند؛ احتمالا به همان دلیل که بزرگ‌ترین شرکت تکنولوژی و فناوری دنیا، گوگل، همچنان توسط سوندار پیچای، مدیر عامل اجرایی‌اش اداره می‌شود و نه یک مدل هوش مصنوعی!

***

[1] تئوری اورینگ یک تئوری مدل اقتصادی است که در سال  ۱۹۹۳ توسط مایکل کرمر ارائه شد. این تئوری پیشنهاد می‌کند که برای بازدهی بالای یک بخش از کار تولید، باید همه وظایفی که به نوعی با هم در ارتباط هستند با بازده بالا انجام شوند، در غیر این صورت هیچ‌کدام از آن‌ها – فارغ از بازدهی خود آن بخش از کار – به کیفیت مورد نظر نمی‌رسند.

[2] به زبان دقیق‌تر، در علم آمار، ما فرضیه‌ای را «قبول» نمی‌کنیم. پس از امتحان یک فرضیه، دو نتیجه ممکن است: (۱) بنا به شواهد قادر به رد فرضیه نیستیم (که این گذاره با اینکه فرضیه را قبول می‌کنیم متفاوت است) و (۲) بنا به شواهد موجود، فرضیه را رد می‌کنیم.

منابع

 

2 پاسخ

  1. عالی واقعا فوق العاده.
    خوشحالم که این سایت وجود داره که مقاله‌های درست حسابی داره بین این همه سایت زرد و حاشیه‌دار.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *