هوش مصنوعی | متن کامل رایگان | چشم در آسمان – روشی برای به دست آوردن مکان ورزشکاران فوتبال با قوانین استرالیا

۱٫ معرفی

تحلیلگران عملکرد در تیم های ورزشی حرفه ای به طور فزاینده ای ملزم به تجزیه و تحلیل مجموعه های بزرگی از داده های ورزشکاران برای بدست آوردن بینشی هستند که منجر به مزیت رقابتی نسبت به رقیب می شود. [۱]. تجزیه و تحلیل عمیق ورزش های تیمی به دلیل پیشرفت در فناوری حسگر و قدرت محاسباتی در حال افزایش است [۲,۳,۴]. اولین مرحله از همه آنالیزها ردیابی دقیق بازیکنان در زمین است. این را می توان با داده های حسگر مانند GPS، LPS، یا IMU یا استفاده از ویدئو به دست آورد [۳]. مفهوم ردیابی داده ها به داده های مکانی – زمانی اشاره دارد که موقعیت توپ و/یا بازیکن را در طول یک رویداد ورزشی توصیف می کند. [۵]. استفاده از داده های ویدئویی با دسترسی آسان برای استخراج داده های مکانی-زمانی دوبعدی به طور فزاینده ای محبوب است. برای این منظور، روش‌های بینایی کامپیوتری در ورزش‌های متعدد به کار گرفته شده است که بیشترین کاربرد آن در فوتبال و بسکتبال است. [۲]. هدف محققان و متخصصان ورزش تنها با استفاده از داده های ویدئویی، درک بهتر رفتار تاکتیکی و تعاملات یک تیم یا فرد است. [۵,۶] یا برای حمایت از تصمیم گیری مربوط به عملکرد و خطر آسیب [۴].
برای نتایج معنی دار، مهم است که خواسته ها و محدودیت های ورزش های تیمی خاص را در نظر بگیرید [۴]. قوانین استرالیا فوتبال (AF) چالش‌هایی را فراهم می‌کند که نمی‌توان آن‌ها را در ورزش‌های تیمی که بیشتر مورد بررسی قرار می‌گیرند، مانند فوتبال و بسکتبال پیدا کرد: در AF، ۳۶ بازیکن در زمینی هستند که اندازه آن در استادیوم‌های مختلف یکسان نیست، که یک محدودیت منحصربه‌فرد برای این ورزش است. . ابعاد زمین های مورد استفاده در لیگ حرفه ای فوتبال استرالیا (AFL) از ۱۷۵ متر طول و ۱۴۵ متر عرض (ورزشگاه دانشگاه تاسمانی) تا ۱۵۵ متر در ۱۳۶ متر (زمین کریکت سیدنی) متغیر است. میانگین طول و عرض زمین های AFL به ترتیب ۵٫۹ ± ۱۶۳٫۶ متر و ۶٫۹ ± ۱۳۲٫۱ متر است. [۴]. برای ارائه اطلاعات موقعیت مکانی بازیکنان، همه بازیکنان به یک واحد GPS تجاری مجهز هستند، اما تیم های حرفه ای فقط می توانند به داده های GPS تیم خود دسترسی داشته باشند، در حالی که اطلاعات محدود یا بدون هیچ یک از تیم های AF مخالف در دسترس است. بنابراین، تجزیه و تحلیل تاکتیکی پیشرفته کنونی را نمی توان به راحتی انجام داد، زیرا مکان تیم AF مخالف نامشخص است. در نتیجه، علی‌رغم فراگیر بودن داده‌های GPS، تجزیه و تحلیل رفتار جمعی مخالف در AF در حال حاضر به تجزیه و تحلیل ویدیوی دوبعدی معمولی، یک فرآیند دستی و زمان‌بر محدود شده است. بنابراین، فناوری بینایی کامپیوتر فرصتی هیجان انگیز برای غلبه بر این مشکل در AF ارائه می دهد [۷,۸,۹].
چالش‌های عمده روش‌های مبتنی بر بینایی، وابستگی آنها به محیط است – آنها مستعد تغییرات مکرر در سرعت ورزشکاران و انسداد در بازی‌های شلوغ، تغییر در نور زمین و شباهت‌های ظاهری هم تیمی‌ها هستند. [۲,۳]. علاوه بر این، چالش منحصر به فرد اندازه‌های مختلف میدان در ترکیب با اندازه میدان بزرگ که نیاز به دوربین‌های متعدد دارد، استفاده از روش‌های مرسوم ردیابی بازیکن را غیرممکن می‌کند. [۴]. بنابراین، مراحل مختلف پیش پردازش برای ردیابی موفقیت آمیز ورزشکاران ضروری است [۱۰,۱۱]. تکنیک های توصیه شده شامل موارد زیر است: (۱) حذف سایه ها برای مبارزه با تغییرات در شرایط نوری [۱۲]; (۲) استفاده از تنظیمات دوربین متعدد برای اطمینان از اینکه همه ورزشکاران در حین فیلمبرداری در میدان دید هستند [۱۳]; (۳) استفاده از مدل های تشخیص اشیا از قبل آموزش دیده [۱۴,۱۵,۱۶]; (۴) و مدل های تشخیص شماره پیراهن برای تشخیص و شناسایی ورزشکاران فردی [۱۷].
دو روش مبتنی بر بینایی کامپیوتری به طور منظم برای به دست آوردن مکان ورزشکاران در زمین استفاده می شود تشخیص ردیابی تعبیه شده و ردیابی با تشخیص [۱۱]. شناسایی ورزشکاران بخشی از خط لوله ردیابی است تشخیص ردیابی تعبیه شده [۷,۱۸,۱۹]در مقایسه با پیاده سازی های یادگیری عمیق مدرن، به عنوان یک روش دستی پرهزینه در نظر گرفته می شود [۸,۲۰]. فرآیند ردیابی با استخراج زمین بازی با استفاده از ترکیبی از تکنیک‌های بینایی رایانه‌ای اولیه، مانند تفریق پس‌زمینه، تشخیص لبه‌ها و استخراج کانتور آغاز می‌شود. [۷,۸,۲۱] تا اطمینان حاصل شود که استخراج ویژگی های بعدی سوژه های ردیابی (معمولاً رنگ، شکل و ویژگی های مسیر) بدون تغییرات در ظاهر زمین بازی و سر و صدای تماشاگران و بنرهای تبلیغاتی است. یکی از نمونه‌های این رویکرد، ردیابی ورزشکاران در فوتبال در فریم‌های ویدیویی با استفاده از ویژگی‌های Haar مانند است [۱۹]به عنوان تفاوت در شدت پیکسل مجموع مناطق مستطیلی مختلف در سراسر موضوعات ردیابی تعریف شده است. [۲۲]. یک مثال جدیدتر که بر اساس این رویکرد ساخته شده است، استفاده از فیلترهای ذرات به عنوان روش استخراج ویژگی است که تفاوت در شدت پیکسل بین مناطق کوچکتر را در مقایسه با ویژگی های Haar مانند در نظر می گیرد. [۲۳]. تشخیص لکه [۲۴,۲۵]آشکارسازهای اوتسو [۱۲]و بردارهای حرکتی [۲۶] همچنین معمولاً از روش‌های استخراج ویژگی استفاده می‌شود تشخیص ردیابی تعبیه شده. ورزشکاران با مرتبط کردن ویژگی‌های مشابه در فریم‌ها، مانند تشخیص لبه، ردیابی می‌شوند [۱۲]ویژگی های توپوگرافی سه بعدی [۲۵]و الگوریتم های ردیابی اپراتور پیچیدگی کارآمد (ECO). [27,28].
ردیابی با تشخیص تفاوت با رویکردهای فوق در این است که ابتدا ورزشکاران را در تصویر ورودی قبل از ارسال تشخیص به ردیاب‌های شی مستقل تشخیص می‌دهد. [۱۴,۱۵]. این رویکرد منجر به بهبود دقت می شود زیرا ظاهر و مکان ورزشکار قبل از استفاده از الگوریتم ردیابی شناخته شده است. با این حال، دقت روش‌های ردیابی مستقل به شدت به دقت آشکارساز بستگی دارد، به این معنی که استفاده از آشکارساز شی که برای کار مورد نظر بهینه شده است تا بهترین نتایج ردیابی را به دست آورد، بسیار مهم است. تکنیک‌های یادگیری عمیق مبتنی بر شبکه‌های عصبی کانولوشن نتایج امیدوارکننده‌ای را در تشخیص اشیا نشان داده‌اند [۲۹]و آشکارسازهای افراد از قبل آموزش دیده شکل محبوبی از آشکارسازهای شی هستند زیرا از نیاز به آموزش از ابتدا جلوگیری می کنند. به عنوان مثال، هیستوگرام آشکارسازهای فرد مبتنی بر گرادیان گرا [۳۰]شبکه عصبی کانولوشنال سریعتر بازگشتی (یک معماری پیشرفته آشکارساز شی [۳۱]) و یک آشکارساز شی سریعتر به نام You Only Look Once (YOLO) [32,33] که برای تشخیص افراد در تصاویر و فیلم ها آموزش دیده اند، همگی برای شناسایی ورزشکاران در زمینه های ورزشی استفاده شده اند. شناسایی‌ها متعاقباً به الگوریتم‌های ردیابی تعیین‌شده، مانند ماشین‌های بردار پشتیبان، شبکه‌های عصبی حافظه کوتاه‌مدت منتقل شدند. [۳۴]و ردیابی ساده آنلاین و بلادرنگ با متریک ارتباط عمیق (DeepSORT) [35]برای ردیابی ورزشکاران در فریم های ویدئویی [۹,۱۵,۳۶].
پیشرفت های قبلی در ردیابی حرکات ورزشکاران با استفاده از روش های مبتنی بر بینایی کامپیوتری، ورزش هایی را مورد بررسی قرار داده است که در آن ابعاد زمین بازی در سراسر عرصه های مسابقه ثابت می ماند. علاوه بر این، مرزهای زمین بازی در تحقیقات قبلی همگی به شکل مستطیل هستند، مانند زمین‌های بازی و زمین‌هایی که در فوتبال، بسکتبال و اسکواش با آن مواجه می‌شوند. [۲۵,۳۷,۳۸,۳۹,۴۰]به منظور ساده سازی تا حد زیادی فرآیندهای فنی مورد نیاز برای تعیین موقعیت نسبی میدان ورزشکاران شناسایی شده [۴]. اکثر آثار موجود نیز از دوربین‌های ثابت استفاده می‌کنند که مسائل مربوط به تغییر پس‌زمینه، اعوجاج‌های ظاهری و حرکت دوربین را که از عملکردهای پان، شیب و زوم اپراتور ناشی می‌شود، به حداقل می‌رساند و در برخی موارد حذف می‌کند. [۱۰]. این چالش‌ها در AF به دلیل تفاوت‌های مجاز در شکل و اندازه زمین در استادیوم‌ها تقویت می‌شوند. [۴۱]و استفاده از دوربین های متحرک، شیب، و زوم متعددی که به صورت دستی کار می کنند که در آنها کل زمین بازی به ندرت در میدان دید کامل قرار می گیرد. انسداد مکرر ورزشکاران نیز به دلیل ماهیت تماس کامل این ورزش یکی از ویژگی های رایج فیلم های ویدئویی است. این محدودیت‌ها به‌شدت بر عملکرد روش‌های ردیابی فوق‌الذکر تأثیر می‌گذارد و مانع از کاربرد روش‌های تشخیص و ردیابی ورزشکار در AF می‌شود. [۴]. یک مطالعه از یک آشکارساز شخصی سفارشی و طبقه‌بندی تیم برای تشخیص استفاده کرد و سپس ورزشکاران را در فریم‌های ویدیوی پخش شده با ترکیبی از فیلترهای کالمن و تکنیک‌های به حداقل رساندن انرژی ردیابی کرد. [۴۲]. نتایج این بررسی برای غلبه بر تغییرات در شرایط نوری و انسداد مکرر ورزشکاران تلاش کرد.
داده‌های ردیابی ورزشکاران، از سیستم موقعیت‌یابی جهانی (GPS) گرفته تا دستگاه‌های سیستم موقعیت‌یابی محلی (LPS)، بر چالش‌های فوق‌الذکر غلبه می‌کنند که فیلم‌های ویدیویی مسابقات AF را تحت تأثیر قرار می‌دهند. [۴۳]. با این حال، داده‌های خام ردیابی ورزشکاران از تیم‌های مخالف برای تیم‌های حرفه‌ای AF در دسترس نیست، به این معنی که برای به دست آوردن این اطلاعات به یک روش جایگزین نیاز است. منحصر به فرد برای حرفه ای AF، در دسترس بودن تجاری انیمیشن های داده های GPS ورزشکاران از تمام مسابقات حرفه ای AF، که شامل تیم های مخالف است، توسط Champion Data، ارائه دهنده آمار رسمی لیگ فوتبال استرالیا است. ورزشکاران به صورت دایره هایی از دید پرنده از زمین بازی نشان داده می شوند (شکل ۱، سمت راست بالا)، که کار ردیابی ورزشکاران را ساده می کند زیرا مسائل مربوط به تغییرات نور، تغییر در ظاهر ورزشکاران، تفاوت های مبهم بین هم تیمی ها، مناطق مسدود شده را حذف می کند. زمین بازی و اعوجاج دوربین. در نتیجه، داده های ردیابی ورزشکاران متحرک فرصت منحصر به فردی را برای کاربرد مدرن فراهم می کند ردیابی با تشخیص تکنیک.

هدف از این مطالعه فنی توسعه یک ردیابی با تشخیص تکنیک برای به دست آوردن موقعیت های مربوط به میدان ورزشکاران AF با استفاده از انیمیشن های پخش کننده بر اساس سیگنال های GPS. ما بیشتر ضرایب تبدیل مختصات پیکسل به دکارتی را منحصر به فرد برای هر استادیوم ایجاد خواهیم کرد. این نرم افزار جدید از ردیابی با تشخیص تجزیه و تحلیل تاکتیکی رفتار تیم جمعی مخالف و توسعه ابزارهای طراحی بازی تعاملی در AF را امکان پذیر می کند.

۴٫ بحث

هدف از این تحقیق توسعه یک ردیابی با تشخیص تکنیکی برای به دست آوردن موقعیت های مربوط به میدان ورزشکاران AF بر اساس انیمیشن های تجاری مبتنی بر GPS موجود در بازیکنان و ایجاد معادلات تبدیل مختصات پیکسل به دکارتی منحصر به فرد برای هر استادیوم AF. با توجه به اندازه های گسترده زمین در AF، روش های استاندارد ردیابی نوری را نمی توان در AF اعمال کرد [۳]. بنابراین سیستم‌های ردیابی ورزشکاران تا حد زیادی به داده‌های GPS محدود شده‌اند که برای تیم مقابل در دسترس نیست. از این رو، روش جدید با استفاده از داده های متحرک GPS ارائه شده در این تحقیق اولین گام ارزشمند برای تجزیه و تحلیل رفتار تاکتیکی هر دو تیم بازی کننده است.
دقت بالای آشکارساز ورزشکار سفارشی (mAP 0.94، دقت ۰٫۹۵، فراخوانی ۰٫۹۷، F1-score 0.96) با تلاش های موفقیت آمیز قبلی برای کارهای مشابه قابل مقایسه بود. [۳,۹,۱۴,۱۷,۵۳]. این نتایج از این موضع حمایت می کند که تنظیم دقیق یک آشکارساز چند شی برای تشخیص فوکوس خودکار ورزشکار در انیمیشن ها کافی است. با توجه به حجم داده ها و زمان مورد نیاز برای آموزش یک آشکارساز شی چندگانه کاملاً سفارشی شده از ابتدا، مناسب ترین رویکرد استفاده از یک آشکارساز شی از پیش آموزش دیده و تنظیم دقیق مدل در مجموعه داده سفارشی ما بود. [۱۶]. به این ترتیب، زمان آموزش کاهش یافت و همچنین نتایج مطلوبی با کاهش حجم داده به دست آورد. کار آینده در این زمینه ممکن است آشکارسازهای چند شی مختلف را مقایسه کند، به عنوان مثال، [۵۴,۵۵,۵۶,۵۷]، برای بهبود دقت تشخیص و کاهش زمان صرف شده برای استنتاج. علاوه بر این، مدل توسعه‌یافته در این مطالعه ممکن است برای تولید مجموعه داده‌های تشخیص ورزشکار بزرگ‌تر مورد استفاده قرار گیرد تا بتواند یک آشکارساز شی چندگانه را از ابتدا به عنوان وسیله‌ای برای مقایسه آموزش دهد. مجموعه داده همچنین باید به گونه ای گسترش یابد که تیم های متعددی را شامل شود تا کاربرد روش آشکارساز ورزشکار ارائه شده در اینجا افزایش یابد.
استفاده از یک عدد خوان دو رقمی سفارشی برای شناسایی شماره بازیکنان هر ورزشکار ردیابی شده، مشابه رویکرد یون و همکاران (۲۰۱۹) [۱۷]تفاوت اساسی با قبلی داشت ردیابی با تشخیص روش های مورد استفاده در ورزش [۹,۱۵,۳۶] و به دقت بالای ۰٫۹۸ دست یافت. اگرچه ترکیبی از استفاده از چندین معماری یادگیری عمیق جداگانه در خط لوله ردیابی ورزشکار، فرآیند کارآمدی نیست، عملکرد خوب امکان تعیین ضرایب تبدیل مختصات پیکسل به دکارتی مخصوص استادیوم را فراهم می‌کند که می‌تواند در تحقیقات آینده مورد استفاده قرار گیرد. مدل‌های ردیابی از پیش آموزش‌دیده‌شده قبلی [۱۵,۳۵] به دلیل منحصر به فرد بودن مجموعه داده (یعنی ورزشکاران به صورت نقاط با اعداد بازی نمایش داده می شوند) در مقایسه با داده های مورد استفاده برای توسعه روش های ردیابی منبع باز (یعنی تصاویر دنیای واقعی از انسان) برای پیاده سازی در مطالعه فعلی مناسب نبودند. . کاربرد مدل‌های ردیابی از پیش آموزش‌دیده شده باید با استفاده از روش فعلی برای تولید داده‌های مورد نیاز برای آموزش مدل‌های ردیابی سفارشی ویژه AF مورد بررسی قرار گیرد. با انجام این کار، کار آینده ممکن است جایگزین و کارآمدتر شود ردیابی با تشخیص مواد و روش ها.
ضرایب گروه‌بندی استادیوم معادلات تبدیل پیکسل به مختصات دکارتی (جدول ۱) تغییرپذیری کم را نشان می‌دهد، در نتیجه یک روش مخصوص استادیوم برای تبدیل مختصات پیکسل به مختصات دکارتی مربوط به میدان ایجاد می‌کند. تفاوت‌های جزئی در مقیاس‌بندی و ضرایب ترجمه بین استادیوم‌ها، استحکام رویکرد را در محاسبه اندازه‌های مختلف میدان مورد استفاده در AF نشان داد. [۴۱].
میانگین دقت موقعیتی رویکرد فعلی (۲٫۶۳ متر) در مقایسه با دقت گزارش شده دستگاه های GPS و LPS رایج در نظر گرفته می شود (به ترتیب ۰٫۴۹ ± ۰٫۹۶ متر و ۰٫۰۷ ± ۰٫۲۳ متر). [۴۳]). با این حال، مشاهده شد که تفاوت‌های موقعیتی بین مختصات پیکسل تبدیل‌شده و مختصات دکارتی GPS از نظر ماهیت سیستماتیک بودند (یعنی بزرگی و جهت برای هر ورزشکار شناسایی‌شده سازگار بود). این مشاهدات نشان می دهد که فاصله اقلیدسی بین مختصات پیکسل تبدیل شده و مختصات دکارتی GPS را می توان با تنظیم دقیق معادلات تبدیل کاهش داد. علاوه بر این، بدیهی است که رویکرد جدید منجر به موارد پرت قابل توجهی می شود (شکل ۴) که به اشتباهات روش تشخیص و متعاقب آن شناسایی اشتباه ورزشکاران مربوط می شود. این خطا ممکن است با اتخاذ پروتکل‌های پیچیده‌تر پس از پردازش و فیلتر کردن، یا از طریق استفاده از مدل‌های ردیابی سفارشی کاهش یابد. فیلتر مشروط اعمال شده نقاط پرت بزرگ را حذف کرد اما در عین حال شکاف های بزرگی را بدون هیچ اطلاعاتی معرفی کرد. مدل‌های ردیابی سفارشی یا فیلترهایی مانند فیلتر کالمن می‌توانند برای به حداقل رساندن شکاف‌های تشخیص بزرگ و در نتیجه، شناسایی اشتباه ورزشکاران استفاده شوند. [۳۵]. نمایش نابرابر مسابقات انجام شده در هر استادیوم بر روی کار حاضر تأثیر گذاشت، که می‌توان آن را به ویژگی‌های خاص قرعه‌کشی فصل بازی AF نسبت داد، که باعث شد شریک تحقیقاتی صنعت در طول فصل ۲۰۱۹ در هر استادیوم AF بازی نکرده باشد. این محدودیت را می‌توان با استفاده از داده‌های تیم‌ها و فصل‌های متعدد در کارهای آینده برطرف کرد، که با این حال، به دلیل در دسترس بودن داده‌های محدود داده‌های GPS تیم‌های مختلف AF حرفه‌ای چالش برانگیز است. بنابراین، روش پیشنهادی فرصتی را برای ایجاد مجموعه داده بزرگ‌تری ارائه می‌دهد که می‌تواند در آینده برای آموزش مدل‌های یادگیری ماشینی پیچیده‌تر و کارآمدتر برای تشخیص و ردیابی بازیکن بر اساس انیمیشن‌های AF منحصربه‌فرد استفاده شود.
این تحقیق اولین قدم به سوی ابزاری خودکار برای تعیین موقعیت در زمین بازیکنان هر دو تیم در AF است. این اطلاعات به متخصصان ورزش اجازه می دهد تا رفتار تاکتیکی و تعاملات یک تیم یا فرد را بهتر درک کنند [۵,۶] و از تصمیم گیری در مورد عملکرد و خطر آسیب حمایت می کند [۴].


منبع: https://www.mdpi.com/2673-2688/5/2/38

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *