هوش مصنوعی | متن کامل رایگان | ECARRNet: یک مجموعه کارآمد مبتنی بر LSTM معماری شبکه عصبی عمیق برای تشخیص خطای راه آهن

۱٫ معرفی

از سال ۱۸۶۲، راه آهن به عنوان یک روش حمل و نقل مقرون به صرفه، ایمن و راحت برای همه طبقات مردم، عنصر جدایی ناپذیر آسیای جنوب شرقی بوده است. خطوط راه‌آهن نقش مهمی در حمل توده‌ها به شکل قطارهای مسافربری و قطارهای حمل‌ونقل خوب داشته است. اما تصادفات قطار می‌تواند صدمات زیادی را به یک ملت وارد کند، زیرا عواقب آن در مقایسه با هر حادثه حمل‌ونقل دیگری سناریوی بسیار وحشتناک‌تری را به همراه دارد.

اکثر تصادفات به دلیل خروج از ریل رخ می دهد که به طرز وحشتناکی باعث مرگ و میر بسیاری شده است. مطابق با [۱] ۴۳ درصد از تمام حوادث قطار بعدی و ۶۷ درصد از تلفات در هند به دلیل عبور از سطح راه آهن است. نرخ مرگ و میر از کشورهای مختلف ممکن است اعداد متفاوتی را نشان دهد، اما چیزی که ثابت می ماند درصد بالای آن است. که در [۲]تجزیه و تحلیل مقایسه ای از تصادفات در بنگلادش طی سال های ۲۰۰۸-۲۰۱۴ انجام شد که از بین ۱۸۷۷۱ تصادف، (۱۲٪) در راه آهن رخ داد. تلاش زیادی برای پیشگیری از حوادث و بازیابی انجام شد، اما کار کمتری در زمینه پیشگیری از حوادث ریلی در بنگلادش انجام شده است. [۳]. شناسایی عیوب موجود در خطوط راه آهن و رسیدگی به تعمیرات آنها می تواند از بروز حوادث جلوگیری کند. البته روش تشخیص عیب در راه آهن بنگلادش به صورت دستی انجام می شود. تشخیص دستی و تجزیه و تحلیل خطاها بسیار پیچیده است، که همچنین می تواند باعث عدم دقت شود، اگر افراد برای بازرسی مسافت های عظیم ریل های راه آهن را طی کنند. این به این دلیل است که آنها به راحتی می توانند برخی از نقاط آسیب دیده را که ممکن است باعث تصادف شود را از دست بدهند. علاوه بر این، افرادی که دانش فنی خوبی از خطوط راه‌آهن و اجزای بعدی آن مانند بست‌ها، تراورس‌ها و سوئیچ‌های راه‌آهن دارند، باید ریل‌ها را بازرسی کنند. در اینجا، تکنیک‌های DL می‌توانند مفید باشند، زیرا می‌توانند جایگزین هر تکنیک تشخیص دستی که پرزحمت، زمان‌بر و ناکارآمد است، شود. در نتیجه این امر منجر به واکنش سریعتر و سریعتر به بحران می شود و در نتیجه منجر به کاهش تعداد تصادفات و مرگ و میر می شود.

DL مدتی است که توانایی خود را برای پردازش تصویر به طور موثر ثابت کرده است. یکی از موفقیت های بزرگ آن با انتقال معماری های یادگیری مانند -Alexnet به دست آمد [۴] کفایت خود را برای مقیاس عظیم وظایف پردازش تصویر نشان دادند. پس از آن، شاهد توسعه چند مدل شبکه عصبی قابل توجه (NN) مانند VGG16 بودیم. [۵] و همچنین نتایج استثنایی برای تشخیص تصویر در برنامه های روزمره، از جمله تجزیه و تحلیل تصویر پزشکی [۶,۷,۸] برای تشخیص بیماری های ریوی و بررسی باج گیری، تشخیص چهره [۹,۱۰]تشخیص اشیا با تصاویر هواپیماهای بدون سرنشین [۱۱,۱۲] و خیلی بیشتر.

تشخیص خودکار چنین خطاهایی با استفاده از DL می تواند باعث شود که فرآیند بسیار راحت تر باشد و نتایج دقیق تری تولید کند. برای توضیح بیشتر، مدل‌های مختلفی مانند InceptionV3، InceptionResnetV2، Xception و غیره برای مجموعه داده‌های مختلف اعمال شده‌اند، ما این الگوریتم‌های موجود و مقالات تحقیقاتی مربوط به آن‌ها را همراه با نتایج تولید شده‌شان مشاهده کرده‌ایم و نسخه‌ای از مدل خود را معرفی کرده‌ایم که دقت بهتری ایجاد کرده است. ما سعی کرده‌ایم محدودیت‌های احتمالی را در مقالات آنها بررسی کنیم و تجزیه و تحلیل کنیم که از چه اشتباهاتی می‌توانیم برای تقویت مدل خود اجتناب کنیم. برای کار تحقیقاتی خود، داده های خود را که داده های اولیه است، از شهرهای مختلف بنگلادش مانند – Satkhira و Feni جمع آوری کرده ایم و تصاویر را با الگوریتم سفارشی خود – ECARRNet آموزش داده ایم و همچنین قابلیت توضیح مدل را اضافه کرده ایم. سهم مهم این اثر به شرح زیر است:

مجموعه داده ای که ما جمع آوری کرده ایم شامل ۴۲۸ تصویر از خطوط راه آهن معیوب و غیر معیوب از دو قسمت مختلف مسیر، یعنی از ریل ها و اتصال دهنده ها است. از آنجایی که یافتن تصاویر معیوب دشوار است، ما مجموعه داده های خود را برای افزایش اندازه قبل از آموزش افزایش داده ایم و مشکلات عدم تعادل کلاس نیز با استفاده از تکنیک های نمونه برداری بیش از حد مانند SMOTE برطرف شد.
سه مدل یادگیری انتقال مبتنی بر SOTA CNN (InceptionV3، InceptionResnetV2 و Xception) برای طبقه‌بندی و شناسایی خطاها در خطوط راه‌آهن استفاده شده‌اند، و عملکرد مربوطه آنها با استفاده از چندین معیار مانند منحنی‌های دقت، ماتریس‌های سردرگمی و گزارش‌های طبقه‌بندی ارائه شده‌اند.
یک معماری DL یکپارچه، ECARRNet، برای پیش‌بینی مسیرهای راه‌آهن معیوب (عیب) و غیر معیوب (غیر معیوب) با عملکرد پیش‌بینی بیشتر از SOTA پیشنهاد شده است.
ابزارهای هوش مصنوعی قابل توضیح در قالب Grad-CAM و LIME برای کشف ماهیت جعبه سیاه مدل‌ها و تأیید بیشتر نتایج ما برای اثبات کارایی مدل پیشنهادی ما استفاده می‌شوند.

بخش باقی مانده از مقاله به صورت زیر جمع آوری شده است: بخش ۲ داده های پس زمینه ای را در مورد الگوریتم مورد استفاده توسط محققان قبلی که روی شناسایی عیوب راه آهن کار می کردند و همچنین مجموعه ای از انتشارات تحقیقاتی خوب نوشته شده در مورد موضوع مطالعه ما را ارائه می دهد. جزئیات اکتساب داده، پیش پردازش، تفکیک ساخت مجموعه داده، و معماری مدل های پیشنهادی و مقایسه شده همگی در بخش ۳ توضیح داده شده است. . از هر مدل، در حالی که نتیجه گیری در بخش ۵ مورد بحث قرار گرفته است.

۲٫ آثار مرتبط

ما رویکردهای مختلف ML، DL، و مبتنی بر بینایی کامپیوتری را برای شناسایی خطاهای مسیر راه‌آهن به‌طور مستقل در حین انجام مطالعه پس‌زمینه خود پیدا کرده‌ایم. نویسندگان از [۱۳] مدلی را پیشنهاد کردند که در آن از چندین مدل استفاده کردند و نتایج متفاوتی از آنها گرفتند. آنها مدل‌های DL را در قالب Inception V3، ResNet50 و Faster R-CNN برای شناسایی خطاها در Loose Ballast، SunKink، Track Switch و سیگنال‌ها پیشنهاد کرده‌اند. آنها این مدل ها را بر روی بیش از ۱۰۰ گیگابایت داده ویدیویی اجرا کردند و دقت ۹۶٪ برای Loose Ballast، ۱۰۰٪ دقت SunKink، ۹۵٫۶٪ دقت برای Track Switch، و ۹۹٫۴٪ برای مدل های رنگ سیگنال دریافت کردند. همچنین با استفاده از این داده ها یک شاخص سلامت مسیر تهیه کردند. لین، ی و همکاران [۱۴] یک روش مبتنی بر GPS را پیشنهاد کرده‌اند که مکان خطا را تعیین می‌کند و از دوربین GO pro برای عکس‌برداری استفاده می‌کند. YOLO v3 به عنوان یک مدل به روز شده از YOLO در معماری پیشنهادی آنها استفاده شده است که دارای یک شبکه پایه با darknet-53 است. علاوه بر این، آنها از شبکه پیش‌بینی ویژگی (FPN) برای ارتقاء توانایی پیش‌بینی اشیاء کوچک استفاده کرده‌اند. آنها تصاویر بست ها را گرفته اند و بر تشخیص بست ها تاکید کرده اند. بنابراین، آنها دقت را ۸۹٪ و فراخوانی را ۹۵٪ نشان داده اند.

در کاغذ [۱۵]نویسندگان یک تکنیک DL چند فازی را برای انجام بخش‌بندی تصاویر پیشنهاد کرده‌اند. ابتدا، آنها نقص سطح مسیر را با استفاده از سیستم های بازرسی مسیر بصری (VTIS) شناسایی کردند و مناطق مورد علاقه (ROI) را تعیین کردند. بخش‌بندی معمولاً با برش تصویر بخش‌بندی شده روی ROI کار می‌کند. آنها خواستار افزایش دقت خود از ۷۱% به ۹۰% همانطور که در جدول ۱ نشان داده شده است. در این مطالعه [۱۶]، شبکه تقسیم‌بندی گراف U-net و رویکرد نشانه‌های برجسته محل آسیب برای شناسایی آسیب ریل پرسرعت مورد استفاده قرار گرفت. میزان دقت تشخیص آنها ۹۹٫۷۶٪ است.

محققان در مقاله [۱۷]، کشف کرده اند که ترکیب پردازش تصویر و تغذیه آن داده ها در یک شبکه عصبی (NN) موثرتر و کارآمدتر از رویکردهای جایگزین است. آنها از روش پس انتشار استفاده کرده اند و در مورد یک لایه پنهان صحبت کرده اند که با استفاده از مجموعه داده ایجاد شده و خروجی مطلق آموزش داده می شود که ۱ نشان دهنده ترک های مسیر راه آهن و ۰ نشان دهنده بدون ترک است. از طرفی کاغذ [۱۸] پردازش تصویر مرسوم را برای تشخیص عیوب در اتصال دهنده‌ها و حذف نویز از تصویر پیشنهاد کرده است که شامل تکنیک‌هایی مانند فیلتر میانی، تبدیل تصویر باینری، حذف نویز گاوسی و غیره به همراه یک الگوریتم نمایش است. استفاده از ویژگی های متراکم-SIFT به عنوان یک استراتژی برای تشخیص و شناسایی عیب پیشنهاد شد. در نهایت، VGG16 برای تشخیص و تشخیص عیوب بست ها آموزش دید. علاوه بر این، RCNN سریعتر نیز برای افزایش نرخ تشخیص و کارایی استفاده شد. آنها با استفاده از شبکه Faster VGG16 دقت ۹۷٫۱۴% را نشان داده اند.

Min، Y. و همکاران. [۱۹] از اسکار و تروق در زمان واقعی با استفاده از تکنیک‌های بینایی ماشین برای تشخیص عیوب استفاده کرد. این مقاله یک مدل تشخیص آسیب را پیشنهاد می‌کند که در آن تصویر در ابتدا با استفاده از یک دوربین آرایه صفحه همراه با نور LED برای افزایش روشنایی تصویر جمع‌آوری می‌شود. سپس ناحیه مورد نظر برای استخراج مقدار از H در رنگ، اشباع و سبکی (HSL) محلی سازی می شود. پس از آن، نویسندگان از چندین تکنیک بهبود تصویر برای دریافت ویژگی‌های بیشتر از تصویر مانند حذف نویز تصویر، مقدار آستانه و پردازش مورفولوژیکی استفاده کردند. آنها همچنین اطلاعات کانتور محل معیوب را با استفاده از روش های ردیابی کد زنجیره جهت استخراج کردند. M. Karakose و همکارانش در [۲۰] تکنیکی را برای تشخیص خطاهای راه آهن با استفاده از دو واحد مجزا ابداع کرده اند. آنها IAS را برای انجام سه وظیفه ایجاد کردند: گسترش ریل قطار، افزایش کنتراست و خودکار کردن روش تشخیص نقص. آنها ابتدا تصویر را به مقیاس خاکستری تبدیل کردند، سپس از سه تکنیک جداگانه تشخیص لبه Canny استفاده کردند.

در این کار [۲۱]، نویسندگان یک رویکرد بازرسی ریل راه آهن مبتنی بر تجزیه و تحلیل ویدئویی خودکار ارائه کرده اند. آنها پیگیری کردند که هر پنجره چند پیکسل لبه دارد. چگالی لبه ها در هر پنجره با این کار تعیین می شود. مقدار پیک با نمودار چگالی لبه در هر پنجره در مقابل شماره پنجره محاسبه شد. مکان کلیپ با این قله نشان داده شده است. هنگامی که مقدار پیک کمتر از یک آستانه خاص باشد، پنجره به جای یک گیره حاوی نویز در نظر گرفته می شود. اگر دو مقدار پیک هر دو بزرگتر از یک آستانه تعریف شده باشند، فریم به عنوان حاوی دو کلیپ برچسب گذاری می شود. در نتیجه، آنها به دقت متوسط ۹۵٫۳٪ دست می یابند. در تحقیق [۲۲]آنها یک سیستم کاملاً مبتنی بر CNN را پیشنهاد کرده‌اند که بر روی ده کلاس مختلف از مواد آموزش داده شده و سپس با استفاده از ده کانال مختلف نقشه‌برداری شده است. هدف آنها شناسایی همزمان محتمل‌ترین موقعیت بست در هر ROI از پیش تعیین شده و سپس دسته‌بندی آن تشخیص‌ها در یکی از سه شرط اساسی بود: پس‌زمینه (یا بست وجود ندارد)، بست شکسته یا بست خوب. آنها آشکارساز بست ما را بر روی ۸۵ کیلومتر عکس های پیوسته در بستر ردیابی آزمایش کردند تا ببینند چقدر دقیق است. آنها با استفاده از روش Deep CNN MLT 3 توانستند به دقت ۹۵٫۰۲ درصد دست یابند.

علواد، اچ و همکاران. [۲۳] ارائه یک تکنیک نظارتی که از دید کامپیوتری برای شناسایی خودکار و سریع خطرات در ایستگاه ها با شناسایی اقدامات مخاطره آمیز، ارائه پشتیبانی در زمان واقعی از تصمیم گیرندگان و به حداقل رساندن اثرات احتمالی رویدادهای نامطلوب استفاده می کند. سپس در هر لایه یک مدل ترتیبی می‌سازند که ساده‌ترین شکل یک لایه در کتابخانه Keras است. آنها با مدل CNN-0 خود توانستند به دقت ۸۱٫۹۰ درصد دست یابند. کامیلاریس، A. و همکاران. [۲۴] استراتژی‌ها را برای داده‌های یکسان در همان مقاله تحقیقاتی با استفاده از اندازه‌گیری مشابه مقایسه کردند. از معماری های برجسته CNN از جمله AlexNet، VGG و Inception-ResNet استفاده شد. آنها همچنین طرح های خود را آزمایش کردند که برخی از آنها CNN را با رویکردهای دیگر ترکیب کردند.

یانگ، سی و همکاران. [۲۵] رویکردهای بازرسی راه‌آهن مبتنی بر ML را پیشنهاد کرده‌اند که شامل یک تکنیک مبتنی بر ویژگی و یک تکنیک مبتنی بر شبکه عصبی عمیق مبتنی بر داده‌های شتاب است. در نتیجه ResNet و FCN در این کار مورد بررسی قرار می گیرند. سه بلوک کانولوشن برای ساختن FCN استفاده می‌شود که پس از آن یک لایه soft-max و یک لایه ادغام میانگین جهانی جایگزین می‌شود. ResNet با ایجاد یک پیوند میانبر بین لایه های کانولوشنال متوالی، شبکه های عصبی را به یک ساختار بسیار عمیق گسترش می دهد. نتایج آزمایش‌ها نشان داد که ResNet و شبکه‌های کاملاً کانولوشنال (FCN) هر دو در تشخیص مشترک عملکرد خوبی داشتند. یائو، اچ و همکاران. [۲۶] مدلی را پیشنهاد کرده‌اند که در آن RNN توانایی مشابهی با شبکه عصبی کانولوشن برای استخراج ویژگی‌ها از تصاویر دارد. CNN و RNN از اهمیت یکسانی برخوردارند. برای تعادل بهتر بین دو نوع ویژگی بازیابی شده توسط CNN و RNN در طول مرحله آموزش، مدل از مکانیسم توجه پرسپترون برای وزن کردن ویژگی‌های دریافتی توسط CNN و RNN استفاده می‌کند. آنها از LSTM قابل پشته به عنوان ماژول RNN برای استخراج خصوصیات توالی زمانی از پیکسل ها استفاده کردند. از تکنیک CNN (Inception-ResNet V2) نیز استفاده شد و بیشترین دقت ۸۳ درصد بود.

به گفته Alzubaidi، L. و همکاران، معیارهای ارزیابی مورد استفاده در وظایف DL نقش مهمی در تولید بهترین طبقه‌بندی کننده دارند. [۲۷]، آنها در دو مرحله از یک روش طبقه بندی داده های معمولی استفاده می شوند: آموزش و آزمایش. آنها در مورد FPGA بحث کردند، که می تواند برای ایجاد موتورهای پوشش CNN با بازده بیش از ۸۰ درصد، دقت هشت بیت و حداکثر عملکرد بیش از ۱۵ TOP استفاده شود. دقت Voxnet 79٪ بود، در حالی که ResNet 80٪ بود. در چارچوب سیاست مشترک کشاورزی اروپا، CamposTaberner، M. et al. [28] می‌خواهید درباره یک RNN برای طبقه‌بندی کاربری زمین بر اساس سری‌های زمانی Sentinel-2 (CAP) اطلاعات بیشتری کسب کنید. نتایج بررسی نشان می دهد که باندهای قرمز و نزدیک مادون قرمز Sentinel-2 مفیدترین داده ها را ارائه می دهند. صفات به دست آمده از اکتساب های تابستانی از نظر اطلاعات زمانی مهم ترین بودند. دقت عملکرد شبکه ۲-BiLSTM در هر کلاس بیش از ۹۱٫۴٪ است.

Shafique, R. et al. [29] ارائه یک سیستم تشخیص نقص خط راه آهن مستقل مبتنی بر تجزیه و تحلیل صوتی. داده‌های جمع‌آوری‌شده در خطوط راه‌آهن پاکستان با استفاده از سیگنال‌های صوتی و استفاده از سیستم‌های طبقه‌بندی مختلف برای داده‌های جمع‌آوری‌شده دو سهم عمده از این کار است. آنها بهترین نتایج را با RF و DT به دست می آورند که دارای دقت ۹۷٪ هستند. یک شبکه تشخیص عیب مبتنی بر DL برای RVSFD توسط Ye, Y. و همکاران ساخته شد. [۳۰]. سه فاز برای شبکه تشخیصی وجود دارد: استراتژی GWN برای سیگنال شتاب در فاز اول (پیش پردازش داده ها) استفاده می شود تا شبکه تشخیصی را در برابر تأثیرات نسبتاً با فرکانس بالا ناشی از نقص مسیر مقاوم کند. یک استراتژی EST در مرحله دوم (ایجاد مجموعه داده های آموزشی) برای افزایش استحکام شبکه تشخیصی در برابر سایش چرخ ارائه شده است. در نهایت، یک شبکه تشخیص عیب مبتنی بر GONEST-1D CNN از سیستم‌های تعلیق قطارهای پرسرعت در فاز سوم (آموزش و شناسایی) ایجاد می‌شود. با استفاده از ماتریس سردرگمی داده شده برای نمونه های آزمایشی (۱۰۰%)، می توان تمام حالت ها را به طور کامل تشخیص داد.

میز ۱٫
مروری بر منابع بررسی شده

مرجع.	وظیفه	مجموعه داده ها	طبقه بندی کننده ها	دقت
[۱۳]	مدل‌های پیشنهادی برای تشخیص عیوب در Loose Ballast، SunKink، Track Switch و Signals.	مجموعه داده ها از ۱۰۰ گیگابایت داده ویدیویی ساخته شده اند	Inception V3، ResNet50، و سریعتر R-CNN	۱۰۰%
[۱۴]	GPS مکان خطا را تعیین می کند و از دوربین GO pro برای عکس گرفتن استفاده می کند.	مجموعه داده ها از تصاویر استخراج شده از داده های ویدئویی ساخته می شوند	یولو نسخه ۳	۹۵%
[۱۵]	یک تکنیک DL چند فازی برای انجام بخش‌بندی تصاویر پیشنهاد شده است.	مجموعه داده ها از مسیرهای ریلی واقعی که توسط COTS VTIS جمع آوری می شوند، ساخته می شوند.	سیستم های بازرسی مسیر مبتنی بر بصری (VTIS)، TrackNet	۹۰%
[۱۶]	برای تشخیص آسیب ریل راه‌آهن پرسرعت، ترکیبی از شبکه تقسیم‌بندی گراف U-net و رویکرد نشانه‌های برجسته محلی‌سازی آسیب ارائه شد.	مجموعه داده های RSDD نوع I	SCueU-Net	۹۹٫۷۶٪
[۱۸]	آنها روش‌های تشخیص و شناسایی نقص را با استفاده از ویژگی‌های Dense-SIFT پیشنهاد کردند.	مجموعه داده از تصاویری تشکیل شده است که از خط ۶ متروی پکن گرفته شده است.	RCNN، VGG16	۹۷٫۱۴٪
[۱۹]	یک مدل تشخیص آسیب را پیشنهاد می‌کند که در آن تصویر ابتدا با استفاده از یک دوربین آرایه صفحه به همراه نور LED برای افزایش روشنایی تصویر جمع‌آوری می‌شود.	مجموعه داده ها از تصاویر دوربین آرایه هواپیما ساخته می شوند	ردیابی کد زنجیره جهت	….
[۲۰]	یک پایش وضعیت ریل بصری مبتنی بر رایانه پیشنهاد شده است.	داده ها از دوربینی که در بالای قطار قرار داده شده است	پردازش تصویر	….
[۲۱]	یک رویکرد بازرسی ریلی مبتنی بر تجزیه و تحلیل ویدئویی خودکار.	داده ها از یک دوربین فیلمبرداری که در جلوی قطار قرار داده شده است	پردازش تصویر	۹۵٫۳٪
[۲۲]	بازرسی خودکار مسیر با استفاده از بینایی کامپیوتری و روش‌های تشخیص الگو.	داده ها از دوربینی که در مقابل قطار در حال حرکت قرار داده شده است	سی ان ان عمیق	۹۵٫۰۲٪
[۲۳]	با استفاده از بینایی کامپیوتری و تشخیص الگو، مدیریت ریسک را در سیستم های راه آهن انجام دهید.	تصاویر به صورت دستی از مسیرهای ریلی مختلف جمع آوری شده است	Keras، ReLU، CNN	۸۱٫۹۰٪
[۲۴]	سؤالات تحقیق مربوط به کشاورزی، مدل های مورد استفاده، منابع داده های مورد استفاده و دقت کلی به دست آمده بر اساس شاخص های عملکرد نویسندگان را بررسی می کند.	PlantVillage، LifeCLEF، MalayaKew و UC Merced	AlexNet، VGG، و Inception-ResNet	….
[۲۵]	رویکردهای بازرسی راه آهن مبتنی بر یادگیری ماشین پیشنهادی، از جمله یک روش مبتنی بر ویژگی و یک روش مبتنی بر شبکه عصبی عمیق مبتنی بر داده‌های شتاب.	مجموعه داده شتاب از حسگرهای نصب شده روی واگن بازرسی راه آهن به دست آمد.	ResNet، FCN	۱۰۰%
[۲۷]	بررسی جامع تری از مهم ترین جنبه های DL و از جمله پیشرفت هایی که اخیراً به این زمینه اضافه شده است، ارائه دهید.	ImageNet، CIFAR-10، CIFAR-100، MNIST	Xillinx، Voxnet، ResNet	۸۰%
[۲۸]	نشان می دهد که استفاده از رویکردهای DL برای تجزیه و تحلیل داده های سنجش از دور (RS) به سرعت در حال افزایش است.	مجموعه داده ها از داده های سنجش از دور (RS) و داده های ماهواره ای ساخته شده اند	Sentinel-2، ۲-BiLSTM، CamposTaberner	۹۱٫۴٪
[۲۹]	ارائه یک سیستم تشخیص نقص خط راه آهن مستقل مبتنی بر تجزیه و تحلیل صوتی.	مجموعه داده ها از داده های جمع آوری شده در خطوط راه آهن پاکستان با استفاده از سیگنال های صوتی ساخته می شوند	ماشین های برداری، LR، RF و DT	۹۷%
[۳۰]	یک شبکه تشخیص عیب مبتنی بر DL برای RVSFD ساخته شد.	مجموعه داده ها از داده های جمع آوری شده از حسگرهای شتاب سنج ساخته می شوند.	HONEST-1D CNN	۱۰۰%

۴٫ پارامترهای ارزیابی عملکرد

ما از دقت به عنوان معیارهای عملکرد خود استفاده می کنیم، و همچنین در حال آزمایش عملکرد مدل خود با استفاده از معیارهایی مانند گزارش های طبقه بندی و ماتریس های سردرگمی هستیم. گزارش طبقه‌بندی ما دارای چهار معیار برای اندازه‌گیری اثربخشی هر یک از مدل‌ها است. این معیارها شامل پشتیبانی، دقت، امتیاز F1 و فراخوان است. پشتیبانی را می توان با جمع کردن آخرین ردیف ها در ماتریس سردرگمی محاسبه کرد. پشتیبانی تعداد رخدادهای هر کلاس خاص در پاسخ های واقعی است که به این معنی است که تعداد رخدادهای واقعی کلاس را در مجموعه داده نشان می دهد.

$پ r ه ج من س من O n = \frac{تی پ}{تی پ + اف پ}$

(۱)

$آر ه ج آ ل ل = \frac{تی پ}{تی پ + اف ن}$

(۲)

$اف ۱ = \frac{۲ ایکس پ r ه ج من س من O n ایکس آر ه ج آ ل ل}{پ r ه ج من س من O n + آر ه ج آ ل ل} = \frac{۲ ایکس تی پ}{۲ ایکس تی پ + اف پ + اف ن}$

(۳)

در مجموعه معادلات فوق،

TP = مثبت واقعی
FP = مثبت کاذب
FN = منفی کاذب
TN = منفی واقعی

مدل‌های هوش مصنوعی معمولاً مدل‌های جعبه سیاه در نظر گرفته می‌شوند و فاقد شفافیت هستند. مدل های شفاف می توانند توضیح دهند که چرا پیش بینی می کنند و چه چیزی را پیش بینی می کنند. بنابراین اعتماد به مدل ایجاد می کند و مطمئن می شود که آنها فقط شی مورد نظر را به گونه ای پیش بینی می کنند که برای محققان قابل توضیح باشد. هدف از شفافیت یافتن مواردی است که در آن مدل به طور اساسی شکست خورده است. چندین رویکرد و چارچوب برای پیاده‌سازی هوش مصنوعی قابل توضیح وجود دارد که می‌تواند نمایش‌های بصری را برای درک بهتر آنچه که یک مدل بر روی نمونه‌های جدید داده‌ها پیش‌بینی می‌کند و نحوه انجام آن‌ها ارائه دهد. در مورد تصاویر، وصله هایی برای نشان دادن مکانی که مدل روی آن فوکوس می کند، تولید می شود. یکی از محبوب‌ترین رویکردها برای ارائه LIME (توضیحات مدل تفسیری محلی-آگنوستیک)، یک روش توضیحی انقلابی برای توضیح صادقانه و جامع پیش‌بینی‌های هر طبقه‌بندی‌کننده است. ما از LIME در مقاله خود برای توضیح عملکرد مدل پیشنهادی خود استفاده می کنیم زیرا نتوانستیم راه حل دیگری برای توضیح مدل سفارشی خود پیدا کنیم. علاوه بر این، ما از Grad-CAM استفاده می‌کنیم که نقشه‌های حرارتی را در محل تصویر که در آن مدل فوکوس می‌کند تولید می‌کند. [۳۸]. ما از Grad-CAM برای به دست آوردن قابلیت توضیح مدل ها استفاده می کنیم، که برای مقایسه با معماری پیشنهادی ما استفاده می شود. LIME الگوریتمی است که می‌تواند پیش‌بینی‌های هر طبقه‌بندی‌کننده و پس‌رونده را با بومی‌سازی آن با یک مدل قابل درک به درستی توضیح دهد. [۳۹].

نتایج تولید شده توسط Grad-CAM و LIME در بخش نتایج تجربی نشان داده شده است.

$L^{ج_{جی r آ د ج آ متر}} = آر ه L U (\sum_{ک} آ_{ک}^{ج} آ^{ک})$

(۴)

معادله (۴) معادله Grad-CAM را نشان می‌دهد که یک ترکیب خطی وزن‌دار از نقشه‌های ویژگی است که تابع ReLU را دنبال می‌کند. جایی که

منبع: https://www.mdpi.com/2673-2688/5/2/24

۱٫ معرفی

۲٫ آثار مرتبط

۴٫ پارامترهای ارزیابی عملکرد

دیدگاهتان را بنویسید لغو پاسخ