۱٫ معرفی
از سال ۱۸۶۲، راه آهن به عنوان یک روش حمل و نقل مقرون به صرفه، ایمن و راحت برای همه طبقات مردم، عنصر جدایی ناپذیر آسیای جنوب شرقی بوده است. خطوط راهآهن نقش مهمی در حمل تودهها به شکل قطارهای مسافربری و قطارهای حملونقل خوب داشته است. اما تصادفات قطار میتواند صدمات زیادی را به یک ملت وارد کند، زیرا عواقب آن در مقایسه با هر حادثه حملونقل دیگری سناریوی بسیار وحشتناکتری را به همراه دارد.
اکثر تصادفات به دلیل خروج از ریل رخ می دهد که به طرز وحشتناکی باعث مرگ و میر بسیاری شده است. مطابق با [۱] ۴۳ درصد از تمام حوادث قطار بعدی و ۶۷ درصد از تلفات در هند به دلیل عبور از سطح راه آهن است. نرخ مرگ و میر از کشورهای مختلف ممکن است اعداد متفاوتی را نشان دهد، اما چیزی که ثابت می ماند درصد بالای آن است. که در [۲]تجزیه و تحلیل مقایسه ای از تصادفات در بنگلادش طی سال های ۲۰۰۸-۲۰۱۴ انجام شد که از بین ۱۸۷۷۱ تصادف، (۱۲٪) در راه آهن رخ داد. تلاش زیادی برای پیشگیری از حوادث و بازیابی انجام شد، اما کار کمتری در زمینه پیشگیری از حوادث ریلی در بنگلادش انجام شده است. [۳]. شناسایی عیوب موجود در خطوط راه آهن و رسیدگی به تعمیرات آنها می تواند از بروز حوادث جلوگیری کند. البته روش تشخیص عیب در راه آهن بنگلادش به صورت دستی انجام می شود. تشخیص دستی و تجزیه و تحلیل خطاها بسیار پیچیده است، که همچنین می تواند باعث عدم دقت شود، اگر افراد برای بازرسی مسافت های عظیم ریل های راه آهن را طی کنند. این به این دلیل است که آنها به راحتی می توانند برخی از نقاط آسیب دیده را که ممکن است باعث تصادف شود را از دست بدهند. علاوه بر این، افرادی که دانش فنی خوبی از خطوط راهآهن و اجزای بعدی آن مانند بستها، تراورسها و سوئیچهای راهآهن دارند، باید ریلها را بازرسی کنند. در اینجا، تکنیکهای DL میتوانند مفید باشند، زیرا میتوانند جایگزین هر تکنیک تشخیص دستی که پرزحمت، زمانبر و ناکارآمد است، شود. در نتیجه این امر منجر به واکنش سریعتر و سریعتر به بحران می شود و در نتیجه منجر به کاهش تعداد تصادفات و مرگ و میر می شود.
DL مدتی است که توانایی خود را برای پردازش تصویر به طور موثر ثابت کرده است. یکی از موفقیت های بزرگ آن با انتقال معماری های یادگیری مانند -Alexnet به دست آمد [۴] کفایت خود را برای مقیاس عظیم وظایف پردازش تصویر نشان دادند. پس از آن، شاهد توسعه چند مدل شبکه عصبی قابل توجه (NN) مانند VGG16 بودیم. [۵] و همچنین نتایج استثنایی برای تشخیص تصویر در برنامه های روزمره، از جمله تجزیه و تحلیل تصویر پزشکی [۶,۷,۸] برای تشخیص بیماری های ریوی و بررسی باج گیری، تشخیص چهره [۹,۱۰]تشخیص اشیا با تصاویر هواپیماهای بدون سرنشین [۱۱,۱۲] و خیلی بیشتر.
تشخیص خودکار چنین خطاهایی با استفاده از DL می تواند باعث شود که فرآیند بسیار راحت تر باشد و نتایج دقیق تری تولید کند. برای توضیح بیشتر، مدلهای مختلفی مانند InceptionV3، InceptionResnetV2، Xception و غیره برای مجموعه دادههای مختلف اعمال شدهاند، ما این الگوریتمهای موجود و مقالات تحقیقاتی مربوط به آنها را همراه با نتایج تولید شدهشان مشاهده کردهایم و نسخهای از مدل خود را معرفی کردهایم که دقت بهتری ایجاد کرده است. ما سعی کردهایم محدودیتهای احتمالی را در مقالات آنها بررسی کنیم و تجزیه و تحلیل کنیم که از چه اشتباهاتی میتوانیم برای تقویت مدل خود اجتناب کنیم. برای کار تحقیقاتی خود، داده های خود را که داده های اولیه است، از شهرهای مختلف بنگلادش مانند – Satkhira و Feni جمع آوری کرده ایم و تصاویر را با الگوریتم سفارشی خود – ECARRNet آموزش داده ایم و همچنین قابلیت توضیح مدل را اضافه کرده ایم. سهم مهم این اثر به شرح زیر است:
-
مجموعه داده ای که ما جمع آوری کرده ایم شامل ۴۲۸ تصویر از خطوط راه آهن معیوب و غیر معیوب از دو قسمت مختلف مسیر، یعنی از ریل ها و اتصال دهنده ها است. از آنجایی که یافتن تصاویر معیوب دشوار است، ما مجموعه داده های خود را برای افزایش اندازه قبل از آموزش افزایش داده ایم و مشکلات عدم تعادل کلاس نیز با استفاده از تکنیک های نمونه برداری بیش از حد مانند SMOTE برطرف شد.
-
سه مدل یادگیری انتقال مبتنی بر SOTA CNN (InceptionV3، InceptionResnetV2 و Xception) برای طبقهبندی و شناسایی خطاها در خطوط راهآهن استفاده شدهاند، و عملکرد مربوطه آنها با استفاده از چندین معیار مانند منحنیهای دقت، ماتریسهای سردرگمی و گزارشهای طبقهبندی ارائه شدهاند.
-
یک معماری DL یکپارچه، ECARRNet، برای پیشبینی مسیرهای راهآهن معیوب (عیب) و غیر معیوب (غیر معیوب) با عملکرد پیشبینی بیشتر از SOTA پیشنهاد شده است.
-
ابزارهای هوش مصنوعی قابل توضیح در قالب Grad-CAM و LIME برای کشف ماهیت جعبه سیاه مدلها و تأیید بیشتر نتایج ما برای اثبات کارایی مدل پیشنهادی ما استفاده میشوند.
بخش باقی مانده از مقاله به صورت زیر جمع آوری شده است: بخش ۲ داده های پس زمینه ای را در مورد الگوریتم مورد استفاده توسط محققان قبلی که روی شناسایی عیوب راه آهن کار می کردند و همچنین مجموعه ای از انتشارات تحقیقاتی خوب نوشته شده در مورد موضوع مطالعه ما را ارائه می دهد. جزئیات اکتساب داده، پیش پردازش، تفکیک ساخت مجموعه داده، و معماری مدل های پیشنهادی و مقایسه شده همگی در بخش ۳ توضیح داده شده است. . از هر مدل، در حالی که نتیجه گیری در بخش ۵ مورد بحث قرار گرفته است.
۲٫ آثار مرتبط
ما رویکردهای مختلف ML، DL، و مبتنی بر بینایی کامپیوتری را برای شناسایی خطاهای مسیر راهآهن بهطور مستقل در حین انجام مطالعه پسزمینه خود پیدا کردهایم. نویسندگان از [۱۳] مدلی را پیشنهاد کردند که در آن از چندین مدل استفاده کردند و نتایج متفاوتی از آنها گرفتند. آنها مدلهای DL را در قالب Inception V3، ResNet50 و Faster R-CNN برای شناسایی خطاها در Loose Ballast، SunKink، Track Switch و سیگنالها پیشنهاد کردهاند. آنها این مدل ها را بر روی بیش از ۱۰۰ گیگابایت داده ویدیویی اجرا کردند و دقت ۹۶٪ برای Loose Ballast، ۱۰۰٪ دقت SunKink، ۹۵٫۶٪ دقت برای Track Switch، و ۹۹٫۴٪ برای مدل های رنگ سیگنال دریافت کردند. همچنین با استفاده از این داده ها یک شاخص سلامت مسیر تهیه کردند. لین، ی و همکاران [۱۴] یک روش مبتنی بر GPS را پیشنهاد کردهاند که مکان خطا را تعیین میکند و از دوربین GO pro برای عکسبرداری استفاده میکند. YOLO v3 به عنوان یک مدل به روز شده از YOLO در معماری پیشنهادی آنها استفاده شده است که دارای یک شبکه پایه با darknet-53 است. علاوه بر این، آنها از شبکه پیشبینی ویژگی (FPN) برای ارتقاء توانایی پیشبینی اشیاء کوچک استفاده کردهاند. آنها تصاویر بست ها را گرفته اند و بر تشخیص بست ها تاکید کرده اند. بنابراین، آنها دقت را ۸۹٪ و فراخوانی را ۹۵٪ نشان داده اند.
در کاغذ [۱۵]نویسندگان یک تکنیک DL چند فازی را برای انجام بخشبندی تصاویر پیشنهاد کردهاند. ابتدا، آنها نقص سطح مسیر را با استفاده از سیستم های بازرسی مسیر بصری (VTIS) شناسایی کردند و مناطق مورد علاقه (ROI) را تعیین کردند. بخشبندی معمولاً با برش تصویر بخشبندی شده روی ROI کار میکند. آنها خواستار افزایش دقت خود از ۷۱% به ۹۰% همانطور که در جدول ۱ نشان داده شده است. در این مطالعه [۱۶]، شبکه تقسیمبندی گراف U-net و رویکرد نشانههای برجسته محل آسیب برای شناسایی آسیب ریل پرسرعت مورد استفاده قرار گرفت. میزان دقت تشخیص آنها ۹۹٫۷۶٪ است.
محققان در مقاله [۱۷]، کشف کرده اند که ترکیب پردازش تصویر و تغذیه آن داده ها در یک شبکه عصبی (NN) موثرتر و کارآمدتر از رویکردهای جایگزین است. آنها از روش پس انتشار استفاده کرده اند و در مورد یک لایه پنهان صحبت کرده اند که با استفاده از مجموعه داده ایجاد شده و خروجی مطلق آموزش داده می شود که ۱ نشان دهنده ترک های مسیر راه آهن و ۰ نشان دهنده بدون ترک است. از طرفی کاغذ [۱۸] پردازش تصویر مرسوم را برای تشخیص عیوب در اتصال دهندهها و حذف نویز از تصویر پیشنهاد کرده است که شامل تکنیکهایی مانند فیلتر میانی، تبدیل تصویر باینری، حذف نویز گاوسی و غیره به همراه یک الگوریتم نمایش است. استفاده از ویژگی های متراکم-SIFT به عنوان یک استراتژی برای تشخیص و شناسایی عیب پیشنهاد شد. در نهایت، VGG16 برای تشخیص و تشخیص عیوب بست ها آموزش دید. علاوه بر این، RCNN سریعتر نیز برای افزایش نرخ تشخیص و کارایی استفاده شد. آنها با استفاده از شبکه Faster VGG16 دقت ۹۷٫۱۴% را نشان داده اند.
Min، Y. و همکاران. [۱۹] از اسکار و تروق در زمان واقعی با استفاده از تکنیکهای بینایی ماشین برای تشخیص عیوب استفاده کرد. این مقاله یک مدل تشخیص آسیب را پیشنهاد میکند که در آن تصویر در ابتدا با استفاده از یک دوربین آرایه صفحه همراه با نور LED برای افزایش روشنایی تصویر جمعآوری میشود. سپس ناحیه مورد نظر برای استخراج مقدار از H در رنگ، اشباع و سبکی (HSL) محلی سازی می شود. پس از آن، نویسندگان از چندین تکنیک بهبود تصویر برای دریافت ویژگیهای بیشتر از تصویر مانند حذف نویز تصویر، مقدار آستانه و پردازش مورفولوژیکی استفاده کردند. آنها همچنین اطلاعات کانتور محل معیوب را با استفاده از روش های ردیابی کد زنجیره جهت استخراج کردند. M. Karakose و همکارانش در [۲۰] تکنیکی را برای تشخیص خطاهای راه آهن با استفاده از دو واحد مجزا ابداع کرده اند. آنها IAS را برای انجام سه وظیفه ایجاد کردند: گسترش ریل قطار، افزایش کنتراست و خودکار کردن روش تشخیص نقص. آنها ابتدا تصویر را به مقیاس خاکستری تبدیل کردند، سپس از سه تکنیک جداگانه تشخیص لبه Canny استفاده کردند.
در این کار [۲۱]، نویسندگان یک رویکرد بازرسی ریل راه آهن مبتنی بر تجزیه و تحلیل ویدئویی خودکار ارائه کرده اند. آنها پیگیری کردند که هر پنجره چند پیکسل لبه دارد. چگالی لبه ها در هر پنجره با این کار تعیین می شود. مقدار پیک با نمودار چگالی لبه در هر پنجره در مقابل شماره پنجره محاسبه شد. مکان کلیپ با این قله نشان داده شده است. هنگامی که مقدار پیک کمتر از یک آستانه خاص باشد، پنجره به جای یک گیره حاوی نویز در نظر گرفته می شود. اگر دو مقدار پیک هر دو بزرگتر از یک آستانه تعریف شده باشند، فریم به عنوان حاوی دو کلیپ برچسب گذاری می شود. در نتیجه، آنها به دقت متوسط ۹۵٫۳٪ دست می یابند. در تحقیق [۲۲]آنها یک سیستم کاملاً مبتنی بر CNN را پیشنهاد کردهاند که بر روی ده کلاس مختلف از مواد آموزش داده شده و سپس با استفاده از ده کانال مختلف نقشهبرداری شده است. هدف آنها شناسایی همزمان محتملترین موقعیت بست در هر ROI از پیش تعیین شده و سپس دستهبندی آن تشخیصها در یکی از سه شرط اساسی بود: پسزمینه (یا بست وجود ندارد)، بست شکسته یا بست خوب. آنها آشکارساز بست ما را بر روی ۸۵ کیلومتر عکس های پیوسته در بستر ردیابی آزمایش کردند تا ببینند چقدر دقیق است. آنها با استفاده از روش Deep CNN MLT 3 توانستند به دقت ۹۵٫۰۲ درصد دست یابند.
علواد، اچ و همکاران. [۲۳] ارائه یک تکنیک نظارتی که از دید کامپیوتری برای شناسایی خودکار و سریع خطرات در ایستگاه ها با شناسایی اقدامات مخاطره آمیز، ارائه پشتیبانی در زمان واقعی از تصمیم گیرندگان و به حداقل رساندن اثرات احتمالی رویدادهای نامطلوب استفاده می کند. سپس در هر لایه یک مدل ترتیبی میسازند که سادهترین شکل یک لایه در کتابخانه Keras است. آنها با مدل CNN-0 خود توانستند به دقت ۸۱٫۹۰ درصد دست یابند. کامیلاریس، A. و همکاران. [۲۴] استراتژیها را برای دادههای یکسان در همان مقاله تحقیقاتی با استفاده از اندازهگیری مشابه مقایسه کردند. از معماری های برجسته CNN از جمله AlexNet، VGG و Inception-ResNet استفاده شد. آنها همچنین طرح های خود را آزمایش کردند که برخی از آنها CNN را با رویکردهای دیگر ترکیب کردند.
یانگ، سی و همکاران. [۲۵] رویکردهای بازرسی راهآهن مبتنی بر ML را پیشنهاد کردهاند که شامل یک تکنیک مبتنی بر ویژگی و یک تکنیک مبتنی بر شبکه عصبی عمیق مبتنی بر دادههای شتاب است. در نتیجه ResNet و FCN در این کار مورد بررسی قرار می گیرند. سه بلوک کانولوشن برای ساختن FCN استفاده میشود که پس از آن یک لایه soft-max و یک لایه ادغام میانگین جهانی جایگزین میشود. ResNet با ایجاد یک پیوند میانبر بین لایه های کانولوشنال متوالی، شبکه های عصبی را به یک ساختار بسیار عمیق گسترش می دهد. نتایج آزمایشها نشان داد که ResNet و شبکههای کاملاً کانولوشنال (FCN) هر دو در تشخیص مشترک عملکرد خوبی داشتند. یائو، اچ و همکاران. [۲۶] مدلی را پیشنهاد کردهاند که در آن RNN توانایی مشابهی با شبکه عصبی کانولوشن برای استخراج ویژگیها از تصاویر دارد. CNN و RNN از اهمیت یکسانی برخوردارند. برای تعادل بهتر بین دو نوع ویژگی بازیابی شده توسط CNN و RNN در طول مرحله آموزش، مدل از مکانیسم توجه پرسپترون برای وزن کردن ویژگیهای دریافتی توسط CNN و RNN استفاده میکند. آنها از LSTM قابل پشته به عنوان ماژول RNN برای استخراج خصوصیات توالی زمانی از پیکسل ها استفاده کردند. از تکنیک CNN (Inception-ResNet V2) نیز استفاده شد و بیشترین دقت ۸۳ درصد بود.
به گفته Alzubaidi، L. و همکاران، معیارهای ارزیابی مورد استفاده در وظایف DL نقش مهمی در تولید بهترین طبقهبندی کننده دارند. [۲۷]، آنها در دو مرحله از یک روش طبقه بندی داده های معمولی استفاده می شوند: آموزش و آزمایش. آنها در مورد FPGA بحث کردند، که می تواند برای ایجاد موتورهای پوشش CNN با بازده بیش از ۸۰ درصد، دقت هشت بیت و حداکثر عملکرد بیش از ۱۵ TOP استفاده شود. دقت Voxnet 79٪ بود، در حالی که ResNet 80٪ بود. در چارچوب سیاست مشترک کشاورزی اروپا، CamposTaberner، M. et al. [28] میخواهید درباره یک RNN برای طبقهبندی کاربری زمین بر اساس سریهای زمانی Sentinel-2 (CAP) اطلاعات بیشتری کسب کنید. نتایج بررسی نشان می دهد که باندهای قرمز و نزدیک مادون قرمز Sentinel-2 مفیدترین داده ها را ارائه می دهند. صفات به دست آمده از اکتساب های تابستانی از نظر اطلاعات زمانی مهم ترین بودند. دقت عملکرد شبکه ۲-BiLSTM در هر کلاس بیش از ۹۱٫۴٪ است.
Shafique, R. et al. [29] ارائه یک سیستم تشخیص نقص خط راه آهن مستقل مبتنی بر تجزیه و تحلیل صوتی. دادههای جمعآوریشده در خطوط راهآهن پاکستان با استفاده از سیگنالهای صوتی و استفاده از سیستمهای طبقهبندی مختلف برای دادههای جمعآوریشده دو سهم عمده از این کار است. آنها بهترین نتایج را با RF و DT به دست می آورند که دارای دقت ۹۷٪ هستند. یک شبکه تشخیص عیب مبتنی بر DL برای RVSFD توسط Ye, Y. و همکاران ساخته شد. [۳۰]. سه فاز برای شبکه تشخیصی وجود دارد: استراتژی GWN برای سیگنال شتاب در فاز اول (پیش پردازش داده ها) استفاده می شود تا شبکه تشخیصی را در برابر تأثیرات نسبتاً با فرکانس بالا ناشی از نقص مسیر مقاوم کند. یک استراتژی EST در مرحله دوم (ایجاد مجموعه داده های آموزشی) برای افزایش استحکام شبکه تشخیصی در برابر سایش چرخ ارائه شده است. در نهایت، یک شبکه تشخیص عیب مبتنی بر GONEST-1D CNN از سیستمهای تعلیق قطارهای پرسرعت در فاز سوم (آموزش و شناسایی) ایجاد میشود. با استفاده از ماتریس سردرگمی داده شده برای نمونه های آزمایشی (۱۰۰%)، می توان تمام حالت ها را به طور کامل تشخیص داد.
میز ۱٫
مروری بر منابع بررسی شده
میز ۱٫
مروری بر منابع بررسی شده
مرجع. |
وظیفه |
مجموعه داده ها |
طبقه بندی کننده ها |
دقت |
[۱۳] |
مدلهای پیشنهادی برای تشخیص عیوب در Loose Ballast، SunKink، Track Switch و Signals. |
مجموعه داده ها از ۱۰۰ گیگابایت داده ویدیویی ساخته شده اند |
Inception V3، ResNet50، و سریعتر R-CNN |
۱۰۰% |
[۱۴] |
GPS مکان خطا را تعیین می کند و از دوربین GO pro برای عکس گرفتن استفاده می کند. |
مجموعه داده ها از تصاویر استخراج شده از داده های ویدئویی ساخته می شوند |
یولو نسخه ۳ |
۹۵% |
[۱۵] |
یک تکنیک DL چند فازی برای انجام بخشبندی تصاویر پیشنهاد شده است. |
مجموعه داده ها از مسیرهای ریلی واقعی که توسط COTS VTIS جمع آوری می شوند، ساخته می شوند. |
سیستم های بازرسی مسیر مبتنی بر بصری (VTIS)، TrackNet |
۹۰% |
[۱۶] |
برای تشخیص آسیب ریل راهآهن پرسرعت، ترکیبی از شبکه تقسیمبندی گراف U-net و رویکرد نشانههای برجسته محلیسازی آسیب ارائه شد. |
مجموعه داده های RSDD نوع I |
SCueU-Net |
۹۹٫۷۶٪ |
[۱۸] |
آنها روشهای تشخیص و شناسایی نقص را با استفاده از ویژگیهای Dense-SIFT پیشنهاد کردند. |
مجموعه داده از تصاویری تشکیل شده است که از خط ۶ متروی پکن گرفته شده است. |
RCNN، VGG16 |
۹۷٫۱۴٪ |
[۱۹] |
یک مدل تشخیص آسیب را پیشنهاد میکند که در آن تصویر ابتدا با استفاده از یک دوربین آرایه صفحه به همراه نور LED برای افزایش روشنایی تصویر جمعآوری میشود. |
مجموعه داده ها از تصاویر دوربین آرایه هواپیما ساخته می شوند |
ردیابی کد زنجیره جهت |
…. |
[۲۰] |
یک پایش وضعیت ریل بصری مبتنی بر رایانه پیشنهاد شده است. |
داده ها از دوربینی که در بالای قطار قرار داده شده است |
پردازش تصویر |
…. |
[۲۱] |
یک رویکرد بازرسی ریلی مبتنی بر تجزیه و تحلیل ویدئویی خودکار. |
داده ها از یک دوربین فیلمبرداری که در جلوی قطار قرار داده شده است |
پردازش تصویر |
۹۵٫۳٪ |
[۲۲] |
بازرسی خودکار مسیر با استفاده از بینایی کامپیوتری و روشهای تشخیص الگو. |
داده ها از دوربینی که در مقابل قطار در حال حرکت قرار داده شده است |
سی ان ان عمیق |
۹۵٫۰۲٪ |
[۲۳] |
با استفاده از بینایی کامپیوتری و تشخیص الگو، مدیریت ریسک را در سیستم های راه آهن انجام دهید. |
تصاویر به صورت دستی از مسیرهای ریلی مختلف جمع آوری شده است |
Keras، ReLU، CNN |
۸۱٫۹۰٪ |
[۲۴] |
سؤالات تحقیق مربوط به کشاورزی، مدل های مورد استفاده، منابع داده های مورد استفاده و دقت کلی به دست آمده بر اساس شاخص های عملکرد نویسندگان را بررسی می کند. |
PlantVillage، LifeCLEF، MalayaKew و UC Merced |
AlexNet، VGG، و Inception-ResNet |
…. |
[۲۵] |
رویکردهای بازرسی راه آهن مبتنی بر یادگیری ماشین پیشنهادی، از جمله یک روش مبتنی بر ویژگی و یک روش مبتنی بر شبکه عصبی عمیق مبتنی بر دادههای شتاب. |
مجموعه داده شتاب از حسگرهای نصب شده روی واگن بازرسی راه آهن به دست آمد. |
ResNet، FCN |
۱۰۰% |
[۲۷] |
بررسی جامع تری از مهم ترین جنبه های DL و از جمله پیشرفت هایی که اخیراً به این زمینه اضافه شده است، ارائه دهید. |
ImageNet، CIFAR-10، CIFAR-100، MNIST |
Xillinx، Voxnet، ResNet |
۸۰% |
[۲۸] |
نشان می دهد که استفاده از رویکردهای DL برای تجزیه و تحلیل داده های سنجش از دور (RS) به سرعت در حال افزایش است. |
مجموعه داده ها از داده های سنجش از دور (RS) و داده های ماهواره ای ساخته شده اند |
Sentinel-2، ۲-BiLSTM، CamposTaberner |
۹۱٫۴٪ |
[۲۹] |
ارائه یک سیستم تشخیص نقص خط راه آهن مستقل مبتنی بر تجزیه و تحلیل صوتی. |
مجموعه داده ها از داده های جمع آوری شده در خطوط راه آهن پاکستان با استفاده از سیگنال های صوتی ساخته می شوند |
ماشین های برداری، LR، RF و DT |
۹۷% |
[۳۰] |
یک شبکه تشخیص عیب مبتنی بر DL برای RVSFD ساخته شد. |
مجموعه داده ها از داده های جمع آوری شده از حسگرهای شتاب سنج ساخته می شوند. |
HONEST-1D CNN |
۱۰۰% |
۴٫ پارامترهای ارزیابی عملکرد
ما از دقت به عنوان معیارهای عملکرد خود استفاده می کنیم، و همچنین در حال آزمایش عملکرد مدل خود با استفاده از معیارهایی مانند گزارش های طبقه بندی و ماتریس های سردرگمی هستیم. گزارش طبقهبندی ما دارای چهار معیار برای اندازهگیری اثربخشی هر یک از مدلها است. این معیارها شامل پشتیبانی، دقت، امتیاز F1 و فراخوان است. پشتیبانی را می توان با جمع کردن آخرین ردیف ها در ماتریس سردرگمی محاسبه کرد. پشتیبانی تعداد رخدادهای هر کلاس خاص در پاسخ های واقعی است که به این معنی است که تعداد رخدادهای واقعی کلاس را در مجموعه داده نشان می دهد.
در مجموعه معادلات فوق،
-
TP = مثبت واقعی
-
FP = مثبت کاذب
-
FN = منفی کاذب
-
TN = منفی واقعی
مدلهای هوش مصنوعی معمولاً مدلهای جعبه سیاه در نظر گرفته میشوند و فاقد شفافیت هستند. مدل های شفاف می توانند توضیح دهند که چرا پیش بینی می کنند و چه چیزی را پیش بینی می کنند. بنابراین اعتماد به مدل ایجاد می کند و مطمئن می شود که آنها فقط شی مورد نظر را به گونه ای پیش بینی می کنند که برای محققان قابل توضیح باشد. هدف از شفافیت یافتن مواردی است که در آن مدل به طور اساسی شکست خورده است. چندین رویکرد و چارچوب برای پیادهسازی هوش مصنوعی قابل توضیح وجود دارد که میتواند نمایشهای بصری را برای درک بهتر آنچه که یک مدل بر روی نمونههای جدید دادهها پیشبینی میکند و نحوه انجام آنها ارائه دهد. در مورد تصاویر، وصله هایی برای نشان دادن مکانی که مدل روی آن فوکوس می کند، تولید می شود. یکی از محبوبترین رویکردها برای ارائه LIME (توضیحات مدل تفسیری محلی-آگنوستیک)، یک روش توضیحی انقلابی برای توضیح صادقانه و جامع پیشبینیهای هر طبقهبندیکننده است. ما از LIME در مقاله خود برای توضیح عملکرد مدل پیشنهادی خود استفاده می کنیم زیرا نتوانستیم راه حل دیگری برای توضیح مدل سفارشی خود پیدا کنیم. علاوه بر این، ما از Grad-CAM استفاده میکنیم که نقشههای حرارتی را در محل تصویر که در آن مدل فوکوس میکند تولید میکند. [۳۸]. ما از Grad-CAM برای به دست آوردن قابلیت توضیح مدل ها استفاده می کنیم، که برای مقایسه با معماری پیشنهادی ما استفاده می شود. LIME الگوریتمی است که میتواند پیشبینیهای هر طبقهبندیکننده و پسرونده را با بومیسازی آن با یک مدل قابل درک به درستی توضیح دهد. [۳۹].
نتایج تولید شده توسط Grad-CAM و LIME در بخش نتایج تجربی نشان داده شده است.
معادله (۴) معادله Grad-CAM را نشان میدهد که یک ترکیب خطی وزندار از نقشههای ویژگی است که تابع ReLU را دنبال میکند. جایی که
منبع: https://www.mdpi.com/2673-2688/5/2/24