هوش مصنوعی | متن کامل رایگان | مهندسی سریع برای ایجاد دانش: استفاده از زنجیره فکری برای حمایت از ایده های قابل ارتقای دانش آموزان

۱٫ مقدمه

استفاده از مدل‌های زبان بزرگ معمولی (LLM) علاقه زیادی را در رشته‌ها و زمینه‌های مختلف، با توانایی‌هایی از پاسخ به سؤالات ساده تا حل مسائل پیچیده و تولید کدها، ایجاد کرده است. [۱]. در حوزه آموزش، خلق دانش مجموعه ای مهم و حیاتی از اقدامات است که به وسیله آن یک جامعه دانش جمعی خود را ارتقا می دهد و ارتباط نزدیکی با نوآوری دارد. [۲]. اگرچه دانش‌آموزان ممکن است از نظر توانایی در خلق دانش جدید با دانشمندان همتراز نباشند، اما می‌توان آنها را در مسیر ساخت دانش قرار داد و شروع به توسعه شیوه‌های مشابهی مانند شناسایی شکاف‌های عمده در دانش جامعه، یادگیری تعیین اهداف و شناسایی راه‌ها کرد. برای رسیدگی و همکاری برای بهبود ایده های یک جامعه در طول زمان [۳]. در زمان‌های اخیر، پیشرفت‌های تکنولوژیکی از دانش‌آموزان در گفتمان دانش‌سازی از طریق یک پلتفرم گفتمان آنلاین حمایت کرده است [۴] (انجمن دانش) که از ایجاد دانش و دانش‌سازی پشتیبانی می‌کند، جایی که دانش‌آموزان می‌توانند به طور مشترک روی ایده‌ها کار کنند، و همچنین به عنوان آرشیو ایده‌های جامعه در زمانی که دانش‌آموزان ایده‌های خود را توسعه داده و بهبود می‌بخشند، عمل می‌کند.
اگرچه تلاش‌های دانش‌آموزان در ایجاد دانش به خوبی در طول سال‌ها همراه با درک بیشتر پاسخ‌های دانش‌آموزان مورد بررسی و تحلیل قرار گرفته است. [۵,۶]کیفیت پاسخ‌ها همچنان یک مسئله حیاتی است زیرا به عوامل متعددی از جمله عوامل ذاتی مانند انگیزه، همراه با در دسترس بودن و تنوع ایده‌هایی که دانش‌آموزان را در پیشبرد ایده‌ها از طریق گفتمان برانگیخته می‌کند، وابسته است. گاهی اوقات، پاسخ‌های دانش‌آموزان در سطحی نیست که برخی از مربیان انتظار دارند در محیط‌های یادگیری خاص به آن دست یابند. ظهور هوش مصنوعی مولد، به‌ویژه با افزایش دسترسی به فناوری‌های مرتبط با ترانسفورماتور پیش‌آموزشی (GPT) مانند ChatGPT، ابزار فناوری جدیدی را به وجود می‌آورد که مربیان و حتی دانش‌آموزان را قادر می‌سازد تا روی سؤالات و ایده‌های خود به روش‌هایی کار کنند. قبلا امکان پذیر نبودند.
با این حال، برای استفاده و مکالمه مؤثر با LLMها، کاربران باید در مهندسی سریع مهارت داشته باشند و اساساً دستورالعمل‌هایی را برای LLMها برای سفارشی‌سازی خروجی‌ها و افزایش قابلیت‌های مدل‌ها ایجاد کنند. کلید مهندسی سریع، طراحی و ساخت اعلان‌هایی است که برای کارهای پایین دستی، در هدایت مدل‌های از پیش آموزش‌دیده برای انجام وظایف دلخواه و دستیابی به اهداف عملکرد مورد نیاز استفاده می‌شوند. [۷]. استفاده از LLM با وظایف چالش برانگیز مانند استدلال حسابی، استدلال عقل سلیم و استدلال نمادین بسیار دشوار بوده است. [۸]به خصوص اگر هدف کار با وظایف مربوط به عقل سلیم و استدلال باشد. روش‌های هدایت یادگیری مدل شامل تنظیم دقیق مدل‌های از پیش آموزش‌دیده و اعلان درون متنی به‌عنوان ابزاری برای هدایت مدل‌ها برای انجام وظایف دلخواه است.
به جای مسیر سنتی تنظیم دقیق LLM ها با استفاده از به روز رسانی گرادیان [۹]که فرآیندی پرهزینه و وقت گیر است، تعداد فزاینده ای از محققین استفاده از تحریک درون متنی با LLM را برای دستیابی به موفقیت بهتر با استفاده از چندین نمونه ورودی-خروجی ترجیح می دهند. [۱۰]. استفاده از دستورات برای هدایت یادگیری مدل [۱۱]همچنین به عنوان یادگیری سریع نامیده می شود، می تواند مدل های زبان را قادر به انجام یادگیری چند شات یا صفر و انطباق با سناریوهای جدید با داده های حداقل برچسب گذاری کند. [۱۲]. این مقاله بر درک استفاده از مهندسی سریع برای ایجاد دانش متمرکز است و با سؤال تحقیقاتی زیر هدایت می شود: “رویکرد زنجیره فکر چگونه می تواند باشد. [۱۳] (CoT) برای حمایت از ایده‌های نامحتمل دانش‌آموزان در یک محیط ایجاد دانش اعمال شود؟»

ما فرض می‌کنیم که رویکرد زنجیره‌ای از فکر (CoT) در مهندسی سریع، روشی دقیق‌تر و روشن‌تر برای حمایت از ایده‌های دانش‌آموزان در یک محیط ایجاد دانش فراهم می‌کند، بنابراین ظرفیت دانش‌آموزان را برای تولید و بهبود ایده‌ها و در عین حال افزایش کلی می‌دهد. کیفیت گفتمان دانش‌سازی که با استفاده از LLM تسهیل می‌شود. اهمیت این توسعه در این است که چگونه یک رویکرد فقط اعلان می‌تواند امکانات بیشتری را برای کار بدون مجموعه داده‌های آموزشی بزرگ و توانایی یک مدل نقطه بازرسی واحد برای انجام بسیاری از وظایف بدون از دست دادن کلیت را آشکار کند. با استفاده از زنجیره فکری برای ایجاد دانش و استدلال عقل سلیم، این کار قصد دارد به حوزه هوش مصنوعی کاربردی برای اهداف آموزشی کمک کند.

۲٫ پیشینه و ادبیات

۲٫۱٫ ظهور AI و LLM های مولد

از دهه ۱۹۶۰، هوش مصنوعی مولد در قالب چت بات ها حضور داشته است و در دهه گذشته به دلیل توسعه شبکه های متخاصم مولد (GANs) در سال ۲۰۱۴ توسط گودفلو و همکارانش در حال رشد بوده است. [۱۴]. GAN ها با توجه به پتانسیل عظیم آنها در تقلید از توزیع داده ها، ترکیب محتوای جدید و توانایی ایجاد اشیاء دنیای واقعی در دامنه های مختلف، توسعه مخربی هستند. در حالی که فواید و تأثیرات بالقوه ای بر جامعه وجود داشت، همچنین مفاهیم منفی با محتوای رسانه های جعلی مانند ویدیوهای عمیق جعلی وجود داشت که خطوط بین داده های ضبط شده واقعی و محتوای ساخته شده به صورت دیجیتالی را محو می کرد و تعیین اصالت را دشوار می کرد. [۱۵].
این اشکال اختلالات اطلاعاتی از تعداد زیادی از مزایایی که از طریق استفاده از خانواده دیگری از شبکه های عصبی که از معماری ترانسفورماتور استفاده می کنند، به نام ترانسفورماتور از پیش آموزش دیده (GPT) ارائه شده اند، کم نمی کنند. [۱۰]. این پیشرفت کلیدی در هوش مصنوعی به تقویت برنامه‌های کاربردی مانند ChatGPT کمک کرده است که در اواخر سال ۲۰۲۲ به شهرت رسید و خود را به عنوان یک سیستم بسیار قدرتمندتر و در دسترس‌تر معرفی کرد که در نهایت می‌تواند تحقیق و توسعه را به سمت هوش مصنوعی و سیستمی هدایت کند که می‌تواند حل مشکلات در سطح انسانی در جبهه آموزش، قبلاً برای آموزش و یادگیری با چشم اندازها و چالش ها استفاده شده است [۱۶,۱۷]طراحی ها و شیوه ها [۱۸]و استراتژی ها [۱۹] که حول استفاده مسئولانه از ChatGPT ساخته شده‌اند، که جنبه‌ای حیاتی برای تشویق استفاده گسترده‌تر توسط مربیان و دانش‌آموزان است.

۲٫۲٫ نقش و رویکردهای مختلف مهندسی سریع

مهندسی سریع، همانطور که با یادگیری درون متنی و تحریک امکان پذیر شد، پس از معرفی ChatGPT اهمیت پیدا کرد، زیرا روش اصلی ورودی و تعامل با LLM صدور متن به آن برای دریافت پاسخ یا از نظر فنی دستورالعملی برای LLM است. . هنگام برقراری ارتباط با یک LLM مانند ChatGPT، از دستورات – از جمله سؤالات، ادعاها و اظهارات – استفاده می شود و کاربران انتظار پاسخ دقیق و کافی را دارند.

همانطور که مردم در زندگی واقعی چگونه به یکدیگر پاسخ می دهند، اعلان ها می توانند سطوح مختلفی از وضوح و ویژگی داشته باشند. اساساً، اعلان‌های خوب که پاسخ‌های خوبی را از LLM ها ایجاد می‌کنند، باید دو معیار را برآورده کنند: وضوح و ویژگی. [۱۱]. اعلان‌های واضح حاوی واژگان ساده و زبان سرراست است که بدون ابهام است و حاوی اصطلاحات تخصصی نیست. درخواست‌های با ویژگی مستلزم ارائه اطلاعات زمینه‌ای لازم برای LLM برای پاسخ به سؤال یا انجام وظیفه داده شده است.

اعلان نیز اشکال مختلفی دارد و در میان رویکردهای مختلف، اعلان استاندارد به عنوان رویکرد اساسی در نظر گرفته می شود و اغلب برای محک زدن عملکردهای LLM استفاده می شود. چندین رویکرد وجود دارد، از جمله موارد زیر:

  • ضربه صفر. این امر مستلزم ارائه یک توصیف زبان طبیعی از کار به مدل بدون مثال و درخواست برای نتیجه است.

  • تک شات. یک نمونه واحد به مدل ارائه می شود تا بتواند نتیجه ای مشابه آنچه در نظر گرفته شده است ارائه دهد و اغلب بهتر از مدل بدون نمونه است.

  • چند شات. مجموعه‌ای از نمایش‌ها یا نمونه‌های با کیفیت بالا در زمان استنتاج به مدل معرفی می‌شوند که از هر دو جفت ورودی-خروجی برای یک کار هدف تشکیل شده است، اساساً برای اینکه مدل نتیجه‌ای را ارائه دهد که هدف و معیارهای انسان را با عملکرد بهتر در نظر بگیرد. که اغلب بهتر از تلاش های صفر و یک شلیک است.

جدول ۱ نمونه های متعددی را ارائه می دهد که وقتی دانش آموزان با رویکرد صفر، تک شات یا چند شات سؤال می پرسند، انگیزه چگونه به نظر می رسد.
لازم به ذکر است که فرمت پرسش و پاسخ نیازی به استفاده دقیق ندارد و قالب تلقین به ماهیت وظایف بستگی دارد که می تواند وظایف طبقه بندی باشد که نمونه هایی را ارائه می دهد که یک کار خاص را نشان می دهد. آخرین مثال در جدول ۱ با مثال چند شات نشان می دهد که ایده ها می توانند تا حد زیادی توسط LLM طبقه بندی شوند.
فراتر از درخواست درون متنی، برنامه های افزودنی دیگری نیز برای درخواست های LLM وجود دارد، مانند تنظیم دقیق [۲۰]اتوماسیون [۲۱,۲۲]و سفارشی سازی خروجی های تولید شده همچنین کاتالوگ های منتشر شده وجود دارد [۱۱] مستندسازی چارچوب‌هایی برای مستندسازی الگوها برای ساختاردهی به حل طیف وسیعی از مشکلات و سازگاری با حوزه‌های مختلف، با الگوهایی که با موفقیت برای بهبود خروجی‌های LLM استفاده شده‌اند، می‌خواهد.

۲٫۳٫ زنجیره فکر (CoT)

فرآیندهای استدلالی پیچیده که اغلب شامل ایده‌ها و طرح‌های پیچیده می‌شوند، احتمالاً به مراحل میانی نیاز دارند که منجر به اجماع و راه‌حل‌های نهایی می‌شوند، که تحریک چند شات می‌تواند تا حدودی نشان دهد.

یک مطالعه اخیر [۱۳] رویکرد امیدوارکننده‌ای به نام تحریک زنجیره‌ای از فکر (CoT) ارائه کرد که توانست پتانسیل امیدوارکننده استدلال در مدل‌های زبان بزرگ را با معرفی یک سری مراحل استدلال میانی باز کند. در اصل، این روش ترغیب، مدل را تشویق می‌کند تا مشابه نحوه نوشته شدن اعلان به صورت مجموعه‌ای از مراحل، استدلال کند. این شکل از اعلانات دارای چندین مزیت نسبت به اعلان استاندارد است: می‌تواند مراحل میانی را در تکالیف یادگیری چند مرحله‌ای فعلی ایجاد کرده و در آن بگنجاند، در نتیجه بهبود مدل را در مسائل پیچیده بهبود می‌بخشد. روشی را که در آن نتایج را می توان تفسیر کرد و بنابراین با بینش بیشتری در مورد رفتار مدل و تصمیم گیری، با شفافیت بیشتر و درک بیشتر از نحوه تولید خروجی ها ارائه می شود، افزایش می دهد. و مهمتر از آن، می‌تواند از دستورهای استاندارد در استدلال‌های حسابی، استدلال عقل سلیم و وظایف استدلال نمادین بهتر عمل کند.
از جمله این سه وظیفه استدلالی (استدلال حسابی، استدلال عقل سلیم، و وظایف استدلال نمادین)، و همانطور که در زمینه CoT توضیح داده شده و مثال زده شد. [۱۳]مطالعه در این مقاله بر وظایف استدلال عامیانه که با ماهیت ایجاد دانش همسو هستند، متمرکز است. ما فرآیندهای مرتبط را با هم ترسیم کردیم تا روشی را که در آن مهندسی سریع برای ایجاد دانش انجام شود، پیش ببریم.
از یک سو، به طور کلی، استدلال عقل سلیم، که کلید تعامل با جهان است، هنوز از دسترس اکثر سیستم های درک زبان طبیعی خارج است. [۲۳]. استدلال عام مربوط به پاسخ به سؤالاتی است که شامل درک ما از موقعیت های روزمره و استنتاج بر اساس دانش عمومی است. در حوزه ایجاد دانش، این موضوع به چگونگی طرح پرسش‌های مربوط به تجربیات واقعی، طرح مشکلات واقعی از این تجربیات، ایجاد و بهبود ایده‌هایی برای کمک به حل مشکلات توسط فراگیران می‌پردازد. از سوی دیگر، جدول ۲ نمونه ای از استدلال عقل سلیم را نشان می دهد که می تواند با استفاده از یک LLM حل شود، که استفاده از مهندسی سریع و LLM ها را برای استدلال و ایجاد دانش توجیه می کند.
چندین ویژگی مطلوب برای تسهیل استدلال در LLM ها وجود دارد و این ویژگی ها در مقاله وی و همکاران شناسایی شدند. [۱۳] به شرح زیر:
  • اولاً، باید به مدل‌ها اجازه داده شود که مسائل چند مرحله‌ای را به مراحل میانی تقسیم کنند، که در صورت نیاز می‌توان با منابع بیشتری پیاده‌سازی کرد.

  • در مرحله بعد، CoT به عنوان پنجره ای قابل تفسیر به رفتار مدل می تواند به مدل اجازه دهد تصمیم بگیرد که چگونه بهترین پاسخ را پشتیبانی کند.

  • استدلال CoT برای حسابی، استدلال عقل سلیم، و دستکاری نمادین، با کاربرد بالقوه برای کارهایی که انسان می تواند از طریق زبان حل کند، استفاده می شود.

  • استدلال CoT را می توان به آسانی از طریق نمونه هایی از توالی های CoT در نمونه هایی از چند شات، از مدل های زبان خارج از قفسه به اندازه کافی بزرگ استخراج کرد.

همانند سایر اشکال تحریک، تحریک CoT نیز می‌تواند به دو روش زیر انجام شود، مشابه آنچه در بخش ۲٫۲ نشان داده شده است:
  • صفر شات CoT. عبارات زبان طبیعی برای تشویق مدل به تولید زنجیره های استدلال استفاده می شود.

  • چند شات CoT. این مدل با چند نمایش یا مثال با کیفیت بالا برای ایجاد نتیجه تحریک می شود. این رویکرد در این مطالعه مورد استفاده قرار گرفت تا در نهایت به پاسخ نهایی منتهی شود زیرا مزایای آن برای کارهای استدلالی پیچیده با مدل‌های زبانی بزرگ‌تر آشکارتر است.

با گنجاندن چندین نمایش از CoT به عنوان نمونه در تحریک چند شات، این ترکیب اقدامات می تواند به LLM ها کمک کند تا زنجیره های فکری را در پاسخ ایجاد کنند. برای نشان دادن این موضوع، از LLM سوالی در رابطه با پایداری انسان از نظر ازدحام بیش از حد فضاهای قابل استفاده پرسیدیم. جدول ۳ نمونه ای از چگونگی ظاهر استاندارد را در مقایسه با نحوه ارائه نمونه هایی برای تحریک CoT نشان می دهد.
از پاسخ‌های جدول ۳، اعلان استاندارد قادر به ارائه یک پاسخ صحیح به احتمال زیاد بود، و ممکن است بحث شود که آیا ایستگاه قطار شلوغ‌تر از پاسخ ارائه‌شده در یک مرکز خرید است یا خیر. درخواست استاندارد توانست اطمینان حاصل کند که یک پاسخ معقول وجود دارد، اما دلیل آن برای کاربر روشن نشد.

با درخواست CoT، آشکار است که یک پاسخ مستقیم مستقیم امکان پذیر بود اما به دلیل اطلاعات محدودی که درخواست درون متنی می تواند ارائه دهد، داده نشد. با این حال، ارزش تحریک CoT دلایل بیشتری را ارائه می‌کند که به کاربر LLM کمک می‌کند تا بهتر تصمیم بگیرد که چه پاسخی مناسب‌تر است، که، در این مورد، بسته به دوره‌های اوج مصرف، یا یک مرکز خرید یا یک ایستگاه قطار است. این نشان می دهد که چگونه ارائه CoT برای تحریک می تواند به طور قابل توجهی توانایی LLM را برای انجام استدلال پیچیده بهبود بخشد.

به عنوان بخشی از این بررسی ادبیات گسترده، چندین پیشرفت و توسعه را یادداشت می‌کنیم که می‌توانند برای افزایش بیشتر عملکرد استدلال رویکرد CoT فعلی مورد استفاده قرار گیرند، یکی از آنها کار موجود برای جایگزینی استراتژی رمزگشایی حریصانه ساده و ساده مورد استفاده در تحریک CoT با سازگاری با خود است. [۲۴]. این تکنیک از شهود استفاده می کند که چگونه ممکن است چندین روش مختلف تفکر و استدلال وجود داشته باشد که به یک پاسخ صحیح منحصر به فرد منجر شود. این توسعه بر این منطق استوار است که وقتی تفکر و تحلیل سنجیده‌تری برای یک مشکل مورد نیاز است، احتمالاً تنوع بیشتری از مسیرهای استدلالی وجود خواهد داشت که به پاسخ منتهی می‌شود. [۲۵]. از این رو، این توسعه به عنوان یک گسترش احتمالی برای افزایش روشی که در آن CoT می‌تواند برای کمک به فرآیندهای ایجاد دانش و دانش‌سازی بهبود یابد، مورد توجه قرار گرفته است. با این حال، ما همچنین تاکید می کنیم که این توسعه تمرکز این مقاله نیست.

۲٫۴٫ دانش آفرینی و دانش سازی

فرآیندهای استدلالی پیچیده که اغلب شامل ایده‌ها و طرح‌های پیچیده می‌شوند، احتمالاً نیازمند مراحل میانی هستند که منجر به همگرایی و ایجاد دانش جدیدتر می‌شوند. قبل از اینکه بتوان به این امر دست یافت، باید آموزش را با نیازهای ایجاد دانش در عصر دیجیتال هماهنگ کرد. دانش‌سازی شبیه خلق دانش است که در آزمایشگاه‌های تحقیقاتی انجام می‌شود، با تمرکز بر ارزش برای فرد، جامعه و جامعه، با تئوری و آموزش در طول سال‌ها تکامل می‌یابد و فرآیندهای خلق دانش را در دسترس دانش‌آموزان مدرسه‌ای قرار می‌دهد. [۲۶].
دانش‌سازی به عنوان یک آموزش مبتنی بر اصول [۲۷] و مجموعه ای از شیوه ها، به دانش آموزان اجازه می دهد تا روی سؤالات بزرگ کار کنند (به عنوان مثال، آیا کاهش پلاستیک های یکبار مصرف تفاوتی در تغییرات آب و هوایی ایجاد می کند؟) و به طور مشترک ایده ها را از طریق عاملیت معرفتی، گفتمان بهبودپذیر و ایده ها توسعه و بهبود بخشند. با قرار دادن ایده های دانش آموزان در یک فضای عمومی مانند انجمن دانش [۴]سپس برای دانش‌آموزان امکان تجسم و جستجوی دیدگاه‌ها و ایده‌های متنوع و ایجاد ایده‌های یکدیگر به عنوان بخشی از تلاش‌های جامعه برای پیشبرد بیشتر دانش جمعی وجود دارد. این تحقیق پیاده‌سازی طراحی پایدار در حال حاضر یک رویکرد سیستماتیک است که می‌تواند به بازسازی شیوه‌های آموزشی برای ایجاد سیستم‌های خود-بهبود برای همسویی‌های مستمر در ایجاد دانش، با پیامدهایی برای توسعه سیستم‌ها و جوامع خود-بهبود که از فناوری برای همسویی مجدد آموزش در ایجاد دانش استفاده می‌کنند، کمک کند. [۲۶].

۳٫ مواد و روشها

۳٫۱٫ طراحی CoT برای ایجاد دانش

بر اساس شیوه‌های فعلی که در آن دانش‌آموزان ایده‌های یکدیگر را جستجو می‌کنند یا آنها را از منابع دیگر ارجاع می‌دهند، استفاده از هوش مصنوعی مولد با یک LLM منبع اطلاعات جایگزین و اضطراری است که می‌تواند از دانش‌آموزان در بهبود ایده‌هایشان حمایت کند. با استفاده از روش تحریک CoT شرح داده شده در بخش ۲٫۳ و از طریق دریچه ایجاد دانش با استفاده از موردی که در یک محیط ساخت دانش برای حمایت از ایده‌های بهبودپذیر قرار دارد، اقدامات زیر را می توان برای طراحی CoT برای ایجاد دانش انجام داد:
  • سؤالات دانش‌آموزان، به‌عنوان بخشی از دانش‌سازی، می‌توانند به چند مرحله میانی تقسیم شوند تا به‌عنوان اعلان اجرا شوند.

  • CoT می‌تواند به اندازه کافی زمینه‌ای شود و با اطلاعات تکمیل شود تا پنجره کافی از تفسیر را فراهم کند و بنابراین، فضایی را برای ایده‌ها در خروجی تولید شده به‌طور کامل بیان کند.

  • استدلال CoT می تواند برای استدلال عقل سلیم به عنوان بخشی از همسویی با نیازهای ایجاد دانش در محیط ساخت دانش استفاده شود.

  • استدلال CoT را می توان در LLM با گنجاندن نمونه هایی از دنباله های CoT در نمونه هایی از تحریک چند شات استخراج کرد.

چندین نمونه چند نمونه برای تحریک CoT در جدول ۴ برای ایجاد دانش نشان داده شده است، و می توان از آنها برای به دست آوردن پاسخ های CoT از LLM استفاده کرد.

در این مطالعه، ما مشاهده کردیم که چگونه می توان از استدلال CoT با استدلال عقل سلیم برای ایجاد دانش با قالب بندی مجدد سؤالات واقعی دانش آموزان از تنظیمات یادگیری معتبر با درخواست CoT و سپس وارد کردن آنها در یک LLM قبل از مقایسه خروجی ها با پاسخ های واقعی دانش آموزان برای تعیین استفاده کرد. سودمندی CoT باعث می شود. مقایسه‌ها و خروجی‌های به‌دست‌آمده به مربیان و دانش‌آموزان درباره نحوه استفاده از CoT برای کمک به سفر خود در ساخت دانش و بهبود ایده‌های دانش‌آموزان با LLM اطلاع می‌دهد.

۳٫۲٫ تنظیمات، شرکت کنندگان و راه اندازی

۳٫۲٫۱٫ زمینه و ماهیت سوالات دانش آموزان

این مطالعه از یک طرح نیمه تجربی پیروی کرد، با داده‌های به‌دست‌آمده از یک محیط آموزشی معتبر که به‌عنوان یک استودیوی طراحی ساختمان دانش دانشجویی (sKBDS) طراحی و اجرا شد. موضوع روی پایداری متمرکز بود و این رویداد در نوامبر ۲۰۲۱ برگزار شد. قبل از جمع‌آوری و تجزیه و تحلیل داده‌ها، یک بررسی اخلاقی تأیید شد و مجوز از دانشگاه درخواست شد. در مجموع ۳۱ دانش‌آموز شرکت‌کننده از مدارس ابتدایی و متوسطه (بین کلاس‌های ۵ و ۱۰) تحت دو روز تسهیل و کاوش آنلاین برای بررسی مشکلات دنیای واقعی مرتبط با موضوع قرار گرفتند و سؤالات آنها از یکدیگر در انجمن دانش پست شد. ماهیت سؤالات دانش آموز آمیزه ای از علوم طبیعی و علوم اجتماعی بود که از سؤالات ساده تا سؤالات همراه با توجیه و توضیح را در بر می گرفت زیرا دانش آموزان به دنبال پاسخ برای سؤالات خود بودند.

۳٫۲٫۲٫ استخراج جفت پرسش و پاسخ

جفت‌های پرسش و پاسخی که دانش‌آموزان در تالار دانش پست می‌کردند، شامل پرسش‌ها و پاسخ‌های دانش‌آموزان درباره یک موضوع می‌شد و عمدتاً برای شفاف‌سازی یک موضوع مورد بحث، مرور یک فعالیت اخیراً تکمیل‌شده یا به‌عنوان بخشی از آماده‌سازی برای ارائه استفاده می‌شد. یک جفت پرسش و پاسخ کامل مستلزم یک پرسش است که با موضوع sKBDS در مورد پایداری (به عنوان مثال، “کربن چگونه به وجود آمد؟”) و نه صرفاً صحبت های معمولی (مثلا، چه نوشیدنی هایی؟ چای حباب دار؟)، و به دنبال آن یک پاسخ مناسب از یک شرکت‌کننده دیگر در sKBDS زمان‌بندی پاسخ ناهمزمان و محدود به پاسخ‌های به دست آمده از دو روز تسهیل بود.

به‌عنوان بخشی از فرآیند پاکسازی داده‌ها و برای تحقق اهداف این مطالعه، تنها جفت‌های پرسش-پاسخ کامل برای استفاده در نظر گرفته شدند، زیرا نیاز به مقایسه خروجی‌های LLM با پاسخ‌های انسانی اصلی بود که به ما اجازه می‌داد در مورد سودمندی بحث کنیم. CoT. از ۷۲۱ نوبت گفتمانی که در طول رویداد دو روزه sKBDS جمع‌آوری شد، ۲۷۲ جفت پرسش-پاسخ کامل به عنوان داده‌های مرتبط و قابل استفاده شناسایی شدند و ۱۴۹ موضوع بحث را تشکیل دادند. در این مقاله، ما دو رشته از جفت‌های پرسش و پاسخ کامل را در یافته‌ها نشان می‌دهیم تا کاربرد بالقوه CoT برای حمایت از ایده‌های قابل بهبود در زمینه ایجاد دانش و دانش‌سازی را به نمایش بگذاریم.

۳٫۲٫۳٫ استخراج جفت پرسش و پاسخ

از طریق این مطالعه، هدف ما درک بهتر کاربرد CoT با انتخاب جفت‌های کامل پرسش و پاسخ علوم اجتماعی و علمی و تقویت آنها با نمونه‌های CoT چند شات قبل از ارسال آنها به عنوان ورودی به LLM بود. همانطور که در مثال‌های جدول ۳ و جدول ۴ نشان داده شده است، پیشرفت‌های پیشنهادی اجازه می‌دهند خروجی‌های تولید شده توسط LLM با پاسخ‌های انسانی موجود مقایسه شوند. به عنوان بخشی از روش، دو یا چند جفت پرسش و پاسخ برای مقایسه باید متوالی و مرتبط با یکدیگر باشند و پاسخ‌هایی که در ادامه می‌آیند نباید از یک پاسخ‌دهنده باشند، زیرا هدف ارزیابی کیفیت پاسخ‌ها و تفاوت‌ها است. بین پاسخ تولید شده توسط LLM و پاسخ انسانی اصلی. شکل ۱ نشان می دهد که چگونه می توان پاسخ ها را با یکدیگر مقایسه کرد. بخش نتایج تفاوت ها و مقایسه های بین خروجی تولید شده توسط LLM و پاسخ های اصلی دانش آموزان را ارائه می دهد.

۳٫۲٫۴٫ انتخاب مدل زبان بزرگ (LLM)

GPT-3.5 Turbo به عنوان LLM برای استفاده در این مطالعه انتخاب شد. اگرچه شبیه به سایر LLM ها مانند BERT و PalM است، عملکرد خوب GPT در اکثر وظایف و موضوعات آن را به انتخاب ترجیحی تبدیل کرده است. علاوه بر این، سهولت دسترسی به GPT3.5 Turbo از طریق رابط برنامه نویسی کاربردی (API) دلیل دیگری برای انتخاب آن برای پیاده سازی است. آزمایش اولیه با مدل‌های نوظهور (به عنوان مثال، GPT4، GPT4o) پاسخ‌هایی با سطح کیفی مشابه با انتظارات نشان داد و انتظار می‌رود روش پیشنهادی در این مطالعه برای ایجاد دانش، حتی با وجود نسخه‌های LLM که در آینده نزدیک عرضه شوند، عملکرد خوبی داشته باشد.

۴٫ نتایج

در مجموع ۷۲۱ نوبت گفتمان مورد بررسی قرار گرفت و ۲۷۲ جفت پرسش-پاسخ حاوی محتوای مرتبط با بحث در مورد پایداری یافت شد. این نشان می‌دهد که ۷۹ درصد پست‌های دانش‌آموز مرتبط بوده و سایر چرخش‌های گفتمان یا صحبت‌های پیش پا افتاده یا معمولی بوده و بنابراین تحلیل نشده‌اند. در بین زوج‌های پرسش و پاسخ مربوطه، ۱۴۹ موضوع بحث دانشجویی با حداقل عمق موضوع ۳ یافت شد و طولانی‌ترین موضوع در عمق ۹ دارای سه شرکت‌کننده مختلف بود.

دو رشته نمونه از جفت‌های پرسش-پاسخ کامل نشان داده شده‌اند تا نشان دهند که چگونه می‌توان از CoT برای حمایت از ایده‌های بهبودپذیر در زمینه ایجاد دانش و دانش‌سازی استفاده کرد. هر دو تصویر، توالی داده‌های موجود از گفتمان دانش‌آموزان را نشان می‌دهند و این که چگونه پاسخ‌ها را می‌توان برای ارائه مجموعه‌ای از پاسخ‌های تقویت‌شده و بالقوه قابل بهبود که توسط LLM ایجاد می‌شود، افزایش داد. خروجی‌های نهایی با یکدیگر مقایسه می‌شوند و بحث‌ها در بخش ۵ انجام می‌شود. شکل ۲ اولین مورد از دو تصویر را نشان می‌دهد، با یک پاسخ تقویت‌شده ساخته شده با CoT (A1*) که به عنوان ورودی LLM برای ایجاد یک تصویر بهبود یافته عمل می‌کند. پاسخ (A2*). شکل ۳ تصویر دوم را نشان می دهد، که در آن یک پاسخ اصلی شباهتی به CoT دارد، اما همچنان با استفاده مورد نظر از CoT تقویت شده است، و یافته ها تأثیر اضافی رویکرد CoT را در کمک به بهبود ایده های موجود و حفظ توسعه نشان می دهد. ایده ها

۴٫۱٫ اولین تصویر از داده های تجربی

رشته کامل نشان داده شده در تصویر ۱ (شکل ۲) را می توان در شکل A4 پیوست A پیدا کرد. پاسخ تولید شده توسط LLM (A2*) یک پاسخ طولانی تر با جزئیات بیشتر از پاسخ اولیه انسانی (A2) است و کاملاً قابل مشاهده است. در زیر ارائه شده است.

یکی از مزیت‌های خوردن گوشت‌های گیاهی، پتانسیل آن برای داشتن اثرات زیست‌محیطی کمتر در مقایسه با گوشت‌های سنتی حیوانی است. گوشت‌های گیاهی اغلب با استفاده از منابع کمتر و تولید گازهای گلخانه‌ای کمتری نسبت به پرورش و فرآوری حیوانات برای گوشت تولید می‌شوند. این می تواند به کاهش ردپای کربن کلی مرتبط با تولید مواد غذایی کمک کند، علاوه بر این، گوشت های گیاهی می توانند طعم و بافتی مشابه با گوشت های سنتی داشته باشند، و آنها را به گزینه ای مناسب برای افرادی تبدیل می کند که می خواهند مصرف گوشت خود را برای سلامتی و اخلاقی کاهش دهند. یا دلایل زیست محیطی بدون دست کشیدن کامل از طعم ها و غذاهایی که از آنها لذت می برند.

۴٫۲٫ تصویر دوم از داده های تجربی

رشته کامل نشان داده شده در تصویر ۲ (شکل ۳) را می توان در شکل A5 پیوست A یافت. پاسخ تولید شده توسط LLM (A2*) همچنین پاسخی طولانی تر با جزئیات بیشتر از پاسخ تولید شده توسط انسان (A2) است. اولی به طور کامل در زیر ارائه شده است.

“مسلماً، ایجاد محیطی که در آن حیوانات و انسان ها بتوانند به طور هماهنگ همزیستی کنند، واقعاً امکان پذیر است، اما این امر مستلزم تلاش و توجه آگاهانه از سوی طرفین است. در اینجا یک راه برای دستیابی به این هدف وجود دارد: ترویج حفاظت از حیات وحش و احیای زیستگاه: با حفاظت و احیای زیستگاه های طبیعی، انسان ها می تواند فضا و منابع مورد نیاز حیوانات را برای رشد و نمو فراهم کند. از جمله انسان‌ها، ضمن به حداقل رساندن تعارض‌ها، افزایش آگاهی در مورد اهمیت تنوع زیستی و نقشی که هر گونه در اکوسیستم ایفا می‌کند، می‌تواند حس همدلی و درک بیشتری را در بین انسان‌ها ایجاد کند، مانند عدم تغذیه آنها یا تجاوز به قلمرو آنها، می تواند به کاهش تعاملات منفی کمک کند».

۵٫ بحث و محدودیت

تحریک CoT به عنوان یک جایگزین مناسب برای برانگیختن رفتار استدلال چند مرحله ای در LLM برای اهداف ایجاد دانش مورد بررسی قرار گرفته است. برای حوزه خاص استدلال عقل سلیم که با حوزه‌های ایجاد دانش و دانش‌سازی همسو است، یافته‌ها نشان می‌دهند که تمرکز فقط بر دستیابی به اهداف عقل سلیم نیست، بلکه به دست آوردن بهبود کیفیت محتوا و ایده‌های تولید شده توسط LLM است. افزایش تنوع ایده ها که به دانش آموزان اجازه می دهد کار خود را بهبود بخشند. این از یافته‌های ما مشهود است، و بحث زیر تفاوت‌های بین این دو تصویر را توضیح خواهد داد.

در تصویر اول، از یک سو، پاسخی که توسط دانش آموز ایجاد شده توسط انسان به عنوان پاسخی مستقیم می بینیم که ساده است و بحث بعدی را آغاز می کند. با این حال، کمبود محتوا و محتوایی در برانگیختن افکار عمیق‌تر است که ممکن است به دیگران در بهبود ایده‌هایشان کمک کند. از سوی دیگر، پاسخ تولید شده توسط LLM نه تنها پاسخی دقیق و دقیق‌تر است، بلکه از نمونه‌های CoT برای هدایت پاسخ و ارائه دلایلی در مورد اینکه چرا گوشت‌های گیاهی انتشار گازهای گلخانه‌ای کمتری تولید می‌کنند نیز استفاده می‌کند. LLM همچنین پیامدهای اضافی و توضیحات بیشتری ایجاد کرد، اگرچه اینها ضمانت نداشتند، اما احتمالاً این ویژگی نیز بود که LLM تصمیم گرفت در خروجی خود قرار دهد.

در تصویر دوم، زمانی که نمونه‌های اضافی با درخواست CoT در پاسخ اصلی A1 گنجانده شد، خروجی تولید شده توسط LLM تفاوت قابل‌توجهی را نشان می‌دهد که نمونه‌های CoT می‌توانند در تشویق LLM برای تولید خروجی بسیار متنوع‌تر و با کیفیت‌تر ایجاد کنند. علاوه بر ارائه توضیحات بیشتر برای پرداختن به این سوال، خروجی حاصل از ماهیت پیش‌بینی‌کننده‌تر و حتی تجویزی‌تر شد، با پیشنهاداتی که به نحوه آموزش مردم درباره رفتار مسئولانه در اطراف حیات وحش می‌تواند به کاهش تعاملات منفی کمک کند.

این مطالعه تنها دو تصویر از سایر تعاملات معتبری را که دانش‌آموزان در طول مطالعه ایجاد کردند، ارائه کرده است. آنچه نشان داده شد این است که ماهیت زبانی استدلال CoT آن را به طور کلی قابل اجرا می کند، مشابه آنچه وی و همکارانش. [۱۳] در نشان دادن قابلیت های استدلالی هوش مصنوعی مولد نشان داده شده است. با این حال، با اتخاذ استفاده از تحریک CoT به عنوان بخشی از ترکیب پاسخ‌های بهتر برای بهبود ایده‌ها و کار دانش‌آموزان، به طور بالقوه شاهد تنظیم مجدد تحولات برای مطابقت با نیازهای نوظهور دانش‌آموزان در یک جامعه دانش هستیم. [۱۷]. با این روند عمل، تحریک CoT می تواند فراتر از فرآیندهای استدلال اصلی برای ایجاد طیف گسترده تر و متنوع تری از پاسخ ها استفاده شود که دانش آموزان ممکن است بدون هوش مصنوعی مولد و برای ایجاد دانش و اهداف ساخت دانش قادر به ارائه آن نباشند.
مسلماً محدودیت هایی وجود دارد که ممکن است در حال حاضر به طور کامل قابل حل نباشد. برخی ممکن است احساس کنند که CoT قرار است فرآیندهای فکری استدلال‌های انسانی را تقلید کند، اما این هنوز قطعیت ندارد، زیرا شبکه‌های عصبی که در حال حاضر در LLM استفاده می‌شوند می‌توانند دانش کسب کنند اما ممکن است نتوانند به طور قابل اعتماد استدلال را انجام دهند. [۲۸]. از این گذشته، LLM ها با آموزش آنها بر روی مجموعه های بزرگی از داده ها ایجاد شدند تا پاسخ هایی شبیه به انسان شبیه به پرس و جوهای زبان طبیعی تولید کنند، بدون هیچ تضمینی برای مسیرهای استدلال درست، که ممکن است به طور بالقوه به پاسخ های صحیح و غلط منجر شود.

بعلاوه، اگرچه نمونه‌هایی از داده‌های گفتمان واقعی دانش‌آموز ارائه کرده‌ایم، بعید است که اکثر دانش‌آموزان بتوانند در هنگام اجرای چند شات از نمونه‌های CoT پرس و جو کنند، اما این امکان وجود دارد که به دانش‌آموزان بر این اساس در مورد نحوه استفاده از آن آموزش داده شود. LLM به شیوه ای مناسب و برای هدف مورد نظر. با این حال، این به این معنی است که استفاده از CoT برای افزایش پرسش‌های دانش‌آموزان ممکن است بسیار دشوار باشد و باید در این مرحله به صورت دستی انجام شود، در حالی که مقیاس‌بندی درخواست‌های CoT ممکن است نیاز به بلوغ فناوری یا تجدید نظر در مورد تعداد کمی داشته باشد. فرآیندهای شات در نهایت می تواند به تعمیم صفر شات تبدیل شود که می تواند به عنوان بخشی از یادگیری تقویتی عمیق انجام شود. آخرین، اما نه کم‌اهمیت، CoT به دلیل LLM‌ها می‌تواند مورد استفاده قرار گیرد و این امکان وجود دارد که استفاده از آن در حال حاضر در سایر برنامه‌های هم‌زمان که از مدل‌های کوچک‌تر استفاده می‌کنند به دلیل محدودیت هزینه و سایر منابع مادی، بازدارنده باشد.

۶٫ نتیجه گیری

این مطالعه چشم‌اندازی در مورد اینکه چگونه دانش‌آموزان و حتی مربیان می‌توانند از LLM برای حمایت از فرآیندهای ایجاد دانش و دانش‌سازی از طریق استفاده از نمونه‌های چندتایی افزوده شده به CoT بهره ببرند، ارائه کرده است. اگرچه درخواست‌ها به‌صورت دستی پیرامون پرسش‌های معتبر دانش‌آموزان ساخته شده‌اند، نتایج نشان می‌دهد که در این محیط‌های آموزشی معتبر نیز است که تحریک CoT پاسخ‌های بهبود یافته‌ای را ایجاد می‌کند که روشن‌تر از پاسخ‌های دانش‌آموزان است، که از نظر محتوا و دامنه محدود هستند.

به طور کلی، ممکن است، اما غیرمعمول است که برخی از دانش‌آموزان بتوانند سؤالاتی را انجام دهند که قبلاً شبیه به چند ضربه CoT است تا به یادگیری کمک کند. بنابراین، ما از طریق این مطالعه پیشنهاد می کنیم که رویکرد کلی استفاده از CoT برای پرس و جو می تواند بخشی از سواد لازم و داربست مورد نیاز برای نوشتن و ایجاد سوالاتی باشد که برای اهداف ایجاد دانش و دانش سازی حیاتی هستند.

مشارکت های نویسنده

مفهوم سازی، AVYL، CLT و SCT. مدیریت داده، AVYL و CLT. تجزیه و تحلیل رسمی، AVYL; بررسی، AVYL و CLT. روش شناسی، AVYL; منابع، AVYL و CLT. نرم افزار AVYL; اعتبارسنجی، AVYL، CLT و SCT. تجسم، AVYL; نوشتن – پیش نویس اصلی، AVYL; نوشتن-بررسی و ویرایش، AVYL، CLT و SCT همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و با آن موافقت کرده اند.

تامین مالی

این تحقیق هیچ بودجه خارجی دریافت نکرد.

بیانیه هیئت بررسی نهادی

این مطالعه مطابق با قانون حفاظت از داده‌های شخصی انجام شد و توسط هیئت بررسی نهادی دانشگاه فناوری نانیانگ (IRB-2019-10-034، تأیید شده اکتبر ۲۰۱۹) تأیید شد.

بیانیه رضایت آگاهانه

رضایت آگاهانه از همه افراد درگیر در مطالعه اخذ شد.

بیانیه در دسترس بودن داده ها

مجموعه داده های ارائه شده در این مقاله به دلیل قوانین مالکیت معنوی، حریم خصوصی و اخلاقی که توسط IRB دانشگاه تعیین شده است، به راحتی در دسترس نیستند. درخواست های دسترسی به مجموعه داده ها باید به نویسنده مربوطه ارسال شود.

قدردانی ها

نظرات بیان شده در این مقاله متعلق به نویسندگان است و لزوماً بیانگر دیدگاه های موسسه میزبان نیست. تیم تحقیق از مربیان و دانشجویان شرکت کننده در این مطالعه تشکر می کند.

تضاد منافع

نویسندگان هیچ تضاد منافعی را اعلام نمی کنند.

ضمیمه A

موارد زیر تصاویری از دستورات گزارش شده و مورد استفاده در این مقاله است که بر اساس ترتیب زمانی ذکر در چندین شکل ادغام شده است.

شکل A1.
پاسخ‌های LLM بر اساس شات صفر (بالا)، یک تیر (وسط) و چند تیر (پایین) برانگیختن

شکل A1.
پاسخ‌های LLM بر اساس شات صفر (بالا)، یک تیر (وسط) و چند تیر (پایین) برانگیختن

شکل A2.
خروجی LLM از وظیفه استدلال عامیانه.

شکل A2.
خروجی LLM از وظیفه استدلال عامیانه.

Ai 05 00069 g0a2
شکل A3.
مقایسه خروجی LLM با استفاده از دستور استاندارد (بالا(در مقابل درخواست CoT)پایین).

شکل A3.
مقایسه خروجی LLM با استفاده از دستور استاندارد (بالا(در مقابل درخواست CoT)پایین).

شما 05 00069 g0a3 دارید
شکل A4.
خروجی تولید شده توسط LLM تصویر ۱ پس از درخواست CoT در پاسخ اول افزوده شد.

شکل A4.
خروجی تولید شده توسط LLM تصویر ۱ پس از درخواست CoT در پاسخ اول افزوده شد.

شما 05 00069 g0a4 دارید
شکل A5.
خروجی دقیق‌تر تصویر ۲ که توسط LLM تولید می‌شود، پس از استفاده از نمونه‌های CoT اضافی در درخواست استفاده شد.

شکل A5.
خروجی دقیق‌تر تصویر ۲ که توسط LLM تولید می‌شود، پس از استفاده از نمونه‌های CoT اضافی در درخواست استفاده شد.

Ai 05 00069 g0a5

مراجع

  1. هادی، MU; قریشی، ر. شاه، ع. عرفان، م. ظفر، ع. شیخ، MB; اختر، ن. وو، جی. میرجلیلی، س. بررسی مدل‌های زبان بزرگ: کاربردها، چالش‌ها، محدودیت‌ها و کاربرد عملی. TechRxiv2023; پیش چاپ. [Google Scholar] [CrossRef]
  2. پااوولا، اس. لاسه، ال. کای، اچ. مدل‌های جوامع دانش نوآورانه و سه استعاره از یادگیری. کشیش. Res. 2004، ۷۴۵۵۷–۵۷۶٫ [Google Scholar] [CrossRef]
  3. بریتر، سی. مارلین، اس. یادگیری کار خلاقانه با دانش. در محیط‌های یادگیری قدرتمند: بازگشایی اجزا و ابعاد اساسی; De Erik, C., Lieven, V., Noel, E., Jeroen Van, M., Eds. چاپ پرگامون: آکسفورد، انگلستان، ۲۰۰۳; pp. 55-68. [Google Scholar]
  4. Scardamalia، M. CSILE/ انجمن دانش®. در آموزش و فناوری: یک دایره المعارف; ABC-CLIO: سانتا باربارا، کالیفرنیا، ایالات متحده آمریکا، ۲۰۰۴; ص ۱۸۳-۱۹۲٫ [Google Scholar]
  5. هاکاراینن، ک. پااوولا، اس. کانگاس، ک. Seitamaa-Hakkarainen، P. دیدگاه های اجتماعی در مورد یادگیری مشارکتی: به سوی ایجاد دانش مشارکتی. در کتابچه راهنمای بین المللی یادگیری مشارکتی; Cindy, H.-S., Clark, C., Carol, C., O'Donnell, A., Eds.; Routledge: نیویورک، نیویورک، ایالات متحده آمریکا، ۲۰۱۳; صص ۵۷-۷۳٫ [Google Scholar]
  6. لی، AVY؛ Tan, SC ایده های امیدوارکننده برای پیشرفت جمعی دانش جمعی با استفاده از تجزیه و تحلیل زمانی و تجزیه و تحلیل خوشه ای. J. یاد بگیرید. مقعدی ۲۰۱۷، ۴۷۶-۱۰۱٫ [Google Scholar] [CrossRef]
  7. لیو، وی. لیدیا، BC دستورالعمل های طراحی برای مهندسی سریع مدل های تولیدی متن به تصویر. در مجموعه مقالات کنفرانس CHI 2022 در مورد عوامل انسانی در سیستم های محاسباتی، نیواورلئان، لس آنجلس، ایالات متحده آمریکا، ۲۹ آوریل ۲۰۲۲؛ صص ۱-۲۳٫ [Google Scholar]
  8. Rae, JW; بورگو، اس. کای، تی. میلیکن، ک. هافمن، جی. آهنگ، اف. اصلانیدس، ج. هندرسون، اس. حلقه، آر. جوان، اس. و همکاران مقیاس‌بندی مدل‌های زبان: روش‌ها، تجزیه و تحلیل و بینش از آموزش گوفر. arXiv 2021arXiv:2112.11446. [Google Scholar] [CrossRef]
  9. کاب، ک. کوساراجو، وی. باواریا، م. چن، ام. جون، اچ. قیصر، ال. پلپرت، ام. توورک، جی. هیلتون، جی. ناکانو، آر. و همکاران آموزش تایید کننده ها برای حل مسائل ریاضی. arXiv 2021arXiv:2110.14168. [Google Scholar] [CrossRef]
  10. براون، تی. مان، بی. رایدر، ن. سببیه، م. کاپلان، جی دی. ذریوال، ص. Neelakantan، A. شیام، پ. ساستری، جی. آسکل، آ. و همکاران مدل‌های زبان، یادگیرنده‌های کمی هستند. Adv. عصبی Inf. فرآیند. سیستم ۲۰۲۰، ۳۳۱۸۷۷-۱۹۰۱٫ [Google Scholar]
  11. وایت، جی. فو، س. هایس، اس. سندبورن، م. اولیا، سی. گیلبرت، اچ. النشر، ع. اسپنسر اسمیت، جی. Schmidt, DC کاتالوگ الگوی سریع برای بهبود مهندسی سریع با chatgpt. arXiv 2023arXiv:2302.11382. [Google Scholar] [CrossRef]
  12. لیو، پی. یوان، دبلیو. فو، جی. جیانگ، ز. هایاشی، ح. Neubig, G. Pre-train, prompt, and predict: یک بررسی سیستماتیک از روش های تحریک در پردازش زبان طبیعی. کامپیوتر ACM. Surv. 2023، ۵۵۱-۳۵٫ [Google Scholar] [CrossRef]
  13. وی، جی. وانگ، ایکس. شوورمنز، دی. بوسما، م. شیا، اف. چی، ای. Le، QV; ژو، دی. برانگیختن زنجیره‌ای از فکر، استدلال را در مدل‌های زبانی بزرگ برمی‌انگیزد. Adv. عصبی Inf. فرآیند. سیستم ۲۰۲۲، ۳۵۲۴۸۲۴–۲۴۸۳۷٫ [Google Scholar]
  14. دوست خوب، من. پوگت آبادی، ج. میرزا، م. خو، بی. وارد-فارلی، دی. اوزایر، س. کورویل، آ. Bengio، Y. شبکه های متخاصم مولد. اشتراک. ACM 2020، ۶۳۱۳۹-۱۴۴٫ [Google Scholar] [CrossRef]
  15. Westerlund، M. ظهور فناوری دیپ فیک: یک بررسی. تکنولوژی نوآوری. مدیریت کشیش ۲۰۱۹، ۹۳۹-۵۲٫ [Google Scholar] [CrossRef]
  16. اوپارا، ای. Mfon-Ette ترزا، A. Aduke، TC ChatGPT برای آموزش، یادگیری و تحقیق: چشم‌اندازها و چالش‌ها. گلوب. آکادمی J. Humanit. Soc. علمی ۲۰۲۳، ۵۳۳-۴۰٫ [Google Scholar]
  17. لی، ا. Vwen، Y. پیشروی با هوش مصنوعی مولد برای یادگیری: پیمایش چالش‌ها و فرصت‌ها با ۵Ts و ۳Rs. آسیا پک J. Educ. 2024، ۴۴۸۱-۹۳٫ [Google Scholar] [CrossRef]
  18. لی، AVY؛ قهوهای مایل به زرد، SC; Teo، CL با استفاده از هوش مصنوعی مولد برای گفتمان دانشجویی و ایجاد دانش پایدار طراحی و تمرین می کند. یادگیری هوشمند. محیط زیست. ۲۰۲۳، ۱۰۵۹٫ [Google Scholar] [CrossRef]
  19. Halaweh, M. ChatGPT در آموزش: راهبردهایی برای اجرای مسئولانه. تحقیر کردن آموزش دهید تکنولوژی ۲۰۲۳، ۱۵ep421. [Google Scholar] [CrossRef] [PubMed]
  20. لستر، بی. الرفو، ر. ثابت، N. قدرت مقیاس برای تنظیم سریع پارامتر کارآمد. arXiv 2021arXiv:2104.08691. [Google Scholar] [CrossRef]
  21. ژانگ، ز. ژانگ، ا. لی، ام. اسمولا، الف. ایجاد زنجیره خودکار افکار در مدل های زبان بزرگ. arXiv 2022arXiv:2210.03493. [Google Scholar] [CrossRef]
  22. شوم، ک. دیائو، اس. Zhang, T. افزایش خودکار و انتخاب سریع با زنجیره ای از افکار از داده های برچسب دار. arXiv 2023arXiv:2302.12822. [Google Scholar] [CrossRef]
  23. تالمور، ا. هرزیگ، جی. لوری، ن. Berant, J. CommonsenseQA: پرسشی در پاسخ به چالشی که دانش عام را هدف قرار می دهد. arXiv 2018arXiv:1811.00937. [Google Scholar] [CrossRef]
  24. وانگ، ایکس. وی، جی. شوورمنز، دی. لی، کیو. چی، ای. نارنگ، س. خودسازگاری زنجیره استدلال فکری را در مدل های زبانی بهبود می بخشد. arXiv 2022arXiv:2203.11171. [Google Scholar] [CrossRef]
  25. ایوانز، جی. شهود و استدلال: دیدگاه دو فرآیندی. روانی شرکت ۲۰۱۰، ۲۱۳۱۳-۳۲۶٫ [Google Scholar] [CrossRef]
  26. قهوهای مایل به زرد، SC; چان، سی. Bielaczyc، K. ما، ال. اسکاردامالیا، م. بریتر، سی. ساخت دانش: همسویی آموزش با نیازهای ایجاد دانش در عصر دیجیتال. آموزش. تکنولوژی Res. توسعه دهنده ۲۰۲۱، ۶۹۲۲۴۳-۲۲۶۶٫ [Google Scholar] [CrossRef]
  27. اسکاردامالیا، ام. مسئولیت شناختی جمعی برای پیشرفت دانش. در آموزش لیبرال در یک جامعه دانش; دادگاه آزاد: شیکاگو، IL، ایالات متحده آمریکا، ۲۰۰۲; صص ۶۷-۹۸٫ [Google Scholar]
  28. لیو، ایکس. وو، زی. وو، ایکس. لو، پی. چانگ، KW; فنگ، ی. آیا lms قادر به استدلال آماری و علی مبتنی بر داده است؟ محک زدن استدلال کمی پیشرفته با داده ها arXiv 2024arXiv:2402.17644. [Google Scholar] [CrossRef]
شکل ۱٫
مقایسه پاسخ‌های A2 و A2*، که به ترتیب توسط انسان‌ها (مسیر سمت چپ) ارائه شده و توسط LLM با استفاده از نمونه‌های تقویت‌شده با درخواست چند شات CoT (مسیر راست) تولید شده‌اند.

شکل ۱٫
مقایسه پاسخ‌های A2 و A2*، که به ترتیب توسط انسان‌ها (مسیر سمت چپ) ارائه شده و توسط LLM با استفاده از نمونه‌های تقویت‌شده با درخواست چند شات CoT (مسیر راست) تولید شده‌اند.

شما 05 00069 g001 دارید
شکل ۲٫
تصویر ۱ که پاسخ‌های انسانی (A2) را با پاسخ LLM (A2*) مقایسه می‌کند که از پاسخ CoT افزوده شده (Italicized) (A1*) به عنوان ورودی ایجاد می‌شود.

شکل ۲٫
تصویر ۱ که پاسخ‌های انسانی (A2) را با پاسخ LLM (A2*) مقایسه می‌کند که از پاسخ CoT افزوده شده (Italicized) (A1*) به عنوان ورودی ایجاد می‌شود.

Ai 05 00069 g002
شکل ۳٫
تصویر ۲٫ نشانه‌های CoT در پاسخ اصلی (A1) اما هنوز تفاوت‌هایی بین پاسخ انسانی (A2) و پاسخ LLM (A2*) مشاهده می‌شود به دلیل استفاده از پاسخ CoT افزوده (مورب) (A1*) به عنوان ورودی

شکل ۳٫
تصویر ۲٫ نشانه‌های CoT در پاسخ اصلی (A1) اما هنوز تفاوت‌هایی بین پاسخ انسانی (A2) و پاسخ LLM (A2*) مشاهده می‌شود به دلیل استفاده از پاسخ CoT افزوده (مورب) (A1*) به عنوان ورودی

Ai 05 00069 g003
جدول ۱٫
نمونه هایی از درخواست صفر، تک شات و چند شات در قالب پرسش و پاسخ بر اساس موضوعاتی که دانش آموزان می پرسند (تصاویر ورودی ها و خروجی ها را می توان در شکل A1 پیوست A مشاهده کرد).
جدول ۱٫
نمونه هایی از درخواست صفر، تک شات و چند شات در قالب پرسش و پاسخ بر اساس موضوعاتی که دانش آموزان می پرسند (تصاویر ورودی ها و خروجی ها را می توان در شکل A1 پیوست A مشاهده کرد).
رویکردها قالب ورودی خروجی
ضربه صفر پاسخ درست یا غلط:
سوال: آیا بازیافت به تنهایی گرمایش جهانی را معکوس می کند؟
نادرست
تک شات

به کدام دستگاه پاسخ دهید:
سوال: کدام وسیله در یک بازه زمانی مشابه برق بیشتری مصرف می کند، لپ تاپ یا رومیزی؟
پاسخ: رومیزی
سوال: کدام وسیله در همان مدت زمان برق بیشتری مصرف می کند، آبگرمکن یا یخچال؟
آبگرمکن
چند شات





پاسخ ایده خوب یا بد:
سوال: آیا می‌توانیم لوازم خانگی را در حالت آماده‌به‌کار نگه داریم، وقتی از آنها استفاده نمی‌کنیم؟
پاسخ : فکر بد.
سوال: شاید در صورت تبدیل شدن به زباله های پلاستیکی در اقیانوس، کمتر از پلاستیک استفاده کنیم؟
پاسخ: ایده خوبی است.
سوال: آیا همه منابع انرژی تجدیدپذیر باید خورشیدی باشند؟
پاسخ : فکر بد.
سوال: آیا بهتر است برای کاهش انتشار گازهای گلخانه ای به خوردن سبزیجات بیشتر تشویق شود؟
ایده خوبیه
جدول ۲٫
مثالی از استدلال عقل سلیم با استفاده از LLM (تصویر صفحه ورودی و خروجی را می توان در شکل A2 پیوست A یافت).
جدول ۲٫
مثالی از استدلال عقل سلیم با استفاده از LLM (تصویر صفحه ورودی و خروجی را می توان در شکل A2 پیوست A یافت).
سوال: اگر جان بخواهد به جایی برود که از آب بازی لذت ببرد، کجا می رود؟ گزینه های پاسخ: (الف) آکواریوم (ب) اقیانوس (ج) حوضچه نزدیک (د) یک مخزن (ه) وان حمام او

جواب: ب) اقیانوس

جدول ۳٫
مقایسه اعلان استاندارد با درخواست زنجیره ای فکر (CoT) (تصاویر ورودی ها و خروجی ها را می توان در شکل A3 پیوست A یافت).
جدول ۳٫
مقایسه اعلان استاندارد با درخواست زنجیره ای فکر (CoT) (تصاویر ورودی ها و خروجی ها را می توان در شکل A3 پیوست A یافت).
رویکردها قالب ورودی خروجی
درخواست استاندارد

سوال: جان می خواهد از مکان هایی که کمتر شلوغ هستند لذت ببرد. او به کجا می تواند برود؟ گزینه های پاسخ: (الف) یک مرکز خرید (ب) یک پارک (ج) یک ایستگاه قطار (د) یک راهرو (ه) در کنار جاده
جواب: (ب) پارک
سوال: جان دوست دارد از مناطق شلوغ بازدید کند. او به کجا می تواند برود؟ گزینه های پاسخ: (الف) یک مرکز خرید (ب) یک پارک (ج) یک ایستگاه قطار (د) یک راهرو (ه) در کنار جاده
جواب: الف) مرکز خرید
درخواست CoT (مورب)

سوال: جان می خواهد از مکان هایی که کمتر شلوغ هستند لذت ببرد. او به کجا می تواند برود؟ گزینه های پاسخ: (الف) یک مرکز خرید (ب) یک پارک (ج) یک ایستگاه قطار (د) یک راهرو (ه) در کنار جاده
پاسخ: پاسخ باید جایی باشد که افراد کمتری داشته باشد. از بین گزینه های داده شده، یک پارک جمعیت کمتری دارد و از یک راهرو یا کنار جاده لذت بخش تر است. بنابراین پاسخ (ب) پارک است
سوال: جان دوست دارد از مناطق شلوغ بازدید کند. او به کجا می تواند برود؟ گزینه های پاسخ: (الف) یک مرکز خرید (ب) یک پارک (ج) یک ایستگاه قطار (د) یک راهرو (ه) در کنار جاده
پاسخ: پاسخ باید مکانی با افراد بیشتر باشد. از میان گزینه‌های ارائه شده، یک مرکز خرید، یک ایستگاه قطار، و احتمالاً یک پارک در زمان‌های اوج مصرف در مقایسه با یک راهرو یا کنار جاده، جمعیت بیشتری خواهد داشت. بنابراین، پاسخ می تواند (الف) یک مرکز خرید یا (ج) یک ایستگاه قطار باشد.

جدول ۴٫
چند نمونه تصویری که نشان می‌دهد چگونه می‌توانیم برانگیختگی زنجیره‌ای از فکر (مورب) را به سؤالات و پاسخ‌های موجود برای ایجاد دانش اضافه کنیم.

جدول ۴٫
چند نمونه تصویری که نشان می‌دهد چگونه می‌توانیم برانگیختگی زنجیره‌ای از فکر (مورب) را به سؤالات و پاسخ‌های موجود برای ایجاد دانش اضافه کنیم.

سوال ۱: اگر بخواهیم انتشار کربن را کاهش دهیم، چه کاری باید انجام دهیم؟ گزینه های پاسخ: (الف) استفاده از گاز طبیعی (ب) استفاده از سوخت های فسیلی (ج) با استفاده از انرژی باد (د) با استفاده از انرژی خورشیدی

پاسخ ۱: پاسخ باید قادر به کاهش انتشار کربن باشد. از میان گزینه های فوق، سوخت های فسیلی بیشترین انتشار کربن را دارند. بنابراین، پاسخ (ب) استفاده از سوخت‌های فسیلی است.

– پرسش و پاسخ جداگانه –

سوال ۲: کدام راه از سفر به مدرسه سازگارتر با محیط زیست و پایدار است؟ گزینه های پاسخ: (الف) با ماشین برقی شخصی (ب) با اتوبوس عمومی دیزلی (ج) با تاکسی برقی عمومی (د) با قطار برقی عمومی

پاسخ ۲: در پاسخ باید توجه داشت که حمل و نقل عمومی مقرون به صرفه تر از حمل و نقل خصوصی است و سپس اندازه صندلی حمل و نقل. از میان گزینه های فوق، حمل و نقل عمومی که وسیله نقلیه الکتریکی است سازگارتر با محیط زیست و پایدارتر است. بنابراین، پاسخ (د) توسط قطارهای برقی عمومی است.

سلب مسئولیت/یادداشت ناشر: اظهارات، نظرات و داده های موجود در همه نشریات صرفاً متعلق به نویسنده (ها) و مشارکت کننده (ها) است و نه MDPI و/یا ویرایشگر(ها). MDPI و/یا ویراستار(های) مسئولیت هرگونه آسیب به افراد یا دارایی ناشی از هر ایده، روش، دستورالعمل یا محصولات اشاره شده در محتوا را رد می کنند.


منبع: https://www.mdpi.com/2673-2688/5/3/69

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *