آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.
اواخر شب با یک نوزاد تازه متولد شده می تواند منجر به پیشرفت های غیرمنتظره شود. این مورد برای توسعه دهنده OthersideAI جاش بیکت بود، که ایده ای برای یک پیشگامانه جدید داشت. “چارچوب کامپیوتری خود کار” در حالی که نیمه شب به دخترش غذا می داد.
همانطور که بیکت به VentureBeat توضیح داد، “من واقعاً از زمان با دخترم که اکنون چهار هفته است لذت می برم و درس های جدید زیادی در مورد پدر شدن و همه چیزها داشتم. اما کمی هم وقت داشتم و این این ایده به ذهنم خطور کرد زیرا دموهای مختلفی از آن را دیدم دید GPT-4. چیزی که در حال حاضر روی آن کار می کنیم در واقع می تواند با دید GPT-4 اتفاق بیفتد.
بیکت در حالی که دخترش در یک دستش قرار داشت، چارچوب اصلی را روی کامپیوترش ترسیم کرد. “من به تازگی یک پیاده سازی اولیه را پیدا کردم … در کلیک کردن روی ماوس به روش صحیح فوق العاده خوب نیست. اما کاری که ما انجام می دهیم این است که مشکل را تعریف کنیم: ما باید بفهمیم که چگونه با یک کامپیوتر کار کنیم.”
وقتی مت شومر، یکی از بنیانگذاران و مدیرعامل OthersideAI چارچوب جدید را دید، پتانسیل فوق العاده آن را تشخیص داد. همانطور که شومر به VentureBeat گفت: “این یک نقطه عطف در مسیر رسیدن به معادل یک ماشین خودران اما برای یک کامپیوتر است. ما اکنون سنسورها را داریم. ما سیستم های LIDAR را داریم. بعد، هوشمندی را ایجاد می کنیم.
هوش مصنوعی که تصمیم میگیرد کجا و روی رایانه شخصی خود کلیک کنید
همانطور که Bickett توضیح داد، این فریم ورک به هوش مصنوعی اجازه میدهد هم موس را در جایی که کلیک میکند و هم تمام فعالهای صفحه کلید را کنترل کند. این مانند عاملی مانند autoGPT است، با این تفاوت که مبتنی بر متن نیست. این چارچوب مبتنی بر دید است، بنابراین از رایانه عکس میگیرد و سپس دقیقاً مانند یک شخص، کلیک ماوس و صفحه کلید را تعیین می کند.”
شومر توضیح داد که چگونه این چارچوب پیشرفت بزرگی را نسبت به رویکردهای قبلی که صرفاً به APIها متکی بودند نشان می دهد.
بسیاری از کارهایی که مردم روی رایانه انجام می دهند، درست است، شما واقعاً نمی توانید با API ها انجام دهید، به همین دلیل است که بسیاری از افراد دیگر به این مشکل نزدیک می شوند. [when] آنها می خواهند یک عامل بسازند. آنها آن را در بالای APIهای در دسترس عموم برای این سرویس ساخته اند، اما این به همه چیز تعمیم نمی یابد.” همانطور که شومر اظهار داشت، “اگر واقعاً می خواهید چیزی را حل کنید که مستقل باشد. [and] واقعاً می تواند به ما کمک کند یا کارهای بیشتری انجام دهیم. شما باید به آن اجازه دهید مانند یک شخص کار کند زیرا دنیا برای مردم ساخته شده است.
این فریم ورک اسکرینشاتها را بهعنوان ورودی میگیرد و کلیکهای ماوس و دستورات صفحهکلید را، درست مانند یک انسان، خروجی میدهد. اما همانطور که بیکت و شومر هر دو اذعان کردند، پتانسیل واقعی در چارچوب سبک وزن نیست، بلکه در بینایی کامپیوتری پیشرفته و مدلهای استدلالی است که میتوان به آن متصل شد. بیکت میگوید: «فریمورک مانند plug and play خواهد بود، شما فقط مدل بهتری را وصل کنید و بهتر میشود.
چگونه عوامل هوش مصنوعی محاسبات را همانطور که می دانیم تغییر می دهند
وقتی از VentureBeat در مورد پیامدهای آینده سؤال شد، شومر چشم انداز جسورانه ای را ترسیم کرد: “وقتی این چیز به اندازه کافی قابل اعتماد باشد، کامپیوتر شما خواهد بود، رابط شما با دنیای دیجیتال خواهد بود.”
با وجود چارچوب کامپیوتری خودکار، مدلهای پیشرفته هوش مصنوعی میتوانند یاد بگیرند که تمام تعاملات رایانهای را فقط از طریق دستورات مکالمه کنترل کنند.
همانطور که شومر پیش بینی کرد، انواع مختلفی از مدل های تخصصی عامل کامپیوتری احتمالاً برای انجام وظایف مختلف ظاهر می شوند.
برخی ممکن است برای کارهای ساده تر روی سرعت تمرکز کنند، در حالی که برخی دیگر در استدلال پیچیده برتری دارند. همچنین ممکن است مدلها برای موارد استفاده سازمانی در مقابل مصرفکننده متفاوت باشد. اما هدف کلی، به گفته شومر، توسعه عواملی است که دنیایی را قادر میسازند «که در آن مردم بتوانند بگویند، این همان کاری است که من از انجام آن متنفرم». حالا دیگر لازم نیست این کار را انجام دهم. و ما میخواهیم آنقدر آسان کنیم که کسی که از ابتدا به سختی میتواند از کامپیوتر استفاده کند، بتواند این کار را انجام دهد.”
منبع باز برای توسعه سوخت
Bickett معتقد است ماهیت منبع باز این چارچوب پیشرفت را تسریع خواهد کرد و به توسعه دهندگان در سراسر جهان اجازه می دهد تا با برنامه های جدید آزمایش کنند. شومر موافقت کرد که “جا برای تعداد زیادی از بازیکنان در این فضا وجود دارد … طیف وسیعی از ارائه دهندگان مدل.” طیف وسیعی از برنامه های کاربردی. و فضاهای زیادی در این صنعت برای ایجاد کسب و کارهای واقعاً بزرگ وجود خواهد داشت.»
در حالی که بیکت و شومر پتانسیل عظیمی را می بینند، تحقق چشم انداز عوامل کامپیوتری واقعاً هوشمند به منابع عظیم و نوآوری مداوم نیاز دارد.
برای این منظور، شرکت تحقیقاتی هوش مصنوعی Imbue، که قبلاً به عنوان Generally Intelligent شناخته می شد، اخیراً ایمن شد شراکت ۱۵۰ میلیون دلاری با Dell برای ساختن یک پلتفرم آموزشی قدرتمند هوش مصنوعی.
خوشه عظیم از حدود ۱۰۰۰۰ پردازنده گرافیکی Nvidia H100 این امکان را به شما می دهد برای توسعه مدلهای پایه جدید تسخیر کنید به طور خاص برای توانایی های استدلال بهینه شده است، تمرکز اصلی کار آنها. همانطور که یکی از بنیانگذاران و مدیر عامل شرکت Imbue Kanjun Qiu اشاره کرد، “استدلال مانع اصلی برای عواملی است که واقعا خوب کار می کنند.”
Imbue معتقد است که استدلال قوی برای توسعه عوامل هوش مصنوعی واقعاً مؤثر بسیار مهم است، زیرا به ماشینها اجازه میدهد تا با عدم اطمینان، رویکردها را تطبیق دهند، اطلاعات جدید را جمعآوری کنند، تصمیمهای پیچیده بگیرند و با پیچیدگیهای دنیای واقعی دست و پنجه نرم کنند – تواناییهای حیاتی برای عملکرد مستقل فراتر از وظایف محدود.
این شرکت یک روش “پشته کامل” را اتخاذ می کند که شامل آموزش مدل پایه بهینه، نمونه سازی عامل آزمایشی و رابط، ساخت ابزار قوی و تحقیقات نظری هوش مصنوعی است – با هدف ارتقاء درک عملی و اساسی یادگیری عمیق با هدف مهندسی هوش مصنوعی. استدلال در سطح انسان و در نهایت هوش عمومی مصنوعی..
در حالی که چارچوب کامپیوتری خودکار فقط اولین قدم است، بیکت و شومر آن را آغازگر عصر جدیدی میدانند که در آن عوامل پیشرفته هوش مصنوعی جایگزین رابطهای محاسباتی انسانی میشوند. شبهای آخر ممکن است ایدههای تغییر پارادایم را ارائه دهند، اما برای تحقق بخشیدن به دیدگاه کامل رایانههایی که فقط از طریق زبان معمولی کار میکنند – برای هر کسی، در هر کجا، کار متمرکزی لازم است.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/the-self-operating-computer-emerges/