در چشم انداز هوش مصنوعی که به سرعت در حال تحول است، توسعه مدل هایی که می توانند به طور دقیق نتایج را در محیط های واقعی فیزیکی شبیه سازی و پیش بینی کنند تا نسل بعدی سیستم های هوش مصنوعی فیزیکی را فعال کنند، اهمیت فزاینده ای پیدا می کند.
Ming-Yu Liu، معاون تحقیقات NVIDIA و IEEE Fellow، به پادکست NVIDIA AI میپیوندد تا در مورد اهمیت مدلهای بنیاد جهانی (WFM) – شبکههای عصبی قدرتمندی که میتوانند محیطهای فیزیکی را شبیهسازی کنند، صحبت کند. WFMها میتوانند ویدیوهای دقیقی را از دادههای ورودی متن یا تصویر ایجاد کنند و با ترکیب وضعیت فعلی آن (تصویر یا ویدیو) با اقدامات (مانند پیامها یا سیگنالهای کنترل) چگونگی تکامل یک صحنه را پیشبینی کنند.
لیو گفت: «مدل های پایه جهانی برای توسعه دهندگان هوش مصنوعی فیزیکی مهم هستند. آنها می توانند محیط های مختلف زیادی را تصور کنند و می توانند آینده را شبیه سازی کنند، بنابراین ما می توانیم بر اساس این شبیه سازی ها تصمیمات خوبی بگیریم.
این امر به ویژه برای سیستمهای هوش مصنوعی فیزیکی، مانند رباتها و خودروهای خودران، که باید به طور ایمن و کارآمد با دنیای واقعی تعامل داشته باشند، مهم است.
چرا مدل های سازمانی جهانی مهم هستند؟
ساخت مدلهای جهان اغلب به حجم عظیمی از دادهها نیاز دارد که جمعآوری آنها میتواند دشوار و پرهزینه باشد. WFM ها می توانند داده های مصنوعی تولید کنند و یک مجموعه داده غنی و متنوع را ارائه دهند که روند آموزش را بهبود می بخشد.
علاوه بر این، آموزش و آزمایش سیستمهای هوش مصنوعی فیزیکی در دنیای واقعی میتواند منابع فشرده باشد. WFM ها محیط های مجازی سه بعدی را فراهم می کنند که در آن توسعه دهندگان می توانند این سیستم ها را در یک محیط کنترل شده بدون خطرات و هزینه های مرتبط با آزمایش های دنیای واقعی شبیه سازی و آزمایش کنند.
دسترسی آزاد به مدل های سازمانی جهانی
در نمایشگاه CES، NVIDIA NVIDIA Cosmos را معرفی کرد، پلتفرمی از WFM های مولد که توسعه سیستم های فیزیکی هوش مصنوعی مانند ربات ها و ماشین های خودران را تسریع می بخشد.
این پلتفرم به گونه ای طراحی شده است که باز و در دسترس باشد و شامل WFM های از پیش آموزش دیده مبتنی بر معماری های انتشار خودکار و رگرسیون، همراه با توکن هایی است که می توانند ویدیوها را به توکن های مدل ترانسفورماتور فشرده کنند.
لیو توضیح داد که با این مدلهای باز، شرکتها و توسعهدهندگان تمام اجزای مورد نیاز برای ساخت مدلهای در مقیاس بزرگ را دارند. پلتفرم باز همچنین به تیمها انعطافپذیری میدهد تا گزینههای مختلف برای آموزش و تنظیم دقیق مدلها را بررسی کنند یا مدلهای خود را بر اساس نیازهای خاص ایجاد کنند.
افزایش گردش کار هوش مصنوعی در سراسر صنایع
انتظار می رود WFM ها گردش کار و توسعه هوش مصنوعی را در صنایع مختلف افزایش دهند. لیو تأثیرات بزرگی را در دو زمینه می بیند:
لیو گفت: «صنعت خودروهای خودران و صنعت رباتیک از توسعه مدلهای جهانی سود زیادی خواهند برد. “(WFMs) میتوانند محیطهای مختلفی را شبیهسازی کنند که داشتن آنها در دنیای واقعی دشوار است، تا مطمئن شوند که عامل مطابق با آن رفتار میکند.”
برای خودروهای خودران، این مدل ها می توانند محیط هایی را شبیه سازی کنند که امکان تست و بهینه سازی جامع را فراهم می کند. به عنوان مثال، یک خودروی خودران را می توان در شرایط آب و هوایی مختلف و سناریوهای ترافیکی آزمایش کرد تا از عملکرد ایمن و کارآمد آن قبل از استقرار در جاده ها اطمینان حاصل شود.
در رباتیک، WFMها میتوانند رفتار سیستمهای رباتیک را در محیطهای مختلف شبیهسازی کنند و آنها را تأیید کنند تا مطمئن شوند که وظایف را به طور ایمن و کارآمد قبل از استقرار انجام میدهند.
NVIDIA با شرکتهایی مانند 1X، Huobi و XPENG برای کمک به رفع چالشهای توسعه هوش مصنوعی فیزیکی و پیشرفت سیستمهایشان همکاری میکند.
لیو گفت: “ما هنوز در مراحل اولیه توسعه مدل بنیاد جهانی هستیم – مفید است، اما ما باید آن را مفیدتر کنیم.” ما همچنین باید مطالعه کنیم که چگونه این مدلهای جهانی را بهتر در سیستمهای هوش مصنوعی فیزیکی ادغام کنیم، به گونهای که واقعاً بتواند برای آنها مفید باشد.»
با مینگ یو لیو به پادکست گوش دهید یا متن را بخوانید.
با تماشای سخنرانی افتتاحیه CES توسط جنسن هوانگ، بنیانگذار و مدیر عامل NVIDIA و همچنین ملحق شدن، درباره NVIDIA Cosmos و آخرین اطلاعیه های هوش مصنوعی و رباتیک مولد بیشتر بدانید. جلسات NVIDIA در نمایشگاه.
منبع: https://blogs.nvidia.com/blog/world-foundation-models-advance-physical-ai/
تحریریه تی 20 بازی