سرعت نوآوری های تکنولوژیک در سال گذشته شتاب بیشتری گرفته است که به طور چشمگیری در زمینه هوش مصنوعی افزایش یافته است. و در سال 2024، هیچ مکانی بهتر از تحقیقات NVIDIA برای مشارکت در این پیشرفتها وجود ندارد.
تحقیقات انویدیا متشکل از صدها فرد بسیار باهوش است که مرزهای دانش را نه تنها در هوش مصنوعی، بلکه در بسیاری از زمینههای فناوری در پیش میگیرند.
سال گذشته، NVIDIA Research پایه و اساس پیشرفتهای آینده در عملکرد GPU را از طریق اکتشافات تحقیقاتی کلیدی در مدارها، معماری حافظه و محاسبات پراکنده ایجاد کرد. اختراع فناوریهای گرافیکی جدید این تیم همچنان به افزایش سطح برای مشاهده بلادرنگ ادامه میدهد. ما روشهای جدیدی را برای بهبود کارایی هوش مصنوعی توسعه دادهایم – که به انرژی کمتری نیاز دارد، چرخههای گرافیکی کمتری را میگیرد و نتایج بهتری ارائه میدهد.
اما هیجان انگیزترین تحولات امسال در زمینه هوش مصنوعی مولد بوده است.
ما اکنون می توانیم نه تنها تصاویر و متن، بلکه مدل های سه بعدی، موسیقی و صداها را نیز ایجاد کنیم. ما همچنین روی ایجاد کنترل بهتر بر آنچه ایجاد می شود کار می کنیم: ایجاد حرکت واقعی انسان و ایجاد توالی هایی از تصاویر با مضامین ثابت.
استفاده از هوش مصنوعی مولد در علم منجر به پیش بینی های آب و هوای بسیار دقیقی شده است که از مدل های آب و هوای عددی سنتی دقیق تر هستند. مدلهای هوش مصنوعی به ما این توانایی را دادهاند که به طور دقیق نحوه واکنش سطح گلوکز خون به غذاهای مختلف را پیشبینی کنیم. هوش مصنوعی مولد تجسم یافته برای توسعه وسایل نقلیه خودران و روبات ها استفاده می شود.
و این فقط امسال بود. آنچه در ادامه میآید، بررسی عمیقتر برخی از بزرگترین کارهای هوش مصنوعی مولد تحقیقات انویدیا در سال 2024 است. البته، ما همچنان به توسعه مدلها و رویکردهای جدید هوش مصنوعی ادامه میدهیم و انتظار نتایج هیجانانگیزتری را در سال آینده داریم.
ConsiStory: تصاویر تولید شده توسط هوش مصنوعی با انرژی شخصیت اصلی
ConsiStory، همکاری بین محققان NVIDIA و دانشگاه تلآویو، ایجاد تصاویر متعدد با یک شخصیت اصلی ثابت را آسان میکند – یک قابلیت کلیدی برای موارد استفاده داستانگویی مانند ترسیم کمیک یا توسعه استوریبرد.
رویکرد محققان تکنیکی به نام توجه مشترک مبتنی بر موضوع را معرفی کرد که زمان لازم برای ایجاد تصاویر ثابت را از 13 دقیقه به حدود 30 ثانیه کاهش می دهد.
مقاله Consistory را بخوانید.
Edify 3D: هوش مصنوعی مولد وارد بعد جدیدی می شود
NVIDIA Edify 3D پلتفرمی است که توسعه دهندگان و سازندگان محتوا را قادر می سازد تا به سرعت اشیاء سه بعدی ایجاد کنند که بتوان از آنها برای نمونه سازی ایده ها و پر کردن جهان های مجازی استفاده کرد.
Edify 3D به سازندگان کمک میکند تا با استفاده از داراییهای تولید شده توسط هوش مصنوعی، به سرعت به محیطهای فراگیر فکر، برنامهریزی و تجسم کنند. سازندگان مبتدی و با تجربه می توانند از پیام های متنی و تصویری برای استفاده از این مدل استفاده کنند، که اکنون بخشی از معماری چند وجهی NVIDIA Edify برای توسعه هوش مصنوعی مولد بصری است.
مقاله Edify 3D را بخوانید و ویدیو را در YouTube تماشا کنید.
Fugatto: یک دستگاه صوتی انعطاف پذیر و مجهز به هوش مصنوعی برای موسیقی، صداها و موارد دیگر
تیمی از محققان NVIDIA اخیراً از Fugatto رونمایی کردند، یک مدل پایه هوش مصنوعی که میتواند هر ترکیبی از موسیقی، صداها و صداها را بر اساس متن یا پیامهای صوتی ایجاد یا تغییر دهد.
به عنوان مثال، این مدل میتواند قطعات موسیقی را بر اساس پیامهای متنی تولید کند، ابزارهایی را از آهنگهای موجود اضافه یا حذف کند، لحن یا احساس را در یک ضبط صوتی تغییر دهد، یا صداهای کاملاً جدیدی ایجاد کند. این می تواند توسط تولید کنندگان موسیقی، آژانس های تبلیغاتی، توسعه دهندگان بازی های ویدیویی، یا سازندگان ابزارهای یادگیری زبان استفاده شود.
مقاله فوگاتو را بخوانید.
GluFormer: AI سطح قند خون را چهار سال بعد پیش بینی می کند
محققان مؤسسه علوم Weizmann، استارتآپ Pheno.AI تل آویو و NVIDIA توسعه GluFormer را رهبری کردند، یک مدل هوش مصنوعی که میتواند سطح گلوکز آینده فرد و سایر معیارهای سلامتی را بر اساس دادههای پایش گلوکز گذشته پیشبینی کند.
محققان نشان دادند که پس از افزودن دادههای دریافت رژیم غذایی به مدل، GluFormer همچنین میتواند پیشبینی کند که سطح گلوکز فرد به غذاهای خاص و تغییرات رژیم غذایی چگونه پاسخ میدهد و تغذیه دقیق را ممکن میسازد. تیم تحقیقاتی GluFormer را در 15 مجموعه داده دیگر تأیید کرد و دریافت که برای پیشبینی نتایج سلامت برای گروههای دیگر، از جمله افراد مبتلا به پیش دیابت، دیابت نوع 1 و 2، دیابت بارداری و چاقی، به خوبی تعمیم مییابد.
مقاله GluFormer را بخوانید.
LATTE3D: امکان ایجاد تقریباً واقعی، از متن تا سه بعدی را فراهم می کند
یکی دیگر از ژنراتورهای سه بعدی که امسال توسط NVIDIA Research منتشر شد، LATTE3D است که پیام های متنی را در یک ثانیه به نمایش های سه بعدی تبدیل می کند – مانند یک چاپگر سه بعدی مجازی سریع. فیگورهای ایجاد شده در یک فرمت رایج مورد استفاده در برنامه های ارائه استاندارد طراحی شده اند و می توانند به راحتی در محیط های مجازی برای توسعه بازی های ویدیویی، کمپین های تبلیغاتی، پروژه های طراحی یا فضاهای آموزشی مجازی برای روبات ها ارائه شوند.
مقاله LATTE3D را بخوانید.
MaskedMimic: بازسازی حرکت واقعی ربات های انسان نما
برای پیشبرد توسعه رباتهای انساننما، محققان NVIDIA MaskedMimic را معرفی کردند، یک چارچوب هوش مصنوعی که نقاشی (فرآیند بازسازی دادههای کامل از یک نمای ناقص یا پوشیده) را برای توصیف حرکت اعمال میکند.
با توجه به اطلاعات جزئی، مانند توصیف متنی حرکت، یا دادههای موقعیت سر و دست از هدست واقعیت مجازی، MaskedMimic میتواند جاهای خالی را برای استنباط حرکت تمام بدن پر کند. این بخشی از پروژه NVIDIA GR00T است، یک ابتکار تحقیقاتی برای تسریع توسعه ربات انسان نما.
مقاله MaskedMimic را بخوانید.
StormCast: پیش بینی آب و هوا و شبیه سازی آب و هوا پیشرفته
در علم آب و هوا، تحقیقات NVIDIA StormCast را معرفی کرد، یک مدل هوش مصنوعی مولد برای شبیهسازی دینامیک اتمسفر. در حالی که سایر مدل های یادگیری ماشینی آموزش دیده بر روی داده های جهانی دارای وضوح مکانی حدود 30 کیلومتر و وضوح زمانی تا 6 ساعت هستند، StormCast به مقیاس 3 کیلومتر در ساعت دست می یابد.
محققان StormCast را بر اساس دادههای آب و هوایی NOAA از مرکز ایالات متحده برای تقریباً سه سال و نیم آموزش دادند. هنگامی که با رادارهای بارش استفاده می شود، StormCast پیش بینی هایی را برای دوره های زمانی تا شش ساعت ارائه می دهد و 10٪ دقیق تر از ایالات متحده است. مدل پیش بینی آب و هوای منطقه ای ۳ کیلومتری پیشرفته سازمان ملی اقیانوسی و جوی.
مقاله StormCast را که با همکاری محققان آزمایشگاه ملی لارنس برکلی و دانشگاه واشنگتن نوشته شده است، بخوانید.
تحقیقات انویدیا در هوش مصنوعی، وسایل نقلیه خودران و روباتیک رکوردها را شکست
تا سال 2024، مدلهای ایجاد شده در NVIDIA Research رکوردهایی را در معیارهای آموزش و استنتاج هوش مصنوعی، بهینهسازی مسیر، رانندگی خودکار و موارد دیگر ثبت خواهند کرد.
NVIDIA cuOpt، یک میکروسرویس بهینهسازی هوش مصنوعی که در بهینهسازی لجستیک استفاده میشود، دارای 23 معیار جهانی است. پلتفرم NVIDIA Blackwell عملکردی در سطح جهانی در برابر معیار صنعت MLPerf برای آموزش و استنتاج هوش مصنوعی نشان داده است.
در زمینه وسایل نقلیه خودران، Hydra-MDP، یک چارچوب رانندگی خودکار سرتاسر از تحقیقات NVIDIA، در چالش بزرگ رانندگی خودکار CVPR 2024 مقام اول را در مسیر رانندگی سرتاسر مقیاس بزرگ به دست آورد.
در رباتیک، FoundationPose، یک مدل پایه یکپارچه برای تخمین و ردیابی وضعیت جسم 6 بعدی، رتبه اول را در جدول امتیازات BOP برای تخمین حالت مبتنی بر مدل اجسام نادیده گرفت.
بیشتر بدانید تحقیقات انویدیاکه شامل صدها دانشمند و مهندس در سراسر جهان است. تیم های تحقیقاتی انویدیا بر موضوعاتی از جمله هوش مصنوعی، گرافیک کامپیوتری، بینایی کامپیوتر، خودروهای خودران و روباتیک تمرکز دارند.
منبع: https://blogs.nvidia.com/blog/ai-research-2024/
تحریریه تی 20 بازی