تحقیق هوش مصنوعی در شبیه سازی سه بعدی، علم آب و هوا و مهندسی صدا

تحقیق هوش مصنوعی در شبیه سازی سه بعدی، علم آب و هوا و مهندسی صدا

سرعت نوآوری های تکنولوژیک در سال گذشته شتاب بیشتری گرفته است که به طور چشمگیری در زمینه هوش مصنوعی افزایش یافته است. و در سال 2024، هیچ مکانی بهتر از تحقیقات NVIDIA برای مشارکت در این پیشرفت‌ها وجود ندارد.

تحقیقات انویدیا متشکل از صدها فرد بسیار باهوش است که مرزهای دانش را نه تنها در هوش مصنوعی، بلکه در بسیاری از زمینه‌های فناوری در پیش می‌گیرند.

سال گذشته، NVIDIA Research پایه و اساس پیشرفت‌های آینده در عملکرد GPU را از طریق اکتشافات تحقیقاتی کلیدی در مدارها، معماری حافظه و محاسبات پراکنده ایجاد کرد. اختراع فناوری‌های گرافیکی جدید این تیم همچنان به افزایش سطح برای مشاهده بلادرنگ ادامه می‌دهد. ما روش‌های جدیدی را برای بهبود کارایی هوش مصنوعی توسعه داده‌ایم – که به انرژی کمتری نیاز دارد، چرخه‌های گرافیکی کمتری را می‌گیرد و نتایج بهتری ارائه می‌دهد.

اما هیجان انگیزترین تحولات امسال در زمینه هوش مصنوعی مولد بوده است.

ما اکنون می توانیم نه تنها تصاویر و متن، بلکه مدل های سه بعدی، موسیقی و صداها را نیز ایجاد کنیم. ما همچنین روی ایجاد کنترل بهتر بر آنچه ایجاد می شود کار می کنیم: ایجاد حرکت واقعی انسان و ایجاد توالی هایی از تصاویر با مضامین ثابت.

استفاده از هوش مصنوعی مولد در علم منجر به پیش بینی های آب و هوای بسیار دقیقی شده است که از مدل های آب و هوای عددی سنتی دقیق تر هستند. مدل‌های هوش مصنوعی به ما این توانایی را داده‌اند که به طور دقیق نحوه واکنش سطح گلوکز خون به غذاهای مختلف را پیش‌بینی کنیم. هوش مصنوعی مولد تجسم یافته برای توسعه وسایل نقلیه خودران و روبات ها استفاده می شود.

و این فقط امسال بود. آنچه در ادامه می‌آید، بررسی عمیق‌تر برخی از بزرگترین کارهای هوش مصنوعی مولد تحقیقات انویدیا در سال 2024 است. البته، ما همچنان به توسعه مدل‌ها و رویکردهای جدید هوش مصنوعی ادامه می‌دهیم و انتظار نتایج هیجان‌انگیزتری را در سال آینده داریم.

ConsiStory: تصاویر تولید شده توسط هوش مصنوعی با انرژی شخصیت اصلی

ConsiStory، همکاری بین محققان NVIDIA و دانشگاه تل‌آویو، ایجاد تصاویر متعدد با یک شخصیت اصلی ثابت را آسان می‌کند – یک قابلیت کلیدی برای موارد استفاده داستان‌گویی مانند ترسیم کمیک یا توسعه استوری‌برد.

رویکرد محققان تکنیکی به نام توجه مشترک مبتنی بر موضوع را معرفی کرد که زمان لازم برای ایجاد تصاویر ثابت را از 13 دقیقه به حدود 30 ثانیه کاهش می دهد.

مقاله Consistory را بخوانید.

تابلوهایی از چندین تصویر که توسط هوش مصنوعی تولید شده و دارای یک شخصیت است
ConsiStory می‌تواند مجموعه‌ای از تصاویر را ایجاد کند که دارای همان شخصیت هستند.

Edify 3D: هوش مصنوعی مولد وارد بعد جدیدی می شود

NVIDIA Edify 3D پلتفرمی است که توسعه دهندگان و سازندگان محتوا را قادر می سازد تا به سرعت اشیاء سه بعدی ایجاد کنند که بتوان از آنها برای نمونه سازی ایده ها و پر کردن جهان های مجازی استفاده کرد.

Edify 3D به سازندگان کمک می‌کند تا با استفاده از دارایی‌های تولید شده توسط هوش مصنوعی، به سرعت به محیط‌های فراگیر فکر، برنامه‌ریزی و تجسم کنند. سازندگان مبتدی و با تجربه می توانند از پیام های متنی و تصویری برای استفاده از این مدل استفاده کنند، که اکنون بخشی از معماری چند وجهی NVIDIA Edify برای توسعه هوش مصنوعی مولد بصری است.

مقاله Edify 3D را بخوانید و ویدیو را در YouTube تماشا کنید.

Fugatto: یک دستگاه صوتی انعطاف پذیر و مجهز به هوش مصنوعی برای موسیقی، صداها و موارد دیگر

تیمی از محققان NVIDIA اخیراً از Fugatto رونمایی کردند، یک مدل پایه هوش مصنوعی که می‌تواند هر ترکیبی از موسیقی، صداها و صداها را بر اساس متن یا پیام‌های صوتی ایجاد یا تغییر دهد.

به عنوان مثال، این مدل می‌تواند قطعات موسیقی را بر اساس پیام‌های متنی تولید کند، ابزارهایی را از آهنگ‌های موجود اضافه یا حذف کند، لحن یا احساس را در یک ضبط صوتی تغییر دهد، یا صداهای کاملاً جدیدی ایجاد کند. این می تواند توسط تولید کنندگان موسیقی، آژانس های تبلیغاتی، توسعه دهندگان بازی های ویدیویی، یا سازندگان ابزارهای یادگیری زبان استفاده شود.

مقاله فوگاتو را بخوانید.

GluFormer: AI سطح قند خون را چهار سال بعد پیش بینی می کند

محققان مؤسسه علوم Weizmann، استارت‌آپ Pheno.AI تل آویو و NVIDIA توسعه GluFormer را رهبری کردند، یک مدل هوش مصنوعی که می‌تواند سطح گلوکز آینده فرد و سایر معیارهای سلامتی را بر اساس داده‌های پایش گلوکز گذشته پیش‌بینی کند.

محققان نشان دادند که پس از افزودن داده‌های دریافت رژیم غذایی به مدل، GluFormer همچنین می‌تواند پیش‌بینی کند که سطح گلوکز فرد به غذاهای خاص و تغییرات رژیم غذایی چگونه پاسخ می‌دهد و تغذیه دقیق را ممکن می‌سازد. تیم تحقیقاتی GluFormer را در 15 مجموعه داده دیگر تأیید کرد و دریافت که برای پیش‌بینی نتایج سلامت برای گروه‌های دیگر، از جمله افراد مبتلا به پیش دیابت، دیابت نوع 1 و 2، دیابت بارداری و چاقی، به خوبی تعمیم می‌یابد.

مقاله GluFormer را بخوانید.

LATTE3D: امکان ایجاد تقریباً واقعی، از متن تا سه بعدی را فراهم می کند

یکی دیگر از ژنراتورهای سه بعدی که امسال توسط NVIDIA Research منتشر شد، LATTE3D است که پیام های متنی را در یک ثانیه به نمایش های سه بعدی تبدیل می کند – مانند یک چاپگر سه بعدی مجازی سریع. فیگورهای ایجاد شده در یک فرمت رایج مورد استفاده در برنامه های ارائه استاندارد طراحی شده اند و می توانند به راحتی در محیط های مجازی برای توسعه بازی های ویدیویی، کمپین های تبلیغاتی، پروژه های طراحی یا فضاهای آموزشی مجازی برای روبات ها ارائه شوند.

مقاله LATTE3D را بخوانید.

MaskedMimic: بازسازی حرکت واقعی ربات های انسان نما

برای پیشبرد توسعه ربات‌های انسان‌نما، محققان NVIDIA MaskedMimic را معرفی کردند، یک چارچوب هوش مصنوعی که نقاشی (فرآیند بازسازی داده‌های کامل از یک نمای ناقص یا پوشیده) را برای توصیف حرکت اعمال می‌کند.

با توجه به اطلاعات جزئی، مانند توصیف متنی حرکت، یا داده‌های موقعیت سر و دست از هدست واقعیت مجازی، MaskedMimic می‌تواند جاهای خالی را برای استنباط حرکت تمام بدن پر کند. این بخشی از پروژه NVIDIA GR00T است، یک ابتکار تحقیقاتی برای تسریع توسعه ربات انسان نما.

مقاله MaskedMimic را بخوانید.

StormCast: پیش بینی آب و هوا و شبیه سازی آب و هوا پیشرفته

در علم آب و هوا، تحقیقات NVIDIA StormCast را معرفی کرد، یک مدل هوش مصنوعی مولد برای شبیه‌سازی دینامیک اتمسفر. در حالی که سایر مدل های یادگیری ماشینی آموزش دیده بر روی داده های جهانی دارای وضوح مکانی حدود 30 کیلومتر و وضوح زمانی تا 6 ساعت هستند، StormCast به مقیاس 3 کیلومتر در ساعت دست می یابد.

محققان StormCast را بر اساس داده‌های آب و هوایی NOAA از مرکز ایالات متحده برای تقریباً سه سال و نیم آموزش دادند. هنگامی که با رادارهای بارش استفاده می شود، StormCast پیش بینی هایی را برای دوره های زمانی تا شش ساعت ارائه می دهد و 10٪ دقیق تر از ایالات متحده است. مدل پیش بینی آب و هوای منطقه ای ۳ کیلومتری پیشرفته سازمان ملی اقیانوسی و جوی.

مقاله StormCast را که با همکاری محققان آزمایشگاه ملی لارنس برکلی و دانشگاه واشنگتن نوشته شده است، بخوانید.

تحقیقات انویدیا در هوش مصنوعی، وسایل نقلیه خودران و روباتیک رکوردها را شکست

تا سال 2024، مدل‌های ایجاد شده در NVIDIA Research رکوردهایی را در معیارهای آموزش و استنتاج هوش مصنوعی، بهینه‌سازی مسیر، رانندگی خودکار و موارد دیگر ثبت خواهند کرد.

NVIDIA cuOpt، یک میکروسرویس بهینه‌سازی هوش مصنوعی که در بهینه‌سازی لجستیک استفاده می‌شود، دارای 23 معیار جهانی است. پلتفرم NVIDIA Blackwell عملکردی در سطح جهانی در برابر معیار صنعت MLPerf برای آموزش و استنتاج هوش مصنوعی نشان داده است.

در زمینه وسایل نقلیه خودران، Hydra-MDP، یک چارچوب رانندگی خودکار سرتاسر از تحقیقات NVIDIA، در چالش بزرگ رانندگی خودکار CVPR 2024 مقام اول را در مسیر رانندگی سرتاسر مقیاس بزرگ به دست آورد.

در رباتیک، FoundationPose، یک مدل پایه یکپارچه برای تخمین و ردیابی وضعیت جسم 6 بعدی، رتبه اول را در جدول امتیازات BOP برای تخمین حالت مبتنی بر مدل اجسام نادیده گرفت.

بیشتر بدانید تحقیقات انویدیاکه شامل صدها دانشمند و مهندس در سراسر جهان است. تیم های تحقیقاتی انویدیا بر موضوعاتی از جمله هوش مصنوعی، گرافیک کامپیوتری، بینایی کامپیوتر، خودروهای خودران و روباتیک تمرکز دارند.

منبع: https://blogs.nvidia.com/blog/ai-research-2024/

تحریریه تی 20 بازی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *