
بروزرسانی: 30 اردیبهشت 1404
شناسایی میکروسرویس های NIM و نمودارهای هوش مصنوعی

در طول سال گذشته، هوش مصنوعی شیوه زندگی، کار و بازی مردم را تغییر داده است و همه چیز را از نوشتن و تولید محتوا گرفته تا بازی، یادگیری و بهره وری را بهبود بخشیده است. علاقه مندان به کامپیوتر و توسعه دهندگان تلاش می کنند تا مرزهای این فناوری پیشگامانه را پیش ببرند.
بارها، پیشرفت های تکنولوژیکی تعریف کننده صنعت در یک مکان - گاراژ - اختراع شده اند. این هفته شروع است گاراژ RTX AI این مجموعه، محتوای معمولی را برای توسعه دهندگان و علاقه مندانی که به دنبال کسب اطلاعات بیشتر در مورد میکروسرویس های NVIDIA NIM و نقشه های هوش مصنوعی، نحوه ساخت عوامل هوش مصنوعی، گردش کار خلاق، انسان های دیجیتال، برنامه های کاربردی بهره وری و موارد دیگر در رایانه های شخصی هوش مصنوعی هستند، ارائه می دهد. خوش آمدید به گاراژ RTX AI.
این قسمت اول اعلامیه هایی را که در اوایل این هفته در CES منتشر شد، شامل مدل های پایه هوش مصنوعی جدید موجود در رایانه های شخصی NVIDIA RTX AI است که انسان های دیجیتال، تولید محتوا، بهره وری و توسعه را به سطح بعدی می برد.
این مدل ها – که به عنوان ریزسرویس NVIDIA NIM ارائه می شوند – از پردازنده های گرافیکی جدید سری GeForce RTX 50 پشتیبانی می کنند. پردازنده های گرافیکی سری RTX 50 که بر اساس معماری NVIDIA Blackwell ساخته شده اند، تا 3.352 تریلیون عملیات هوش مصنوعی در هر ثانیه عملکرد، 32 گیگابایت VRAM و ویژگی محاسبات FP4 را ارائه می دهند، عملکرد استنتاج هوش مصنوعی را دوبرابر می کنند و هوش مصنوعی مولد را قادر می سازند به صورت بومی با ردپای حافظه کمتر اجرا شود.
NVIDIA همچنین NVIDIA AI Blueprints را معرفی کرد - گردش کار آماده و از پیش پیکربندی شده، ساخته شده بر روی میکروسرویس های NIM، برای برنامه هایی مانند انسان دیجیتال و ایجاد محتوا.
ریزسرویس های NIM و نقشه های هوش مصنوعی علاقه مندان و توسعه دهندگان را قادر می سازد تا سریع تر از همیشه تجربیات مبتنی بر هوش مصنوعی را ایجاد، تکرار و به رایانه شخصی ارائه دهند. نتیجه موج جدیدی از قابلیت های عملی و قانع کننده برای کاربران رایانه شخصی است.
رهگیری سریع هوش مصنوعی با NVIDIA NIM
دو چالش اصلی برای آوردن پیشرفت های هوش مصنوعی به رایانه ها وجود دارد. اولاً، سرعت تحقیقات هوش مصنوعی بسیار سریع است و مدل های جدید روزانه در پلتفرم هایی مانند Hugging Face که اکنون میزبان بیش از یک میلیون مدل است، ظاهر می شوند. در نتیجه، هک ها به سرعت قدیمی می شوند.
دوم، تطبیق این مدل ها برای استفاده از رایانه، فرآیندی پیچیده و نیازمند منابع است. بهینه سازی آنها برای رایانه ها، ادغام آنها با نرم افزار هوش مصنوعی و اتصال آنها به برنامه ها به تلاش مهندسی قابل توجهی نیاز دارد.
NVIDIA NIM با ارائه مدل های پیشرفته هوش مصنوعی که برای رایانه های شخصی از پیش پیکربندی و بهینه سازی شده اند، به رفع این چالش ها کمک می کند. این میکروسرویس های NIM دامنه های معمولی را در بر می گیرند، می توانند با یک کلیک نصب شوند، دارای API برای ادغام آسان هستند و از نرم افزار NVIDIA AI و GPU های RTX برای تسریع عملکرد استفاده می کنند.
در CES، انویدیا خط لوله ای از میکروسرویس های NIM را برای رایانه های RTX AI اعلام کرد که از موارد استفاده شامل مدل های زبان بزرگ (LLM)، مدل های زبان بینایی، تولید تصویر، گفتار، بازیابی نسل افزوده (RAG)، استخراج PDF و بینایی رایانه پشتیبانی می کند.
مدل های باز خانواده جدید Llama Nemotron دقت بالایی را در طیف وسیعی از وظایف پروکسی ارائه می دهد. نمونه اولیه Llama Nemotron Nano که به عنوان یک میکروسرویس NIM برای رایانه های شخصی و ایستگاه های کاری هوش مصنوعی RTX ارائه می شود، در وظایف هوش مصنوعی مانند دنبال کردن دستورالعمل ها، توابع فراخوانی، چت، کدنویسی و ریاضیات برتری دارد.
به زودی، توسعه دهندگان می توانند به سرعت این میکروسرویس ها را با استفاده از زیرسیستم ویندوز برای لینوکس (WSL) روی رایانه های شخصی ویندوز 11 دانلود و اجرا کنند.
[embed]https://www.youtube.com/watch?v=kh55RX2xsaA[/embed]
برای نشان دادن اینکه چگونه علاقه مندان و توسعه دهندگان می توانند از NIM برای ساخت عوامل و دستیارهای هوش مصنوعی استفاده کنند، انویدیا Project R2X را پیش نمایش کرد، یک آواتار رایانه شخصی با قابلیت بینایی که می تواند اطلاعات را در دسترس کاربر قرار دهد، به برنامه های دسکتاپ و تماس های ویدیویی گروهی کمک کند، و اسناد را بخواند و خلاصه کند. . و بیشتر. برای به روز رسانی پروژه R2X ثبت نام کنید.
با میکروسرویس های NIM، علاقه مندان به هوش مصنوعی می توانند از پیچیدگی های سازمان دهی مدل، بهینه سازی و یکپارچه سازی باطن بگذرند و بر ساخت و نوآوری با مدل های پیشرفته هوش مصنوعی تمرکز کنند.
در API چیست؟
رابط برنامه نویسی برنامه (Application Programming Interface) یا API راهی است که یک برنامه کاربردی با کتابخانه نرم افزار ارتباط برقرار می کند. یک API مجموعه ای از «تماس ها» را تعریف می کند که یک برنامه می تواند با یک کتابخانه برقرار کند و برنامه در ازای آن چه انتظاری دارد. APIهای AI سنتی به تنظیمات و پیکربندی زیادی نیاز دارند، که استفاده از قابلیت های هوش مصنوعی را دشوارتر می کند و مانع از نوآوری می شود.
میکروسرویس های NIM، رابط های برنامه نویسی کاربردی (API) با کاربرد آسان را در معرض دید قرار می دهند که یک برنامه به سادگی می تواند درخواست ها را ارسال کند و پاسخ دریافت کند. علاوه بر این، به طور ویژه برای رسانه های ورودی و خروجی انواع مدل های مختلف طراحی شده است. به عنوان مثال، LLM متن را به عنوان ورودی می گیرد و متن را به عنوان خروجی تولید می کند، مولدهای تصویر متن را به تصویر تبدیل می کنند، تشخیص دهنده های گفتار، گفتار را به متن و غیره.
میکروسرویس ها برای ادغام یکپارچه با چارچوب های توسعه هوش مصنوعی و چارچوب های عاملی مانند AI Toolkit برای VSCode، AnythingLLM، ComfyUI، Flowise AI، LangChain، Langflow، و LM Studio طراحی شده اند. توسعه دهندگان می توانند به راحتی آنها را از build.nvidia.com دانلود و اجرا کنند.
NVIDIA NIM با آوردن این APIها به RTX، نوآوری هوش مصنوعی را در رایانه های شخصی سرعت می بخشد.
انتظار می رود که علاقه مندان بتوانند طیف وسیعی از میکروسرویس های NIM را با استفاده از نسخه آزمایشی فنی NVIDIA ChatRTX امتحان کنند.
طرحی برای نوآوری
با استفاده از جدیدترین مدل های از پیش ساخته شده و بهینه سازی شده برای رایانه، توسعه دهندگان و علاقه مندان می توانند به سرعت پروژه های مبتنی بر هوش مصنوعی ایجاد کنند. برای برداشتن یک قدم جلوتر، می تواند چندین مدل هوش مصنوعی را با عملکردهای دیگر ترکیب کند تا برنامه های پیچیده ای مانند انسان دیجیتال، تولیدکننده پادکست و دستیار برنامه ایجاد کند.
NVIDIA AI Blueprints، ساخته شده بر روی میکروسرویس های NIM، به عنوان پیاده سازی مرجع برای گردش های کاری پیچیده هوش مصنوعی عمل می کند. این به توسعه دهندگان کمک می کند بسیاری از مؤلفه ها، از جمله کتابخانه ها، SDK ها و مدل های هوش مصنوعی را در یک برنامه واحد به یکدیگر متصل کنند.
[embed]https://www.youtube.com/watch?v=6YrEjhSMPBY[/embed]
AI Blueprints شامل همه چیزهایی است که یک توسعه دهنده برای ایجاد، اجرا، سفارشی سازی و گسترش گردش کار مرجع نیاز دارد، که شامل برنامه مرجع، کد منبع، داده های نمونه و اسناد برای سفارشی سازی و هماهنگ سازی اجزای مختلف است.
در نمایشگاه CES، انویدیا دو طرح هوش مصنوعی را برای RTX اعلام کرد: یکی برای پادکست PDF، که به کاربران امکان می دهد از هر فایل PDF یک پادکست بسازند و دیگری برای هوش مصنوعی مولد با هدایت سه بعدی، که مبتنی بر FLUX.1 (dev) است و انتظار می رود به عنوان یک میکروسرویس از NIM ارائه می شود، کنترل بیشتری بر روی ایجاد تصاویر مبتنی بر متن در اختیار هنرمندان قرار می دهد.
با AI Blueprints، توسعه دهندگان می توانند به سرعت از آزمایش هوش مصنوعی به توسعه هوش مصنوعی برای گردش های کاری پیشرفته در رایانه های شخصی و ایستگاه های کاری RTX حرکت کنند.
طراحی شده برای هوش مصنوعی مولد
پردازنده های گرافیکی سری جدید GeForce RTX 50 که به طور خاص برای مقابله با چالش های پیچیده هوش مصنوعی طراحی شده اند، دارای هسته های Tensor نسل پنجم با پشتیبانی از FP4، حافظه G7 سریع تر، و یک پردازنده مدیریت هوش مصنوعی برای چندوظیفگی کارآمد بین هوش مصنوعی و جریان های کاری خلاقانه هستند.
سری GeForce RTX 50 برای کمک به ارائه عملکرد بهتر و عملکرد بیشتر رایانه شخصی، پشتیبانی از FP4 را اضافه می کند. FP4 یک روش کوانتیزاسیون پایین تر است، شبیه به فشرده سازی فایل، که اندازه مدل را کاهش می دهد. در مقایسه با FP16 - حالت پیش فرض اکثر مدل ها - FP4 از کمتر از نیمی از حافظه استفاده می کند و پردازنده های گرافیکی سری 50 عملکردی بیش از دو برابر نسل قبلی دارند. این کار را می توان تقریباً بدون افت کیفیت با استفاده از روش های مقیاس بندی پیشرفته ارائه شده توسط NVIDIA TensorRT Model Optimizer انجام داد.
برای مثال، مدل FLUX.1 (dev) Black Forest Labs در FP16 به بیش از 23 گیگابایت VRAM نیاز دارد، به این معنی که فقط توسط GeForce RTX 4090 و GPU های حرفه ای قابل پشتیبانی است. با FP4، FLUX.1 (dev) به کمتر از 10 گیگابایت نیاز دارد، بنابراین می تواند به صورت بومی روی پردازنده های گرافیکی GeForce RTX بیشتری اجرا شود.
با استفاده از GeForce RTX 4090 با FP16، مدل FLUX.1 (dev) می تواند تصاویر را در 15 ثانیه با 30 مرحله تولید کند. با استفاده از GeForce RTX 5090 با FP4، می توان تصاویر را در کمتر از پنج ثانیه ایجاد کرد.
با API های جدید هوش مصنوعی برای رایانه ها شروع کنید
انتظار می رود که ریزسرویس های NIM و طرح های هوش مصنوعی NVIDIA از ماه آینده با پشتیبانی سخت افزاری اولیه برای سری های GeForce RTX 50، GeForce RTX 4090 و 4080 و NVIDIA RTX 6000 و 5000 پردازنده های گرافیکی حرفه ای در دسترس قرار گیرند. GPU های اضافی در آینده پشتیبانی خواهند شد.
انتظار می رود رایانه های شخصی RTX AI آماده NIM از Acer، ASUS، Dell، GIGABYTE، HP، Lenovo، MSI، Razer، و Samsung و سازندگان سیستم محلی Corsair، Falcon Northwest، LDLC، Maingear، Mifcon، Origin PC در دسترس باشند. PCS و اسکن.
پردازنده های گرافیکی و لپ تاپ های سری GeForce RTX 50 عملکردی را ارائه می دهند که بازی را تغییر می دهد، تجربه های هوش مصنوعی متحول کننده را تقویت می کند و سازندگان را قادر می سازد تا گردش های کاری را در زمان بی سابقه انجام دهند. برای کسب اطلاعات بیشتر در مورد اخبار هوش مصنوعی NVIDIA که در CES فاش شد، سخنرانی اصلی جنسن هوانگ، مدیر عامل NVIDIA را دوباره تماشا کنید.
ببینید متوجه می شود در مورد اطلاعات محصولات نرم افزاری.
منبع: https://blogs.nvidia.com/blog/rtx-ai-garage-ces-pc-nim-blueprints/