پلتفرم خود را انتخاب کنید

قبل از اینکه با هوش مصنوعی بسازید، باید پلتفرمی را که روی آن میزبانی می‌شود انتخاب کنید. انتخاب شما بر سرعت، هزینه، مقیاس‌پذیری و قابلیت اعتماد سیستم هوش مصنوعی شما تأثیر می‌گذارد. می‌توانید بین موارد زیر یکی را انتخاب کنید:

  • هوش مصنوعی سمت کلاینت : مستقیماً در مرورگر اجرا می‌شود. این بدان معناست که داده‌ها می‌توانند به صورت خصوصی، روی دستگاه کاربر باقی بمانند و هیچ تأخیر شبکه‌ای وجود ندارد. با این حال، برای عملکرد خوب، هوش مصنوعی سمت کلاینت به موارد استفاده بسیار خاص و تعریف‌شده‌ای نیاز دارد.
  • هوش مصنوعی سمت سرور : در فضای ابری اجرا می‌شود. بسیار توانمند و مقیاس‌پذیر است، اما از نظر تأخیر و هزینه، گران‌تر است.

هر گزینه با بده‌بستان‌هایی همراه است و تنظیم مناسب به مورد استفاده، مهارت‌های تیمی و منابع شما بستگی دارد. به عنوان مثال، ممکن است یک ابزار خلاصه‌سازی ارائه دهید که به صورت محلی اجرا می‌شود تا کاربران بتوانند بدون نیاز به مدیریت اطلاعات شخصی قابل شناسایی (PII) سوالات شخصی خود را بپرسند. با این حال، یک نماینده پشتیبانی مشتری می‌تواند با استفاده از یک مدل مبتنی بر ابر که به پایگاه داده بزرگی از منابع دسترسی دارد، پاسخ‌های مفیدتری ارائه دهد.

در این ماژول، شما یاد می‌گیرید که چگونه:

  • مقایسه‌ی بده‌بستان‌های بین هوش مصنوعی سمت کلاینت و سمت سرور.
  • پلتفرم خود را با مورد استفاده و قابلیت‌های تیم خود مطابقت دهید.
  • سیستم‌های ترکیبی طراحی کنید که هوش مصنوعی را هم روی کلاینت و هم روی سرور ارائه می‌دهند تا با محصول شما رشد کنند.

گزینه‌ها را مرور کنید

برای استقرار، پلتفرم‌های هوش مصنوعی را در دو محور اصلی در نظر بگیرید. می‌توانید موارد زیر را انتخاب کنید:

  • محل اجرای مدل : آیا سمت کلاینت اجرا می‌شود یا سمت سرور؟
  • قابلیت سفارشی‌سازی : چقدر بر دانش و قابلیت‌های مدل کنترل دارید؟ اگر بتوانید مدل را کنترل کنید، به این معنی که بتوانید وزن‌های مدل را تغییر دهید، می‌توانید رفتار آن را برای برآورده کردن نیازهای خاص خود سفارشی کنید.
نمونه‌هایی از مدل‌های مبتنی بر پلتفرم و کنترل.
شکل ۱: گزینه‌های پلتفرم هوش مصنوعی، که بر اساس پلتفرم استقرار و سطح کنترل از هم متمایز می‌شوند.

هوش مصنوعی سمت کلاینت

هوش مصنوعی سمت کلاینت در مرورگر اجرا می‌شود و محاسبات به صورت محلی روی دستگاه کاربر انجام می‌شود. نیازی به فراهم کردن محاسبات زمان استنتاج نیست و داده‌ها روی دستگاه کاربر باقی می‌مانند. این امر آن را سریع، خصوصی و مناسب برای تجربیات سبک و تعاملی می‌کند.

با این حال، مدل‌های سمت کلاینت معمولاً بسیار کوچک هستند که می‌تواند قابلیت‌ها و عملکرد آنها را محدود کند. آنها برای کارهای بسیار تخصصی، مانند تشخیص سمیت یا تحلیل احساسات، مناسب‌ترین هستند. اغلب، اینها وظایف پیش‌بینی هوش مصنوعی با فضای خروجی محدود هستند.

دو گزینه اصلی وجود دارد:

  • هوش مصنوعی داخلی : مرورگرهایی مانند گوگل کروم و مایکروسافت اج ، مدل‌های هوش مصنوعی را در خود جای داده‌اند. این مدل‌ها از طریق فراخوانی‌های جاوا اسکریپت و بدون نیاز به راه‌اندازی یا میزبانی قابل دسترسی هستند. پس از دانلود مدل، تمام وب‌سایت‌هایی که از آن استفاده می‌کنند می‌توانند آن را فراخوانی کنند.
  • مدل‌های سفارشی : شما می‌توانید از کتابخانه‌های سمت کلاینت، مانند Transformers.js و MediaPipe ، برای ادغام مدل‌ها در برنامه خود استفاده کنید. این بدان معناست که می‌توانید وزن‌های مدل را کنترل کنید. با این حال، این بدان معناست که هر کاربر وب‌سایت شما باید مدل سفارشی شما را دانلود کند. حتی کوچکترین مدل‌های هوش مصنوعی نیز در چارچوب یک وب‌سایت بزرگ هستند .

هوش مصنوعی سمت سرور

با هوش مصنوعی سمت سرور، برنامه وب شما یک API را برای ارسال ورودی به مدل هوش مصنوعی و دریافت خروجی‌های آن فراخوانی می‌کند. این تنظیمات از مدل‌های بزرگتر و پیچیده‌تر پشتیبانی می‌کند و مستقل از سخت‌افزار کاربر است.

دو دسته برای هوش مصنوعی سمت سرور عبارتند از:

  • سرویس‌های مدیریت‌شده : این‌ها مدل‌هایی هستند که توسط یک شخص ثالث، مانند Gemini 3 و GPT-5، در مراکز داده میزبانی می‌شوند. مالک مدل، یک API برای دسترسی به آن ارائه می‌دهد. این بدان معناست که می‌توانید از مدل‌های پیشرفته با حداقل تنظیمات استفاده کنید. این مدل‌ها برای نمونه‌سازی سریع، مکالمه آزاد و استدلال عمومی ایده‌آل هستند. با این حال، مقیاس‌پذیری روی یک سرویس مدیریت‌شده می‌تواند گران باشد.
  • مدل‌های خود-میزبان : شما می‌توانید مدل‌های وزن-باز، مانند Gemma یا Llama، را در زیرساخت خود یا در یک کانتینر مدیریت‌شده، مانند Vertex AI یا Hugging Face Inference، مستقر کنید. این رویکرد به این معنی است که می‌توانید از پیش‌آموزش انجام‌شده توسط سازنده مدل بهره‌مند شوید، اما کنترل مدل، تنظیم دقیق داده‌ها و عملکرد را حفظ می‌کنید.

یک پلتفرم اولیه انتخاب کنید

ویژگی‌های معماری پلتفرم‌های هوش مصنوعی را بررسی کنید و برای تصمیم‌گیری در مورد راه‌اندازی اولیه خود، بده‌بستان‌ها را تجزیه و تحلیل کنید.

الزامات معماری خود را تعریف کنید

با هر تصمیمی، باید مصالحه کنید. نگاهی به ویژگی‌های کلیدی که هزینه و ارزش پلتفرم هوش مصنوعی شما را تعریف می‌کنند، بیندازید:

  • قدرت مدل : اینکه مدل بدون تنظیم، در طیف وسیعی از کاربران و وظایف چقدر خوب عمل می‌کند. اغلب، این با اندازه مدل همبستگی دارد.
  • قابلیت سفارشی‌سازی : میزانی که می‌توانید رفتار و معماری مدل را به دقت تنظیم، اصلاح یا کنترل کنید.
  • دقت : کیفیت کلی و قابلیت اطمینان پیش‌بینی‌ها یا نسل‌های مدل.
  • حریم خصوصی : میزانی که داده‌های کاربر محلی و تحت کنترل کاربر باقی می‌مانند.
  • هزینه ثابت : هزینه تکرارشونده مورد نیاز برای راه‌اندازی سیستم هوش مصنوعی صرف نظر از میزان استفاده، شامل تأمین زیرساخت و نگهداری.
  • هزینه به ازای هر درخواست : هزینه اضافی هر درخواست ورودی.
  • سازگاری : این رویکرد چقدر در مرورگرها، دستگاه‌ها و محیط‌های مختلف بدون منطق fallback کار می‌کند.
  • راحتی کاربر : اینکه آیا کاربران برای استفاده از سیستم هوش مصنوعی نیاز به انجام مراحل اضافی، مانند دانلود یک مدل، دارند یا خیر.
  • راحتی توسعه‌دهنده : استقرار، ادغام و نگهداری مدل برای اکثر توسعه‌دهندگان، بدون تخصص تخصصی هوش مصنوعی، چقدر سریع و آسان است.

جدول زیر نمونه‌ای از تخمین‌ها برای میزان عملکرد هر پلتفرم در هر معیار را ارائه می‌دهد، که در آن ۱ کمترین و ۵ بیشترین عملکرد را نشان می‌دهد.

معیارها مشتری سرور
هوش مصنوعی داخلی یا روی دستگاه مدل سفارشی خدمات مدیریت‌شده مدل خود-میزبان
قدرت مدل

چرا برای قدرت مدل ۲ ستاره؟

هوش مصنوعی داخلی و روی دستگاه، از مدل‌های مرورگر کوچک و از پیش بارگذاری‌شده‌ای استفاده می‌کند که برای ویژگی‌های محدود و مختص به وظیفه بهینه شده‌اند، نه برای مکالمه یا استدلال‌های بی‌پایان.

چرا برای قدرت مدل ۳ ستاره؟

کتابخانه‌های سمت کلاینت سفارشی، انعطاف‌پذیری بیشتری نسبت به هوش مصنوعی داخلی ارائه می‌دهند، اما شما هنوز هم با محدودیت‌هایی مانند حجم دانلود، محدودیت‌های حافظه و سخت‌افزار کاربر مواجه هستید.

چرا ۴ ستاره برای قدرت مدل؟

با سرویس‌های مدیریت‌شده و خود-میزبانی، شما به مدل‌های بزرگ و پیشرفته‌ای دسترسی دارید که قادر به استدلال پیچیده، مدیریت متن طولانی و پوشش وظایف گسترده هستند.

قابلیت سفارشی‌سازی

چرا ۱ ستاره برای قابلیت شخصی‌سازی؟

مدل‌های از پیش ساخته شده اجازه دسترسی به وزن‌های مدل یا داده‌های آموزشی را نمی‌دهند. راه اصلی برای سفارشی‌سازی رفتار آنها از طریق مهندسی سریع است.

چرا ۵ ستاره برای قابلیت شخصی‌سازی؟

این گزینه به شما امکان کنترل بر انتخاب مدل و وزن‌ها را می‌دهد. بسیاری از کتابخانه‌های سمت کلاینت همچنین امکان تنظیم دقیق و آموزش مدل را فراهم می‌کنند.

چرا ۱ ستاره برای قابلیت شخصی‌سازی؟

سرویس‌های مدیریت‌شده مدل‌های قدرتمندی را ارائه می‌دهند اما کنترل حداقلی بر رفتار داخلی خود ارائه می‌دهند. سفارشی‌سازی معمولاً به اعلان و زمینه ورودی محدود می‌شود.

چرا ۵ ستاره برای قابلیت شخصی‌سازی؟

مدل‌های خود-میزبان، کنترل کاملی بر وزن‌های مدل، داده‌های آموزشی، تنظیم دقیق و پیکربندی استقرار ارائه می‌دهند.

دقت

چرا برای دقت ۲ ستاره؟

دقت در مدل‌های از پیش ساخته شده برای وظایف با دامنه‌ی مشخص کافی است، اما اندازه‌ی محدود مدل و تعمیم‌پذیری آن، قابلیت اطمینان را برای ورودی‌های پیچیده یا ظریف کاهش می‌دهد.

چرا ۳ ستاره برای دقت؟

دقت مدل سفارشی سمت کلاینت را می‌توان در فرآیند انتخاب مدل بهبود بخشید. با این حال، این دقت همچنان تحت تأثیر اندازه مدل، کوانتیزاسیون و تنوع سخت‌افزار کلاینت قرار دارد.

چرا ۵ ستاره برای دقت؟

سرویس‌های مدیریت‌شده معمولاً دقت نسبتاً بالایی ارائه می‌دهند و از مدل‌های بزرگ، داده‌های آموزشی گسترده و بهبودهای مداوم ارائه‌دهندگان بهره‌مند می‌شوند.

چرا ۴ ستاره برای دقت؟

دقت می‌تواند بالا باشد، اما به مدل انتخاب شده و تلاش برای تنظیم بستگی دارد. عملکرد ممکن است از خدمات مدیریت شده عقب بماند.

تأخیر شبکه

چرا برای تأخیر شبکه ۵ ستاره؟

پردازش مستقیماً روی دستگاه کاربر اتفاق می‌افتد.

چرا برای تأخیر شبکه ۲ ستاره؟

یک رفت و برگشت به یک سرور وجود دارد.

حریم خصوصی

چرا برای حریم خصوصی ۵ ستاره؟

داده‌های کاربر باید به طور پیش‌فرض روی دستگاه باقی بمانند، که این امر افشای داده‌ها را به حداقل می‌رساند و رعایت حریم خصوصی را ساده می‌کند.

چرا برای حریم خصوصی ۲ ستاره؟

ورودی‌های کاربر باید به سرورهای خارجی ارسال شوند که این امر باعث افزایش افشای داده‌ها و الزامات انطباق می‌شود. با این حال، راه‌حل‌های خاصی برای کاهش مسائل مربوط به حریم خصوصی وجود دارد، مانند محاسبات هوش مصنوعی خصوصی .

چرا برای حریم خصوصی ۳ ستاره؟

داده‌ها تحت کنترل سازمانی شما باقی می‌مانند، اما همچنان از دستگاه کاربر خارج می‌شوند و نیاز به مدیریت ایمن و اقدامات انطباقی دارند.

هزینه ثابت

چرا ۵ ستاره برای هزینه ثابت؟

مدل‌ها روی دستگاه‌های موجود کاربران اجرا می‌شوند، بنابراین هیچ هزینه زیرساختی اضافی وجود ندارد.

چرا ۵ ستاره برای هزینه ثابت؟

بیشتر APIها بر اساس میزان استفاده هزینه دریافت می‌کنند، بنابراین هزینه ثابتی وجود ندارد.

چرا برای هزینه ثابت، ۲ ستاره؟

هزینه‌های ثابت شامل زیرساخت، نگهداری و سربار عملیاتی می‌شود.

هزینه به ازای هر درخواست

چرا برای هزینه به ازای هر درخواست، ۵ ستاره؟

هیچ هزینه‌ای برای هر درخواست وجود ندارد، زیرا استنتاج روی دستگاه کاربر اجرا می‌شود.

چرا برای هزینه به ازای هر درخواست، ۲ ستاره؟

سرویس‌های مدیریت‌شده معمولاً قیمت‌گذاری بر اساس هر درخواست دارند. هزینه‌های مقیاس‌پذیری می‌تواند قابل توجه باشد، به‌خصوص در حجم ترافیک بالا.

چرا برای هزینه به ازای هر درخواست، ۳ ستاره؟

بدون هزینه مستقیم برای هر درخواست؛ هزینه موثر برای هر درخواست به میزان استفاده از زیرساخت بستگی دارد.

سازگاری

چرا برای سازگاری ۲ ستاره؟

در دسترس بودن بسته به مرورگر و دستگاه متفاوت است و برای محیط‌های پشتیبانی نشده نیاز به fallback دارد.

چرا ۱ ستاره برای سازگاری؟

سازگاری به قابلیت‌های سخت‌افزاری و پشتیبانی زمان اجرا بستگی دارد و دسترسی به دستگاه‌ها را محدود می‌کند.

چرا ۵ ستاره برای سازگاری؟

پلتفرم‌های سمت سرور به طور گسترده برای همه کاربران سازگار هستند، زیرا استنتاج در سمت سرور اتفاق می‌افتد و کلاینت‌ها فقط از یک API استفاده می‌کنند.

راحتی کاربر

چرا ۳ ستاره برای راحتی کاربر؟

معمولاً وقتی در دسترس قرار می‌گیرد، بدون مشکل کار می‌کند، اما هوش مصنوعی داخلی نیاز به دانلود اولیه مدل و پشتیبانی مرورگر دارد.

چرا برای راحتی کاربر ۲ ستاره؟

کاربران ممکن است به دلیل دانلودها یا سخت‌افزار پشتیبانی نشده با تأخیر مواجه شوند.

چرا ۴ ستاره برای راحتی کاربر؟

بدون نیاز به دانلود یا دستگاه خاصی، فوراً کار می‌کند و یک تجربه کاربری روان را ارائه می‌دهد. با این حال، در صورت اتصال ضعیف شبکه، ممکن است تأخیر وجود داشته باشد.

راحتی توسعه‌دهنده

چرا ۵ ستاره برای راحتی توسعه‌دهنده؟

هوش مصنوعی داخلی به حداقل تنظیمات، بدون زیرساخت و تخصص کم در هوش مصنوعی نیاز دارد و همین امر ادغام و نگهداری آن را آسان می‌کند.

چرا برای راحتی توسعه‌دهنده، ۲ ستاره؟

نیاز به مدیریت مدل‌ها، زمان‌های اجرا، بهینه‌سازی عملکرد و سازگاری بین دستگاه‌ها دارد.

چرا ۴ ستاره برای راحتی توسعه‌دهنده؟

سرویس‌های مدیریت‌شده، استقرار و مقیاس‌پذیری را ساده می‌کنند. با این حال، آن‌ها هنوز به یکپارچه‌سازی API، مدیریت هزینه و مهندسی سریع نیاز دارند.

چرا ۱ ستاره برای راحتی توسعه‌دهنده؟

یک پیاده‌سازی سفارشی سمت سرور نیازمند تخصص قابل توجهی در زیرساخت، مدیریت مدل، نظارت و بهینه‌سازی است.

تلاش برای تعمیر و نگهداری

چرا برای تلاش در جهت تعمیر و نگهداری، ۴ ستاره؟

مرورگرها به‌روزرسانی‌ها و بهینه‌سازی مدل را مدیریت می‌کنند، اما توسعه‌دهندگان باید با تغییر در دسترس بودن سازگار شوند.

چرا برای تلاش در جهت تعمیر و نگهداری، ۲ ستاره؟

نیاز به به‌روزرسانی‌های مداوم برای مدل‌ها، تنظیم عملکرد و سازگاری با تکامل مرورگرها و دستگاه‌ها دارد.

چرا به خاطر تلاش برای تعمیر و نگهداری، ۵ ستاره؟

تعمیر و نگهداری توسط ارائه دهنده انجام می شود.

چرا برای تلاش در جهت تعمیر و نگهداری، ۲ ستاره؟

نیاز به نگهداری مداوم، از جمله به‌روزرسانی مدل، مدیریت زیرساخت، مقیاس‌پذیری و امنیت دارد.

تحلیل بده‌بستان‌ها

برای نشان دادن فرآیند تصمیم‌گیری، یک ویژگی دیگر به Example Shoppe، یک پلتفرم تجارت الکترونیک متوسط، اضافه خواهیم کرد. شما به صرفه‌جویی در هزینه‌ها در خدمات مشتری در ساعات غیرکاری علاقه‌مند هستید، بنابراین تصمیم می‌گیرید یک دستیار مبتنی بر هوش مصنوعی بسازید تا به سوالات کاربران در مورد سفارشات، مرجوعی‌ها و محصولات پاسخ دهد.

شکل ۲. در این ماژول، ما در درجه اول بر لایه هوش و داده طرح اولیه سیستم هوش مصنوعی برای Example Shoppe تمرکز داریم.
شما می‌توانید طرح کلی سیستم هوش مصنوعی را که شامل فرصت و راه‌حل است، بررسی کنید.

سناریو را با استفاده از دو دیدگاه تحلیل کنید: الزامات مورد استفاده و محدودیت‌های کسب و کار یا تیم.

مورد نیاز تحلیل معیارها پیامد
دقت بالا و تطبیق پذیری کاربران سوالات پیچیده و متنوعی در مورد سفارشات، محصولات و مرجوعی‌ها می‌پرسند. قدرت مدل، دقت به یک مدل زبان بزرگ (LLM) نیاز دارد.
ویژگی داده‌ها باید به سوالات خاص مربوط به داده‌ها، محصولات و سیاست‌های شرکت پاسخ دهد. قابلیت سفارشی‌سازی نیاز به دریافت داده دارد، مانند RAG، اما تنظیم دقیق مدل را شامل نمی‌شود.
الزامات مورد استفاده
مورد نیاز تحلیل معیارها پیامد
پایگاه کاربر صدها هزار کاربر. مقیاس‌پذیری، سازگاری به معماری نیاز دارد که ترافیک بالا و قابل اعتمادی را مدیریت کند.
تمرکز پس از راه‌اندازی تیم پس از انتشار نسخه ۱ به پروژه‌های دیگر خواهد پرداخت. تلاش برای تعمیر و نگهداری به یک راه حل با حداقل نگهداری مداوم نیاز دارید.
تخصص تیمی توسعه‌دهندگان وب قوی، تخصص محدود در هوش مصنوعی/یادگیری ماشین راحتی توسعه‌دهنده راهکار باید به راحتی و بدون نیاز به مهارت‌های تخصصی هوش مصنوعی قابل پیاده‌سازی و ادغام باشد.
محدودیت‌های کاری یا تیمی

اکنون که معیارهای خود را اولویت‌بندی کرده‌اید، می‌توانید به جدول تخمین بده‌بستان مراجعه کنید تا مشخص کنید کدام پلتفرم با معیارهای اولویت‌دار شما مطابقت دارد:

معیارهای اولویت‌بندی‌شده برنده پلتفرم
قدرت مدل سمت سرور
قابلیت سفارشی‌سازی سمت سرور: مدل خود-میزبان
راحتی توسعه‌دهنده سمت سرور: سرویس مدیریت‌شده
تلاش برای تعمیر و نگهداری سمت سرور: سرویس مدیریت‌شده
سازگاری و مقیاس‌پذیری سمت سرور

از این تفکیک مشخص است که شما باید از هوش مصنوعی سمت سرور و احتمالاً یک سرویس مدیریت‌شده استفاده کنید. این یک مدل همه‌کاره برای سوالات پیچیده مشتری ارائه می‌دهد. با واگذاری زیرساخت، کیفیت مدل و زمان آماده به کار به ارائه‌دهنده، تلاش برای نگهداری و توسعه را به حداقل می‌رساند.

اگرچه قابلیت سفارشی‌سازی محدود است، اما این یک معامله ارزشمند برای یک تیم توسعه وب با تجربه محدود در مهندسی مدل است.

یک تنظیم تولید افزوده بازیابی (RAG) می‌تواند به شما کمک کند تا زمینه مرتبط را در زمان استنتاج به مدل ارائه دهید.

هوش مصنوعی هیبریدی

سیستم‌های هوش مصنوعی بالغ به ندرت بر روی یک پلتفرم واحد یا با یک مدل اجرا می‌شوند. در عوض، آنها بارهای کاری هوش مصنوعی را توزیع می‌کنند تا بده‌بستان‌ها را بهینه کنند.

فرصت‌های هوش مصنوعی هیبریدی را شناسایی کنید

پس از راه‌اندازی، باید الزامات خود را بر اساس داده‌ها و بازخوردهای واقعی اصلاح کنید. در مثال ما، Example Shoppe، چند ماه صبر می‌کنید تا نتایج را تجزیه و تحلیل کنید و موارد زیر را بیابید:

  • حدود ۸۰٪ درخواست‌ها تکراری هستند (مثلاً «سفارش من کجاست؟»، «چگونه می‌توانم این را برگردانم؟»). ارسال این درخواست‌ها به یک سرویس مدیریت‌شده، سربار و هزینه زیادی ایجاد می‌کند.
  • تنها ۲۰٪ از درخواست‌ها نیاز به استدلال عمیق‌تر و گفتگوی تعاملی و بدون محدودیت زمانی دارند.

یک مدل محلی سبک می‌تواند ورودی‌های کاربر را طبقه‌بندی کند و به پرسش‌های روتین، مانند «سیاست بازگشت شما چیست؟» پاسخ دهد. می‌توانید سوالات پیچیده، نادر یا مبهم را به مدل سمت سرور هدایت کنید.

با پیاده‌سازی هوش مصنوعی هم در سمت سرور و هم در سمت کلاینت، می‌توانید هزینه‌ها و تأخیر را کاهش دهید، در عین حال که در صورت نیاز به استدلال قدرتمند دسترسی خواهید داشت.

حجم کار را توزیع کنید

برای ساخت این سیستم ترکیبی برای Example Shoppe، باید با تعریف سیستم پیش‌فرض شروع کنید. در این حالت، بهتر است از سمت کلاینت شروع کنید. برنامه باید در دو حالت به سمت هوش مصنوعی سمت سرور مسیریابی کند:

  • بازگشت مبتنی بر سازگاری : اگر دستگاه یا مرورگر کاربر نتواند درخواست را مدیریت کند، باید به سرور پاسخ داده شود.
  • ارتقاء مبتنی بر قابلیت : اگر درخواست برای مدل سمت کلاینت، طبق معیارهای از پیش تعیین‌شده، بیش از حد پیچیده یا نامشخص باشد، باید به یک مدل سمت سرور بزرگ‌تر ارتقاء داده شود. می‌توانید از یک مدل برای طبقه‌بندی درخواست به عنوان رایج استفاده کنید، بنابراین وظیفه سمت کلاینت یا غیرمعمول را انجام می‌دهید و درخواست را به سیستم سمت سرور ارسال می‌کنید. به عنوان مثال، اگر مدل سمت کلاینت تشخیص دهد که سوال مربوط به یک مسئله غیرمعمول است، مانند دریافت بازپرداخت با ارزی متفاوت.

انعطاف‌پذیری، پیچیدگی بیشتری را به همراه دارد

توزیع حجم کار بین دو پلتفرم، شما را انعطاف‌پذیرتر می‌کند، اما پیچیدگی‌هایی را نیز به همراه دارد:

  • هماهنگی : دو محیط اجرا به معنای بخش‌های متحرک بیشتر است. شما برای مسیریابی، تلاش مجدد و fallbackها به منطق نیاز دارید.
  • نسخه‌بندی : اگر از یک مدل در پلتفرم‌های مختلف استفاده می‌کنید، باید در هر دو محیط سازگار باقی بماند.
  • مهندسی سریع و مهندسی زمینه : اگر از مدل‌های مختلفی در هر پلتفرم استفاده می‌کنید، باید مهندسی سریع را برای هر کدام انجام دهید.
  • نظارت : گزارش‌ها و معیارها از هم جدا هستند و نیاز به تلاش بیشتری برای یکپارچه‌سازی دارند.
  • امنیت : شما دو سطح حمله را حفظ می‌کنید. هم نقاط پایانی محلی و هم نقاط پایانی ابری نیاز به مقاوم‌سازی دارند.

این هم یک نکته‌ی دیگر است که باید در نظر بگیرید. اگر تیم کوچکی دارید یا در حال ساخت یک ویژگی غیرضروری هستید، شاید نخواهید این پیچیدگی را اضافه کنید.

نکات مهم شما

انتظار داشته باشید که انتخاب پلتفرم شما تکامل یابد. از مورد استفاده شروع کنید، با تجربه و منابع تیم خود هماهنگ شوید و با رشد محصول و بلوغ هوش مصنوعی خود، این روند را تکرار کنید. وظیفه شما این است که ترکیب مناسبی از سرعت، حریم خصوصی و کنترل را برای کاربران خود پیدا کنید، سپس با کمی انعطاف‌پذیری بسازید. به این ترتیب، می‌توانید با الزامات در حال تغییر سازگار شوید و از به‌روزرسانی‌های آینده پلتفرم و مدل بهره‌مند شوید.

منابع

درک خود را بررسی کنید

دو نکته‌ی اصلی هنگام انتخاب یک پلتفرم هوش مصنوعی برای کاربرد شما چیست؟

زبان برنامه‌نویسی و فریم‌ورک‌های شما.
این نادرست است.
هزینه مدل و سرعت آموزش.
کارت عالی بود، کاملاً درسته!
جایی که مدل اجرا می‌شود (روی کلاینت یا سرور) و سطح کنترل بر مدل.
این نادرست است.
اندازه تیم توسعه و بودجه بازاریابی شما.
این نادرست است.

چه زمانی یک سرویس مدیریت‌شده توسط سرور، مانند Gemini Pro، بهترین انتخاب برای پلتفرم شماست؟

وقتی تیم شما تخصص عمیقی در یادگیری ماشین دارد و می‌خواهد وزن‌ها را به صورت دستی تنظیم کند.
این نادرست است.
وقتی نیاز دارید که برای کارهای استدلالی پیچیده، بدون مدیریت زیرساخت، به سرعت یک نمونه اولیه بسازید.
کارت عالی بود، کاملاً درسته!
وقتی کاربر به اینترنت دسترسی ندارد.
این نادرست است.
وقتی به کمترین تأخیر ممکن برای جلوه‌های ویدیویی بلادرنگ نیاز دارید.
این نادرست است.

مزیت اصلی پیاده‌سازی یک سیستم هوش مصنوعی ترکیبی چیست؟

این به شما امکان می‌دهد تا حجم کار را برای بهینه‌سازی بده‌بستان‌ها توزیع کنید، مانند اجرای وظایف ساده به صورت محلی برای سرعت و وظایف پیچیده روی سرور برای قدرت.
کارت عالی بود، کاملاً درسته!
این تضمین می‌کند که شما هزینه‌های کلاینت و سرور را به طور مساوی پرداخت می‌کنید.
این نادرست است.
این باعث می‌شود کاربران هر بار که از سایت بازدید می‌کنند، مدل‌های حجیم را دانلود کنند.
این نادرست است.
این امر نیاز به هرگونه منطق fallback در کد شما را از بین می‌برد.
این نادرست است.