از «ت» تا «ی» پروژه‌ توت‌فرنگی؛ شگفت‌انگیزترین مدل هوش مصنوعی OpenAI_سلوادور

دیاگرام روش ستاره در آموزش مدل توت‌فرنگی OpenAI

[ad_1]
نوشته و ویرایش شده توسط مجله ی سلوادور

برای مقابله با چالش‌های محاسباتی ناشی از مدل بزرگ‌تر، «توت‌فرنگی» امکان پذیر از مکانیزم‌های دقت پراکنده (Sparse Attention) منفعت گیری کند. این مکانیزم‌ها به مدل اجازه خواهند داد که بدون قربانی کارکرد، فقط بر قسمت‌های مرتبط و مهم داده‌های ورودی تمرکز کند و با این کار بار محاسباتی را افت دهد.

توانمندیهای استدلال و شناختی

یکی از ویژگی‌های برجسته‌ی مدل «توت‌فرنگی» توانمندیهای گسترش یافتهی آن در استدلال و حل قضیه به‌شمار می‌آید که الزام تغییرات عمیقی در نحوه‌ی پردازش اطلاعات توسط مدل است. گسترش‌ی مدل «توت‌فرنگی» شامل فرایندی است که به‌گفتن روش ستاره (Self-Taught Reasoner یا به‌طور خلاصه STaR) شناخته می‌بشود.

این روش در تشکیل یک رویکرد ساختاریافته برای حل قضیه پشتیبانی می‌کند تا مشکلات پیچیده را به شکل‌های جدیدی فهمیدن کند و به آن‌ها جواب دهد، همانند یادگیری مبتنی بر سناریو، خودکارسازی ماموریت های یا چارچوب‌های استدلالی. این روش امکان پذیر در تسلط بر محدودیت‌های مدل‌های قبلی هوش مصنوعی نقش کلیدی داشته باشد.

آخرین مطالب

روش ستاره پشتیبانی می‌کند تا هوش مصنوعی با انعطاف‌پذیری بیشتری به مشکلات گوناگون جواب دهد

روش ستاره (STaR) با یک مجموعه‌ی کوچک از مثال‌ها که استدلال قدم‌به‌قدم (به نام «علت‌») را نشان خواهند داد، اغاز می‌کند. سپس مدل زبانی بزرگ را به تشکیل «علت‌‌»هایی برای مجموعه‌ داده‌های بزرگ‌تر از سؤالاتی که جواب (یا علت) ندارند، ترغیب می‌کند.

عکاس: Eric Zelikman et al / arxiv.org/pdf/2203.14465v2

در طی این فرایند ابتدا چند مثال حل‌شده به مدل اراعه شده و سپس از مدل خواسته می‌بشود که مسائل شبیه را این‌بار خودش حل کند. این روش در کلمه «بوت‌استرپینگ» (Bootstrapping) نامیده می‌بشود که در اینجا به معنی ترقی توانمندیهای مدل با تکیه بر خود است.

این فرایند از توانمندیهای استدلالی حاضر در مدل زبان منفعت گیری می‌کند و آن‌ها را از طریق تکرار بهبود می‌بخشد. فرایند به این صورت است:

تشکیل علت‌ها: روش ستاره با یک مجموعه‌ی کوچک از مثال‌ها که قدم‌به‌قدم استدلال را نشان خواهند داد، اغاز به آموزش مدل زبانی بزرگ می‌کند و بعد از آموزش، مدل را به تشکیل دلایل برای مجموعه داده‌ای بزرگ‌تر از سؤالاتی تازه، ترغیب می‌کند.
فیلتر کردن: مدل بازدید می‌کند که آیا دلایل تولیدشده به جواب درست منجر شده‌اند یا نه. تنها علت‌هایی که به جواب صحیح می‌رسند، نگه داری خواهد شد.
بهبود و آموزش مجدد: مدل با منفعت گیری از این مجموعه‌ی فیلترشده از سؤالات و دلایل پیروزی‌آمیز تولیدشده، آموزش مجدد می‌بیند. این فرایند علتتقویت توانایی مدل در تشکیل دلایل مناسب می‌بشود.
‌تکرار فرایند: فرایند آموزش و تست مرتب تکرار می‌بشود. مدل بهبودیافته از مرحله‌ی قبلی مجدد برای تشکیل دلایل برای همان مجموعه‌ی بزرگ‌تر از سؤالات منفعت گیری می‌کند. این فرایند تکراری به مدل این امکان را می‌دهد که از دلایلهای تولیدشده توسط خود بیاموزد و عملکردش به مرور زمان بهبود یابد.
توجیه (اختیاری): برای رفع کردن محدودیت یادگیری تنها از دلایل موفق اولیه، یک «توجیه» معارفه می‌کند. برای سؤالاتی که مدل به نادرست جواب داده است، جواب درست به‌گفتن یک راهنما اراعه می‌بشود و از مدل خواسته می‌بشود که دلیلی تشکیل کند که این جواب را توجیه کند. این کار به مدل پشتیبانی می‌کند از اشتباهاتش بیاموزد و استدلال خود را در روبه رو با مسائل پیچیده‌تر بهبود بخشد.

این راه حلهای استدلالی از فرایندهای شناختی انسان الهام گرفته‌اند و به مدل اجازه خواهند داد که در حل مسائل به روشای ساختاریافته‌تر و همانند‌تر به انسان عمل کند. در مدل‌های قبل زیاد تر بر تخصص‌های اختصاصی در ماموریت های خاص پافشاری می‌شد، اما روش ستاره می‌تواند به گسترش‌ی استدلال عمومی‌تری منجر بشود. با منفعت گیری از این روش، OpenAI تصمیم دارد مدلی بسازد که بتواند طیف گسترده‌تری از ماموریت های را به شکل مؤثرتری حل کند.

به گفتن مثال:

در یک سوال حقوقی پیچیده، «توت‌فرنگی» می‌تواند از طریق بازدید چندین سابقه‌ی حقوقی، نتیجه‌گیری منطقی انجام دهد و به گمان زیادً به نتیجه‌ای برسد که از لحاظ قانونی معتبر است.

یا

در یک سناریوی تجاری راهبردی، این مدل می‌تواند مزایا و معایب تصمیم‌های گوناگون تجاری را تجزیه‌وتحلیل کند و پیشنهاد‌ای منطقی‌تر اراعه دهد.

حافظه و آگاهی از عرصه

یکی از پیشرفت‌های فنی کلیدی در مدل «توت‌فرنگی» توانایی نگه داری حافظه‌ی طویل مدت و فهمیدن عرصه‌ای در مکالمات یا تعامل های طویل به شمار می‌آید. این قابلیت برای بهبود توانایی‌ی کاربری زیاد حیاتی است و اهمیت آن به‌اختصاصی در مکالمات چندمرحله‌ای (برای نگه داری نوشته در طول جلسات طویل) پررنگ‌تر می‌بشود.

مدل‌های جاری از دو نوع فراموشی رنج می‌برند: یکی در میانه او گفت‌وگوهای طویل و فرد دیگر بین چت‌های جداگانه

ظرفیت حافظه‌ی گسترده: مدل‌های قبلی توانایی نگه داری عرصه در مکالمات مختصر‌تر را داشتند، اما وقتی که مکالمه به چندین تبادل یا موضوعات گوناگون گسترش می‌یافت، طبق معمولً دچار مشکل فراموشی می‌شدند. مدل «توت‌فرنگی» به طوری طراحی شده است که بتواند به‌طور مؤثرتری تعامل های قبلی را برای بیاورد و ادغام کند، به‌طوری‌که کاربران نیازی به تکرار اطلاعات نداشته باشند و مکالمات به‌طور طبیعی و روان ادامه اشکار کند.

مکانیزم حافظه‌ی سلسله‌مراتبی: «توت‌فرنگی» امکان پذیر از یک سیستم حافظه‌ی سلسله‌مراتبی منفعت گیری کند که به آن امکان می‌دهد با اهمیت ترین قسمت‌های اطلاعات را در طول زمان برتری‌بندی و نگه داری کند. این مکانیزم به مدل این امکان را می‌دهد که جزئیات کلیدی از یک مکالمه را به‌طور انتخابی ذخیره کند و در صورت نیاز برای بیاورد، بدون آنکه در داده‌های کم‌اهمیت‌تر، سردرگم بشود.

داده‌های آموزشی و پایگاه دانش

شبیه مدل‌های قبل، «توت‌فرنگی» روی یک مجموعه‌ی عظیم و متنوع از داده‌ها و به گمان زیادً با یک مجموعه‌‌داده‌ی گسترده‌تر و جدیدتر آموزش می‌بیند. این آموزش گسترده به مدل امکان می‌دهد تا از دانش وسیعی منفعت ببرد و مطمعن حاصل کند که جواب‌های آن دقیق و به‌روز باقی می‌ماند.

امکان پذیر مدل «توت‌فرنگی» توانمندیهای ملزوم را برای افزایش دانش خود در طول زمان داشته باشد

در حالی که جزئیات توانمندیهای یادگیری «توت‌فرنگی» به‌طور کامل آشکار نشده، امکان پذیر این مدل شامل مکانیزم‌هایی برای یادگیری مستمر باشد. به این معنی که مدل بعد از اراعه به‌طور دوره‌ای با اطلاعات تازه به‌روزرسانی بشود. این ویژگی اجازه می‌دهد مدل مدام به‌روز و کاربردی باقی بماند.

کاربردها و گمانه‌زنی‌هایی برای آینده‌ توت‌فرنگی

مدل تازه «توت‌فرنگی» از شرکت اوپن‌ای‌آی، درهای جدیدی را به روی طیف وسیعی از کاربردهای شوق‌انگیز در صنایع گوناگون باز می‌کند. با قابلیت‌های گسترش یافتهی استدلال و پردازش چندگانه، این مدل می‌تواند ماموریت های پیچیده‌تری را با دقت بیشتری انجام دهد و به این ترتیب، انقلابی در نحوه‌ی منفعت گیری از هوش مصنوعی در قسمت‌هایی همانند بهداشت و درمان، آموزش، کسب‌وکار، صنایع خلاق و حتی قسمت‌های دیگر تشکیل کند.

اگرچه تعداد بسیاری از این کاربردها تا این مدت در مرحله های ابتدایی و نظری می باشند، بهبودهای «توت‌فرنگی» مشخص می کند که این مدل تأثیرات گسترده‌ای بر فناوری‌های جاری و نوظهور خواهد داشت. در ادامه، به برخی از کاربردهای بالقوه و پیش‌بینی‌هایی درمورد‌ی مدل «توت‌فرنگی» خواهیم پرداخت.

درمان و تحقیقات پزشکی

یکی از کاربردهای امیدوارکننده‌ی مدل «توت‌فرنگی» در حوزه‌ی بهداشت و درمان و تحقیقات پزشکی است. توانمندیهای گسترش یافتهی استدلال و پردازش چندگانه‌ی مدل «توت‌فرنگی» آن را به گزینه‌ای ایدئال برای پشتیبانی به تشخیص بیماری‌ها، تجزیه‌‌وتحلیل تصاویر پزشکی و طراحی برنامه‌های درمان شخصی‌سازی‌شده تبدیل می‌کند.

«توت‌فرنگی» می‌تواند علائم اولیه‌ی بیماری‌هایی همانند سرطان یا مشکلات قلبی‌عروقی را شناسایی کند

تشخیص پزشکی: مدل «توت‌فرنگی» می‌تواند به متخصصان بهداشت و درمان در تشخیص دقیق‌تر بیماری‌ها با تجزیه‌وتحلیل مجموعه‌‌داده‌های بزرگ شامل اسبق پزشکی، نتایج آزمایشگاهی و تاریخچه‌ی بیماران پشتیبانی کند. قابلیت‌های استدلالی گسترش یافتهی آن این امکان را می‌دهد که الگوهایی را که امکان پذیر توسط راه حلهای تشخیصی سنتی یا حتی مدل‌های هوش مصنوعی قدیمی‌تر نادیده گرفته شوند، شناسایی کند. برای مثال، این مدل می‌تواند علائم اولیه‌ی بیماری‌هایی همانند سرطان یا مشکلات قلبی‌عروقی را بر پایه داده‌های پیچیده شناسایی کند.

دسته بنی مطالب

[ad_2]