چت جی پی تی چطور کار می کند؟

0

چت جی پی تی یکی از درخشان‌ترین ابزارهای جدید مبتنی بر هوش مصنوعی است، اما الگوریتم‌هایی که در پس‌زمینه کار می‌کنند در واقع از سال ۲۰۲۰ به این سو در حال ارائه خدمات به طیف وسیعی از برنامه‌ها و سرویس‌ها هستند. بنابراین برای درک نحوه عملکرد ChatGPT، باید با صحبت در مورد زبان اصلی شروع کنیم. موتوری که به آن نیرو می دهد.

GPT در چت جی پی تی بیشتر به GPT-3 اشاره می کند که سرنامGenerative Pre-trained Transformer 3 یا مبدل آموزش دیده مولد است. البته GPT-4 اکنون برای مشترکین ChatGPT Plus در دسترس است و احتمالا به زودی در دسترس عموم قرار می گیرد. مدل‌های GPT توسط OpenAI (شرکت سازنده چت جی پی تی و تولیدکننده تصویرساز DALL·E 2) توسعه یافته‌اند، اما همه چیز را از ویژگی‌های هوش مصنوعی Bing گرفته تا ابزارهای نوشتن مانند Jasper و Copy.ai را تامین می‌کنند. در واقع، اکثر تولیدکنندگان متن هوش مصنوعی موجود در حال حاضر از GPT-3 استفاده می کنند و احتمالا GPT-4 را به عنوان مرحله بعدی ارائه خواهند کرد.

هوش مصنوعی برای عموم توسط ChatGPT GPT-3 بر روی زبان افتاد زیرا فرآیند تعامل با یک تولید کننده متن هوش مصنوعی را ساده کرده و مهمتر از همه، رایگان ارائه داد. به علاوه، این یک ربات چت است و مردم از زمان SmarterChild عاشق یک چت بات خوب بوده اند.

مطالب پیشنهادی: مهندسی پرامپت چیست؟

در حالی که GPT-3 و GPT-4 در حال حاضر محبوب ترین مدل های زبان بزرگ (LLM)، در چند سال آینده، احتمالا رقابت بسیار بیشتری وجود خواهد داشت. به عنوان مثال، گوگل Bard – ربات چت هوش مصنوعی خود – را دارد که توسط موتور زبان خود Pathways Language Model (PaLM 2) پشتیبانی می‌شود. اما در حال حاضر، OpenAI استاندارد صنعت است. این ساده‌ترین ابزاری است که افراد می‌توانند به آن دست پیدا کنند.

بنابراین پاسخ به سوال « چت جی پی تی چطور کار می کند؟» اساسا عبارت است از: GPT-3 و GPT-4. اما بیایید کمی عمیق تر شویم.

چت جی پی تی چیست؟

ChatGPT یک برنامه ساخته شده توسط OpenAI است. جی پی تی با استفاده از مدل‌های زبان، می‌تواند به سؤالات شما پاسخ دهد، نسخه‌ای بنویسد، ایمیل‌های پیش‌نویس بنویسد، مکالمه داشته باشد، کدها را به زبان‌های برنامه‌نویسی مختلف توضیح دهد، زبان طبیعی را به کد ترجمه کند و موارد دیگر – یا حداقل تلاش کند – و همه این کارها را بر اساس زبان طبیعی انسان انجام می دهد. از شما می خواهد که او سوال کنید. این یک ربات چت است، اما یک ربات واقعا، واقعا خوب.

اگر می‌خواهید مثلا یک متن شاعرانه در مورد حیوان خانگی خود بنویسید یا چند ایده برای ایمیل‌های بازاریابی کسب کنید، بازی کردن با آن جالب است. اما این یک رابطه دو طرفه بوده و برای OpenAI نیز خوب است. این روشی برای دریافت داده های زیادی از کاربران واقعی است و به عنوان یک نسخه نمایشی فانتزی برای قدرت GPT عمل می کند، که در غیر این صورت ممکن است کمی مبهم به نظر برسد، مگر اینکه در یادگیری ماشین متخصص باشید.

در حال حاضر، چت جی پی تی دو مدل GPT ارائه می دهد. پیش فرض، GPT-3.5، قدرت کمتری دارد اما به صورت رایگان در دسترس همه است. GPT-4 پیشرفته تر که به مشترکین ChatGPT Plus محدود می شود و حتی هر روز فقط تعداد محدودی سؤال می توانند بپرسند.

یکی از ویژگی‌های بزرگ چت جی پی تی این است که می‌تواند مکالمه‌ای که با آن دارید را به خاطر بسپارد. این بدان معناست که می‌تواند زمینه را از هر آنچه قبلا از آن خواسته‌اید جمع‌آوری کند و سپس از آن برای اطلاع‌رسانی به مکالمه‌اش با شما استفاده کند. همچنین می‌توانید درخواست اصلاحات کنید و به هر آنچه قبلا در مورد آن صحبت می‌کردید اشاره می‌کند. این باعث می شود که تعامل با هوش مصنوعی مانند یک رفت و برگشت واقعی باشد.

چت جی پی تی چطور کار می کند؟

ChatGPT تلاش می کند پیام شما را درک کرده و سپس مجموعه ای از کلمات ارائه می دهد که پیش‌بینی می‌کند بهترین پاسخ به سؤال شما بر اساس داده‌هایی است که روی آن آموزش دیده است.

اکنون بیایید در مورد آموزش چت جی پی تی صحبت کنیم. این آموزش شامل فرآیندی می شود که در آن برخی از قوانین اساسی به هوش مصنوعی ارائه می شود و سپس یا در موقعیت‌هایی قرار می‌گیرد یا داده‌های زیادی به آن داده می شود تا با استفاده از آن قوانین، الگوریتم‌های خود را توسعه بدهد.

GPT-3 بر روی تقریبا ۵۰۰ میلیارد «توکن» آموزش داده شده است، که به مدل‌های زبانی آن اجازه می‌دهد راحت‌تر معنی را درک کرده و متن بعدی قابل قبول را پیش‌بینی کنند. بسیاری از کلمات به نشانه‌های منفرد نگاشت می‌شوند، اگرچه کلمات طولانی‌تر یا پیچیده‌تر اغلب به چندین نشانه تقسیم می‌شوند. به طور متوسط، توکن ها تقریبا چهار کاراکتر طول دارند. OpenAI درباره عملکرد درونی GPT-4 سکوت کرده، اما می‌توانیم با خیال راحت فرض کنیم که این مجموعه تقریبا بر روی همان مجموعه داده آموزش دیده است زیرا قدرتمندتر است.

توکن های چت جی پی تی
توکن های چت جی پی تی

تمام توکن ها از مجموعه عظیمی از داده های نوشته شده توسط انسان ها به دست آمده اند. این داده ها شامل کتاب‌ها، مقاله‌ها و سایر اسناد در تمام موضوعات، سبک‌ها و ژانرهای مختلف و مقدار باورنکردنی محتوایی است که از اینترنت باز حذف شده اند. اساسا اجازه داده شد که از مجموع دانش بشری خرد شود.

این مجموعه داده عظیم برای تشکیل یک شبکه عصبی یادگیری عمیق – یک الگوریتم پیچیده، چند لایه و وزن‌دار که از مغز انسان مدل‌سازی شده است – استفاده شد که به ChatGPT اجازه داد الگوها و روابط را در داده‌های متنی بیاموزد و از توانایی ایجاد انسان‌مانند استفاده کند. پاسخ ها را با پیش بینی اینکه چه متنی باید در هر جمله داده شده بعدی بیاید.

چت جی پی تی در سطح جمله کار نمی کند – در عوض، متنی از کلمات، جملات، و حتی پاراگراف ها یا بند ها را تولید می کند. این متن پیشگویانه روی تلفن شما نیست که صراحتا کلمه بعدی را حدس می‌زند. تلاش برای ایجاد پاسخ های کاملا منسجم به هر درخواستی است.

برای اصلاح بیشتر توانایی ChatGPT برای پاسخ به انواع درخواست‌های مختلف، تکنیکی به نام یادگیری تقویتی با بازخورد انسانی (RLHF) بهینه شد. اساسا، انسان ها یک مدل پاداش با داده های مقایسه ایجاد کردند (که در آن دو یا چند پاسخ مدل توسط مربیان هوش مصنوعی رتبه بندی شدند)، بنابراین هوش مصنوعی می توانست یاد بگیرد که بهترین پاسخ کدام است.

به شبکه عصبی که تشکیل داده شد برگردیم, بر اساس تمام آن آموزش‌ها، شبکه عصبی GPT-3 دارای ۱۷۵ میلیارد پارامتر یا متغیر است که به آن اجازه می‌دهد یک ورودی – درخواست شما – را دریافت کرده و سپس، بر اساس مقادیر و وزن‌هایی که به پارامترهای مختلف می‌دهد (و مقدار کمی تصادفی) هر آنچه را که فکر می کند با درخواست شما منطبق است را خروجی می دهد. OpenAI اعلام نکرده است که GPT-4 چند پارامتر دارد، اما می توان حدس زد که بیش از ۱۷۵ میلیارد و کمتر از ۱۰۰ تریلیون پارامتری است که زمانی شایعه شده بود. صرف نظر از تعداد دقیق، پارامترهای بیشتر به طور خودکار به معنای بهتر بودن نیست. بخشی از افزایش قدرت GPT-4 احتمالا ناشی از داشتن پارامترهای بیشتر از GPT-3 است، اما بسیاری از موارد احتمالا به بهبود نحوه آموزش آن بستگی دارد.

در پایان، ساده ترین راه برای تصور نحوه کار چت جی پی تی، مانند یکی از آن بازی های “جمله را تمام کن” است که در کودکی انجام داده اید. به عنوان مثال، وقتی به چت جی پی تی با استفاده از GPT-3 دستور دادم، “Zapier is…” پاسخ داد و گفت:

«Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می‌دهد تا برنامه‌های وب مختلف را به یکدیگر متصل کنند تا کارهای تکراری را خودکار کرده و گردش کار را بهبود بخشد.»

این جمله‌ای است که می‌توانید در صدها مقاله بیابید که کارهای زاپیر را توصیف می‌کند، بنابراین منطقی است که این همان چیزی است که در اینجا ارائه می‌دهد. اما وقتی ویرایشگر من همان دستور را داد، گفت:

«Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می‌دهد تا برنامه‌های وب مختلف را به هم متصل کرده و گردش کار بین آنها را خودکار کنند.»

این دو پاسخ تقریبا شبیه است، اما دقیقاً همان پاسخ نیست. این تصادفی بودن (که می‌توانید در برخی از برنامه‌های GPT-3 با تنظیمی به نام «دما» کنترل کنید) تضمین می‌کند که ChatGPT فقط به تک تک پاسخ‌ها یک پاسخ یکسان نمی‌دهد. هر بار هر فرمان را در کل شبکه عصبی اجرا می کند و چند تاس را اینجا و آنجا می اندازد تا همه چیز را تازه نگه دارد. به احتمال زیاد نمی توان ادعا کرد که Zapier رنگی از مریخ است، اما کلمات زیر را بر اساس احتمال نسبی آنها مخلوط می کند.

وقتی همین دستور را در GPT-4، نوشتیم، گفت: «Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می دهد وظایف را بین برنامه ها و سرویس های آنلاین مختلف یکپارچه و خودکار کنند.»

ارائه دادن کلمات، نه دانش

سازندگان چت جی پی تی اولین کسانی هستند که می‌گویند این ابزار می‌تواند اطلاعات نادرست (و احتمالا مضر) تولید کند، اگرچه سخت برای رفع آن تلاش می‌کنند.

برای مثال، وقتی از چت جی پی تی با استفاده از GPT-3 و GPT-4 خواستم به «هری گینس هست…» پاسخ دهد، GPT-3 ابتدا با پرسیدن کدام هری گینس پاسخ داد. سوال عالی – ما به معنای واقعی کلمه دو نفر هستیم! بنابراین من گفتم: «هری گینس نویسنده» (این من هستم). GPT-4 بلافاصله حدس زد که من کی هستم، اگرچه هر دو پاسخ جذاب بودند:

GPT-3: هری گینس نویسنده و روزنامه نگار مستقل مقیم ایرلند است. او برای نشریات مختلفی از جمله نیویورک تایمز، گاردین، هافینگتون پست و Popular Mechanics نوشته است. او موضوعاتی از فناوری و عکاسی گرفته تا سفر و فرهنگ را پوشش می دهد.

GPT-4: هری گینس نویسنده، عکاس و متخصص فناوری ایرلندی است. او برای نشریات مختلفی از جمله How-To Geek، Lifehacker و Tuts+ نوشته است. کار او در درجه اول بر فناوری، آموزش ها و نکات و همچنین عکاسی و ویرایش تصویر متمرکز است. گینس برای ایجاد راهنماهای دقیقی که به خوانندگان کمک می کند موضوعات پیچیده را درک کنند یا مشکلات را به روشی ساده حل کنند، شهرت پیدا کرده است.

اولین و آخرین خط GPT-3 تقریبا به کلماتی از وب سایت های مختلف و بیوگرافی نویسنده در سراسر وب استخراج می شود (اگرچه من معمولا خود را به عنوان یک نویسنده و عکاس آزاد و نه یک روزنامه نگار معرفی می کنم). اما فهرست نشریات اساسا ساخته شده است. من برای نیویورک تایمز نوشته ام، اما نه برای گاردین، هافینگتون پست، یا Popular Mechanics (من به طور منظم برای Popular Science می نویسم، بنابراین ممکن است از آنجا آمده باشد).

GPT-4 بخش عکاس را به درستی درک کرده و در واقع برخی از نشریاتی که برای آنها نوشته ام را فهرست می کند، که بسیار چشمگیر است. اگرچه جاهایی نیستند که من به آنها افتخار کنم. این یک مثال عالی از این است که چگونه OpenAI توانسته است دقت GPT-4 را نسبت به GPT-3 افزایش دهد، اگرچه ممکن است همیشه صحیح ترین پاسخ را ارائه ندهد.

اما بیایید به GPT-3 برگردیم زیرا خطای آن مثال جالبی از آنچه در پشت صحنه در چت جی پی تی می گذرد را ارائه می دهد. در واقع چیزی در مورد من نمی داند. حتی کپی/پیست کردن از اینترنت و اعتماد به منبع اطلاعات نیست. در عوض، صرفا یک رشته از کلمات را پیش‌بینی می‌کند که بر اساس میلیاردها نقطه داده‌ای که دارد، بعدی خواهند آمد.

به عنوان مثال: «نیویورک تایمز» بسیار بیشتر با «گاردین» و «هافینگتون پست» گروه بندی می شود تا با نشریاتی که من برای آنها نوشته ام، مانند Wired، Outside، The Irish Times. بنابراین، وقتی باید مشخص کند که چه چیزی باید بعد از کلمه نیویورک تایمز بیاید، از اطلاعات منتشر شده در مورد من استفاده نمی کند. لیستی از نشریات بزرگ را از تمام داده های آموزشی که دارد استخراج می کند. این بسیار هوشمندانه است و قابل قبول به نظر می رسد، اما واقعیت ندارد.

GPT-4 کار بسیار بهتری انجام می دهد و نشریات را بررسی می کند، اما بقیه چیزهایی که می گوید واقعا شبیه جمله بندی قابل قبول است. فکر نمی‌کنم چیز خاصی از شهرت من بداند: این فقط همان چیزی است که یک بیوگرافی می‌گوید. در پنهان کردن نحوه عملکرد، بسیار بهتر از GPT-3 است، اگرچه در واقع از همان تکنیک استفاده می کند.

با این حال، بسیار چشمگیر است که چقدر نسبت به GPT قبلی بهبود یافته است. در حال حاضر، GPT-4 پشت یک اشتراک ممتاز قفل شده است، بنابراین بیشتر محتوای ChatGPT که می بینید به GPT-3 متکی هستند، اما ممکن است در آینده تغییر کند. چه کسی می داند GPT-5 چه چیزی را به ارمغان خواهد آورد.

منبع: https://zapier.com/blog/how-does-chatgpt-work

 

ارسال دیدگاه

آدرس ایمیل شما منتشر نخواهد شد.