راهنمای شما برای ChatGPT و هوش مصنوعی تعاملی

رمزارز و بلاک چین را فراموش کنید. ChatGPT فناوری جدید در شهر است و باید زبان آن را بدانید.

مدل های زبان بزرگ شبکه های عصبی. مهندسی سریع NLP. NLU. NLG. سروصدای این فناوری پیشرفته در همه جا وجود دارد، و اگر می‌خواهید ادامه دهید، درک عبارات و اصطلاحات کلیدی هوش مصنوعی بسیار مهم است

نگران نباشید. واژه نامه اصطلاحات هوش مصنوعی ما به گونه ای طراحی شده است که به شما کمک کند در دنیای پرسرعت هوش مصنوعی پیمایش کنید و مانند یک حرفه ای در مکالمه شرکت کنید. ما همچنان به به روز رسانی این فهرست از تعاریف ادامه خواهیم داد، زیرا اصطلاحات لازم برای دانستن بیشتر در مورد آنها وجود دارد، بنابراین این واژه نامه را نشانه گذاری کنید و آن را در جیب عقب خود نگه دارید. به زودی، شما آماده خواهید بود که با دانش جدید خود در مورد همه چیزهای هوش مصنوعی محاوره ای تحت تأثیر قرار دهید.

واژه نامه هوش مصنوعی (2023)

هوش مصنوعی Artificial Intelligence

شبیه سازی هوش انسان در ماشین هایی که طوری برنامه ریزی شده اند که مانند انسان فکر کنند و یاد بگیرند. مثال: خودروی خودرانی که می تواند به تنهایی با استفاده از فناوری هوش مصنوعی حرکت کند و تصمیم بگیرد.

چت ربات ها ChatBots

یک رابط کاربر پسند که به کاربر اجازه می دهد سوال بپرسد و پاسخ دریافت کند. بسته به سیستم باطنی که به چت بات کمک می‌کند، می‌تواند به اندازه پاسخ‌های از پیش نوشته شده به یک هوش مصنوعی کاملاً مکالمه‌ای باشد که حل مسئله را خودکار می‌کند.

چت جی پی تی ChatGPT

یک رابط چت که بر روی GPT-3.5 ساخته شده است. GPT-3.5 یک مدل زبان بزرگ است که توسط OpenAI توسعه یافته است که بر روی حجم عظیمی از داده های متنی اینترنتی آموزش داده شده و برای انجام طیف گسترده ای از وظایف زبان طبیعی به خوبی تنظیم شده است. مثال: GPT-3.5 برای کارهایی مانند ترجمه زبان، خلاصه سازی متن و پاسخگویی به سوالات به خوبی تنظیم شده است.

شبیه سازی هوش انسان در ماشین هایی که طوری برنامه ریزی شده اند که مانند انسان فکر کنند و یاد بگیرند. مثال: خودروی خودرانی که می تواند به تنهایی با استفاده از فناوری هوش مصنوعی حرکت کند و تصمیم بگیرد.

هوش مصنوعی مکالمه ای Conversational AI

زیرشاخه‌ای از هوش مصنوعی که بر توسعه سیستم‌هایی تمرکز دارد که می‌توانند زبان انسان‌مانند را درک و تولید کنند و مکالمه‌ای پشت سر هم انجام دهند. مثال: یک ربات چت که می تواند سوالات مشتری را به روشی طبیعی و شبیه انسان درک کند و به آنها پاسخ دهد.

یادگیری عمیق Deep Learning

زیرشاخه ای از ML که از شبکه های عصبی با لایه های متعدد برای یادگیری از داده ها استفاده می کند. مثال: یک مدل یادگیری عمیق که می تواند اشیاء موجود در یک تصویر را با پردازش تصویر از طریق چندین لایه شبکه های عصبی تشخیص دهد.

مدل های تشخیص دهنده Discriminative Models

مدل هایی که یک نمونه داده را طبقه بندی می کنند و یک برچسب را پیش بینی می کنند. به عنوان مثال، مدلی که تشخیص می دهد یک عکس سگ است یا گربه.

تنظیم دقیق Fine-tuning

فرآیند تطبیق یک مدل از پیش آموزش دیده با یک کار خاص با آموزش آن بر روی یک مجموعه داده کوچکتر. به عنوان مثال، یک مدل طبقه‌بندی تصویر آموزش‌دیده بر روی تمام تصاویر تقاطع‌ها می‌تواند به خوبی بچرخد تا تشخیص دهد که ماشین از چراغ قرمز عبور می‌کند. در Moveworks، سال‌هاست که LLM‌ها را برای پشتیبانی سازمانی تنظیم کرده‌ایم.

هوش مصنوعی مولد Generative AI

مدل‌های هوش مصنوعی مولد داده‌های جدیدی را با کشف الگوهایی در ورودی داده‌ها یا داده‌های آموزشی ایجاد می‌کنند. به عنوان مثال، ایجاد یک داستان کوتاه اصلی بر اساس تجزیه و تحلیل داستان های کوتاه موجود و منتشر شده.

ترانسفورماتور از پیش آموزش دیده ژنراتیو Generative Pre-trained Transformer (or “GPT”)

نوعی از مدل یادگیری عمیق آموزش داده شده بر روی یک مجموعه داده بزرگ برای تولید متنی شبیه انسان، معماری زیربنایی ChatGPT

جی پی تی تری GPT-3

GPT-3 سومین نسخه از سری مدل های GPT-n است. دارای 175 میلیارد پارامتر – دستگیره هایی که می توان تنظیم کرد – با وزنه هایی برای پیش بینی. Chat-GPT از GPT-3.5 استفاده می کند که یکی دیگر از تکرارهای این مدل است.

جی پی تی فور GPT-4

GPT-4 آخرین مدل اضافه شده به تلاش های یادگیری عمیق OpenAI است و نقطه عطفی قابل توجه در مقیاس یادگیری عمیق است. GPT-4 همچنین اولین مدل از مدل های GPT است که یک مدل چندوجهی بزرگ است، به این معنی که هم ورودی های تصویر و هم متن را می پذیرد و خروجی های متن را منتشر می کند.

زمینی کردن (اصطلاحا واقعی کردن) Grounding

Grounding فرآیند تثبیت سیستم های هوش مصنوعی (AI) در تجربیات، دانش یا داده های دنیای واقعی است. هدف این است که درک هوش مصنوعی از جهان را بهبود بخشد، به طوری که بتواند به طور موثر ورودی ها، پرس و جوها و وظایف کاربر را تفسیر کند و به آنها پاسخ دهد. زمین‌گذاری به سیستم‌های هوش مصنوعی کمک می‌کند تا نسبت به زمینه آگاه‌تر شوند و به آن‌ها اجازه می‌دهد پاسخ‌ها یا اقدامات بهتر، مرتبط‌تر و مرتبط‌تری ارائه دهند.

توهم Hallucination

توهم به وضعیتی اشاره دارد که در آن یک سیستم هوش مصنوعی، به ویژه سیستمی که با پردازش زبان طبیعی سروکار دارد، خروجی هایی تولید می کند که ممکن است بر اساس ورودی ارائه شده نامربوط، بی معنی یا نادرست باشند. این اغلب زمانی اتفاق می‌افتد که سیستم هوش مصنوعی از متن مطمئن نیست، بیش از حد به داده‌های آموزشی خود متکی است یا درک درستی از موضوع ندارد.

مدل زبان بزرگ (یا “LLM”) Large Language Model

یک نوع مدل یادگیری عمیق که بر روی یک مجموعه داده بزرگ آموزش داده شده است تا وظایف درک زبان طبیعی و تولید را انجام دهد. بسیاری از LLM های معروف مانند BERT، PalM، GPT-2، GPT-3، GPT-3.5 و GPT-4 پیشگامانه وجود دارند. همه این مدل‌ها از نظر اندازه (تعداد پارامترهایی که می‌توانند تنظیم شوند)، وسعت وظایف (کدنویسی، چت، علمی و غیره) و آنچه که در آن آموزش دیده‌اند، متفاوت هستند.

یادگیری ماشینی (یا “ML”) Machine Learning 

زیرشاخه‌ای از هوش مصنوعی که شامل توسعه الگوریتم‌ها و مدل‌های آماری است که ماشین‌ها را قادر می‌سازد تا عملکرد خود را با تجربه بهبود بخشند. مثال: یک الگوریتم یادگیری ماشینی که می‌تواند پیش‌بینی کند کدام مشتریان بر اساس رفتار گذشته‌شان به احتمال زیاد از بین می‌روند.

یک نوع مدل یادگیری عمیق که بر روی یک مجموعه داده بزرگ آموزش داده شده است تا وظایف درک زبان طبیعی و تولید را انجام دهد. بسیاری از LLM های معروف مانند BERT، PalM، GPT-2، GPT-3، GPT-3.5 و GPT-4 پیشگامانه وجود دارند. همه این مدل‌ها از نظر اندازه (تعداد پارامترهایی که می‌توانند تنظیم شوند)، وسعت وظایف (کدنویسی، چت، علمی و غیره) و آنچه که در آن آموزش دیده‌اند، متفاوت هستند.

مدل زبان چندوجهی Multimodal Language Model

شبیه به یک مدل زبان بزرگ، یک مدل زبان چندوجهی نوعی از مدل یادگیری عمیق است که بر روی مجموعه داده های بزرگ آموزش داده می شود، اما بر خلاف مدل های زبان بزرگ که فقط بر روی داده های متنی آموزش داده می شوند، مدل های زبان چندوجهی هم بر روی داده های متنی و هم بر روی داده های غیر متنی آموزش داده می شوند. این به آن اجازه می دهد تا به چندین روش ورودی مانند متن، تصاویر، صدا و ویدئو پاسخ دهد.

آموزش N-Shot Learning

یادگیری صفر/تک/چند شات تغییراتی از یک مفهوم هستند – ارائه مدلی با داده های آموزشی کم یا بدون داده برای طبقه بندی داده های جدید و راهنمایی پیش بینی ها. یک “شات” یک نمونه آموزشی واحد را نشان می دهد. واقعیت جالب: در اعلان GPT، می‌توانید برای بهبود دقت پاسخ، مثال‌های «N» بخواهید.

تولید زبان طبیعی (یا “NLG”) Natural Language Generation

زیر شاخه ای از هوش مصنوعی که زبان نوشتاری یا گفتاری طبیعی را تولید می کند.

پردازش زبان طبیعی (یا “NLP”) Natural Language Processing

زیر شاخه ای از هوش مصنوعی که زبان نوشتاری یا گفتاری طبیعی را تولید می کند.

زیر شاخه ای از هوش مصنوعی که شامل برنامه نویسی کامپیوترها برای پردازش حجم عظیمی از داده های زبان است. بر تبدیل متن آزاد به یک ساختار استاندارد تمرکز دارد.

درک زبان طبیعی (یا “NLU”) Natural Language Understanding

موضوع فرعی NLP که متن را تجزیه و تحلیل می کند تا معنای معنایی را از زبان نوشتاری به دست آورد. این به معنای درک زمینه، احساسات، قصد و غیره است.

شبکه عصبی Neural Network

یک مدل یادگیری ماشینی با الهام از ساختار و عملکرد مغز انسان که از لایه‌هایی از گره‌های به هم پیوسته یا «نرون‌ها» تشکیل شده است. مثال: یک شبکه عصبی که می تواند ارقام دست نویس را با دقت بالا تشخیص دهد.

شرکت OpenAI

سازمانی که ChatGPT را توسعه داد. به طور گسترده تر، OpenAI یک شرکت تحقیقاتی است که هدف آن توسعه و ترویج هوش مصنوعی دوستانه مسئولانه است. مثال: مدل GPT-3 OpenAI یکی از بزرگترین و قدرتمندترین مدل های زبان موجود برای وظایف پردازش زبان طبیعی است.

بهينه سازي Optimization

فرآیند تنظیم پارامترهای یک مدل برای به حداقل رساندن یک تابع ضرر که تفاوت بین پیش‌بینی‌های مدل و مقادیر واقعی را اندازه‌گیری می‌کند. مثال: بهینه سازی پارامترهای شبکه عصبی با استفاده از یک الگوریتم گرادیان نزول برای به حداقل رساندن خطا بین پیش بینی های مدل و مقادیر واقعی.

بیش از حد برازش Overfitting

مشکلی که زمانی رخ می دهد که یک مدل بیش از حد پیچیده باشد، در داده های آموزشی عملکرد خوبی دارد اما در داده های دیده نشده ضعیف است. مثال: مدلی که به جای یادگیری الگوهای کلی، داده های آموزشی را به خاطر سپرده است و در نتیجه روی داده های جدید ضعیف عمل می کند.

قبل از آموزش Pre-training

آموزش یک مدل بر روی یک مجموعه داده بزرگ قبل از تنظیم دقیق آن برای یک کار خاص. مثال: پیش آموزش یک مدل زبان مانند ChatGPT بر روی مجموعه بزرگی از داده های متنی قبل از تنظیم دقیق آن برای یک کار خاص زبان طبیعی مانند ترجمه زبان.

مهندسی سریع Prompt Engıneerıng

شناسایی ورودی‌ها – درخواست‌ها – که منجر به خروجی‌های معنادار می‌شود. در حال حاضر، مهندسی سریع برای LLM ضروری است. LLM ها تلفیقی از لایه هایی از الگوریتم ها هستند و در نتیجه قابلیت کنترل محدودی با فرصت های کمی برای کنترل و نادیده گرفتن رفتار دارند. نمونه ای از مهندسی سریع ارائه مجموعه ای از الگوها و جادوگران برای هدایت یک برنامه کپی رایتینگ است.

یادگیری تقویتی Reinforcement Learning

نوعی از یادگیری ماشینی که در آن یک مدل می آموزد با تعامل با محیط خود و دریافت بازخورد از طریق پاداش یا مجازات تصمیم گیری کند. GPT از یادگیری تقویتی از بازخورد انسانی استفاده می کند. هنگام تنظیم GPT-3، حاشیه نویسان انسانی نمونه هایی از رفتار مدل مورد نظر را ارائه کردند و خروجی های مدل را رتبه بندی کردند.

مدلسازی دنباله ای Sequence Modeling

زیرشاخه ای از NLP که بر مدل سازی داده های متوالی مانند داده های متن، گفتار یا سری زمانی تمرکز دارد. مثال: یک مدل توالی که می تواند کلمه بعدی را در یک جمله پیش بینی کند یا متنی منسجم ایجاد کند.

فرمان پذیری Steerability

قابلیت هدایت هوش مصنوعی به توانایی هدایت یا کنترل رفتار و خروجی یک سیستم هوش مصنوعی بر اساس نیات انسان یا اهداف خاص اشاره دارد. این شامل طراحی مدل‌های هوش مصنوعی با مکانیسم‌هایی است که اولویت‌های ارائه‌شده توسط کاربران را درک می‌کنند و به آنها پایبند هستند، در حالی که از نتایج ناخواسته یا نامطلوب اجتناب می‌کنند. بهبود هدایت پذیری مستلزم تحقیق و اصلاح مداوم است، از جمله تکنیک هایی مانند تنظیم دقیق، سیستم های مبتنی بر قانون، و اجرای حلقه های بازخورد انسانی اضافی در طول توسعه هوش مصنوعی.

یادگیری تحت نظارت Supervised Learning

نوعی از یادگیری ماشینی که در آن یک مدل بر روی داده های برچسب دار آموزش داده می شود تا در مورد داده های جدید و دیده نشده پیش بینی کند. مثال: یک الگوریتم یادگیری نظارت شده که می تواند تصاویر ارقام دست نویس را بر اساس داده های آموزشی برچسب گذاری شده طبقه بندی کند

.

توکن سازی Tokenization

فرآیند شکستن متن به کلمات یا زیرکلمات جداگانه برای وارد کردن آنها به یک مدل زبان. مثال: توکن کردن جمله «I am ChatGPT» به کلمات: «I»، «am»، «Chat»، «G» و «PT».

تبدیل کننده Transformer

نوعی معماری شبکه عصبی که برای پردازش داده های متوالی مانند متن طراحی شده است. مثال: معماری ترانسفورماتور در مدل هایی مانند ChatGPT برای وظایف پردازش زبان طبیعی استفاده می شود.

یادگیری بدون نظارت Supervised Learning

نوعی یادگیری ماشینی که در آن یک مدل بر روی داده های بدون برچسب آموزش می بیند تا الگوها یا ویژگی هایی را در داده ها پیدا کند. مثال: یک الگوریتم یادگیری بدون نظارت که می‌تواند تصاویر مشابه ارقام دست‌نویس را بر اساس ویژگی‌های بصری آن‌ها دسته‌بندی کند.

آماده اید تا عمیق تر به دنیای هوش مصنوعی مکالمه ای بروید؟
امیدواریم این واژه نامه اصطلاحات هوش مصنوعی یک مرور کلی از مفاهیم کلیدی در زمینه هوش مصنوعی محاوره ای ارائه کرده باشد. اگر به دنبال کاوش عمیق تر و ادامه کاوش در امکانات هوش مصنوعی در فناوری اطلاعات هستید، منابع متعددی برای مطالعه بیشتر در دسترس هستند. از تحقیقات دانشگاهی و پست های اجتماعی گرفته تا وبلاگ ها و پادکست ها، فرصت های رشد و کشف در دنیای هوش مصنوعی واقعا بی پایان است.