یادگیری ماشینی (Machine Learning) یکی از زیرمجموعههای هوش مصنوعی است که روی مطالعه و ساخت الگوریتمهایی با قابلیت یادگیری دادهها و اطلاعات تمرکز دارد. چگونه؟ یعنی چه؟ یعنی اینکه ما یک کد محدود و کوچک مینویسیم و دادههای مناسب را در اختیار آن قرار میدهیم. نمونه بارز آن اتومبیلهای خودران است. با استفاده از یادگیری ماشینی و الگوریتمها و در معرض قرارگیری دادههای متفاوت، آن اتومبیل میآموزد که چگونه رانندگی کند و با استفاده از تمامی سنسورها و گرفتن دادهها، کنترل ابزار مختلف را در دست بگیرد و در چه شرایطی چه واکنشهایی را نشان دهد.
مثال دیگر فروشگاه والمارت است که با استفاده از هوش مصنوعی و دادهکاوی به این نتیجه رسید که باید نوع خاص از یک نوشیدنی را در کنار پوشک بچه بگذارد و با انجام این کار فروش آن نوشیدنی ۴0درصد افزایش پیدا کرد.
پس ما در هوش مصنوعی به جایی رسیدهایم که الگوریتمهایی تولید کنیم که بتوانند یاد بگیرند؛ چه از روی تصویر، دستنوشته و خط بازی تا واکنشهایی در حد رانندگی در یک شهر.
یک مثال ساده. فرض کنید اطلاعاتی از یک خانه شامل منطقه و محدوده، متراژ، تعداد اتاق و ... را داریم و میخواهیم قیمت آن را تعیین کنیم. میتوانیم الگوریتمی بنویسیم که با داشتن این دادهها بتواند قیمت هر خانه دیگری در هر جای شهر را که به آن میدهیم، حدس بزند.
اما چطور میشود الگوریتمهایی تولید کرد که محدودند ولی میتوانند در معرض دادههای مختلف قرار بگیرند و بیاموزند؟ با استفاده از الگوریتمهای یادگیری ماشینی. به طور کلی این الگوریتمها به سه نوع تقسیم میشوند:
۱ – یادگیری نظارتشده Supervised Learning
۲ – یادگیری بدون ناظر Unsupervised Learning
۳ – یادگیری تقویتشده Reinforcement
۱ – در این نوع از الگوریتمها با دو نوع متغیر مواجه هستیم: ۱-۱- متغیرهای مستقل ۱-۲- متغیرهای وابسته
۱-۱- در متغیرهای وابسته چندین متغیر هستند که بر اساس آنها متغیرهای دیگر پیشبینی میشوند. مثلا والمارت برای پیشبینی خرید یک مشتری از دادهها و متغیرهایی نظیر سن، تحصیلات، درآمد و حال روحی و عمده زمانهای خرید آن مشتری استفاده میکند.
۱-۲- نوع دوم هم متغیرهای وابسته یا هدف یا خروجی هستند و قرار است مقادیر آنها را به کمک این الگوریتمها پیشبینی کنیم. برای این منظور باید تابعی ایجاد کنیم که ورودیها (متغیرهای مستقل) را گرفته و خروجی موردنظر (متغیر وابسته یا هدف) را تولید کند.
فرآیند یافتن این تابع که در حقیقت کشف رابطهای بین متغیرهای مستقل و متغیرهای وابسته است را فرآیند آموزش (Training Process) میگوییم که روی دادههای موجود (دادههایی که هم متغیرهای مستقل و هم متغیرهای وابسته آنها معلوم هستند، مثلا خریدهای گذشته مشتریان یک فروشگاه) اعمال میشود و تا رسیدن به دقت لازم ادامه مییابد. نمونههایی از این الگوریتمها عبارتند از: رگرسیون، درختهای تصمیم، جنگلهای تصادفی، N نزدیکترین همسایه و رگرسیون لجستیک.
مدیرعامل اسپید