یادگیری ماشینی مقیاس پذیر روی داده های بزرگ با استفاده از اسپارک آپاچی

مدرس Romeo Kienzler

انتشار 2022/12/12

مدت زمان 2h 28m

سطح مناسب همه

فایل تمرینی ندارد

آموزش Scalable Machine Learning on Big Data using Apache Spark

این دوره شما را با مهارت‌های مقیاس‌بندی وظایف علم داده و یادگیری ماشین (ML) در مجموعه داده‌های بزرگ با استفاده از اسپارک آپاچی توانمند می‌سازد. بیشتر کارهای یادگیری ماشین در دنیای واقعی شامل مجموعه داده های بسیار بزرگی است که فراتر از محدودیت های CPU، حافظه و ذخیره سازی یک کامپیوتر است. Apache Spark یک چارچوب متن باز است که از محاسبات خوشه ای و ذخیره سازی توزیع شده برای پردازش مجموعه داده های بسیار بزرگ به شیوه ای کارآمد و مقرون به صرفه استفاده می کند. بنابراین دانش کاربردی کار با Apache Spark یک دارایی عالی و تمایز بالقوه برای یک مهندس یادگیری ماشین است. پس از تکمیل این دوره، شما قادر خواهید بود: - درک عملی Apache Spark را به دست آورید و آن را برای حل مشکلات یادگیری ماشینی که شامل داده های کوچک و بزرگ است به کار ببرید - درک کنید که چگونه کد موازی نوشته شده است که قادر به اجرا بر روی هزاران CPU است. - از خوشه‌های محاسباتی در مقیاس بزرگ برای اعمال الگوریتم‌های یادگیری ماشین بر روی پتابایت داده‌ها با استفاده از Apache SparkML Pipelines استفاده کنید. - حذف خطاهای خارج از حافظه ایجاد شده توسط چارچوب های یادگیری ماشین سنتی، زمانی که داده ها در حافظه اصلی رایانه جا نمی شوند - هزاران مدل مختلف ML را به صورت موازی آزمایش کنید تا بهترین عملکرد را پیدا کنید - تکنیکی که توسط بسیاری از کاگلرهای موفق استفاده می شود - ( اختیاری) دستورات SQL را با استفاده از Apache SparkSQL و Apache Spark DataFrame API روی مجموعه داده های بسیار بزرگ اجرا کنید. برای یادگیری تکنیک های یادگیری ماشینی برای کار با Big Data که توسط شرکت هایی مانند Alibaba، Apple، Amazon، Baidu، eBay، IBM، NASA، Samsung، SAP، TripAdvisor، Yahoo!، Zalando و بسیاری دیگر با موفقیت به کار گرفته شده اند، همین حالا ثبت نام کنید. توجه: در طول دوره بدون پرداخت هزینه، وظایف یادگیری ماشین را به صورت دستی روی یک کلاستر اسپارک آپاچی ارائه شده توسط IBM تمرین خواهید کرد و پس از آن می توانید به استفاده از آن ادامه دهید. پیش نیازها: - برنامه نویسی پایه پایتون - یادگیری ماشین اولیه (فیلم های مقدماتی اختیاری در این دوره نیز ارائه می شود) - مهارت های اولیه SQL برای محتوای اختیاری دوره های زیر قبل از شرکت در این کلاس توصیه می شود (مگر اینکه قبلاً مهارت های لازم را داشته باشید) https:// www.coursera.org/learn/python-for-applied-data-science یا مشابه https://www.coursera.org/learn/machine-learning-with-python یا مشابه https://www.coursera.org/ Learn/sql-data-science برای سخنرانی های اختیاری

Artificial Intelligence (AI) Big Data Data Science Machine Learning جرقه

Week 1: Introduction-Course Introduction

Introduction to Apache Spark for Machine Learning on BigData ()

What is Big Data? ()

Course Syllabus

Setup of the grading and exercise environment

Week 1: Introduction-Understanding how Apache Spark works

Data storage solutions ()

Parallel data processing strategies of Apache Spark ()

Exercise 1 - working with RDD

Functional programming basics ()

Exercise 2 - functional programming basics with RDDs

Resilient Distributed Dataset and DataFrames - ApacheSparkSQL ()

Exercise 3 - working with DataFrames

Programming Lanuage Options for Apache Spark (optional)

Week 2: Scaling Math for Statistics on Apache Spark-Experience parallel programming on Apache Spark

Averages ()

Standard deviation ()

Skewness ()

Kurtosis ()

Covariance, Covariance matrices, correlation ()

Exercise 1 - statistics and transfomrations using DataFrames

Week 2: Scaling Math for Statistics on Apache Spark-Data Visualization of Big Data

Plotting with ApacheSpark and python's matplotlib ()

Exercise on Plotting

Dimensionality reduction ()

PCA ()

Exercise on PCA

Week 3: Introduction to Apache SparkML-Introduction to Apache SparkML

How ML Pipelines work ()

Introduction to SparkML ()

Extract - Transform - Load ()

Exercise 1: Modifying a Apache SparkML Feature Engineering Pipeline

Week 3: Introduction to Apache SparkML-Unsupervised Learning with Apache SparkML

Introduction to Clustering: k-Means ()

Using K-Means in Apache SparkML ()

Exercise 2 - Working with Clustering and Apache SparkML

Week 4: Supervised and Unsupervised learning with SparkML-Supervised Learning with Apache SparkML

Linear Regression ()

LinearRegression with Apache SparkML ()

Logistic Regression ()

LogisticRegression with Apache SparkML ()

Exercise 1 - Improving Classification performance

Week 4: Supervised and Unsupervised learning with SparkML-Course Project

Course Project

دانلود فایل فشرده

با توجه به امکانات آموزش و همچنین امکانات بسته انتخاب شده لینک دانلود فایل فشرده آماده خواهد شد. با در نظر داشتن این شرایط لطفا بسته مورد نظر خود را انتخاب کرده و روی دکمه درخواست لینک دانلود کلیک کنید

در حال به روزرسانی اطلاعات

درخواست لینک دانلود

در حال به روزرسانی اطلاعات

لطفا قبل از فعالسازی لینک دانلود به موارد زیر توجه کنید:

پسورد فایل‌های فشرده است.
لینک‌های آماده شده تا 8 روز پس از فعالسازی منقضی خواهند شد.
حجم فایل‌ها تخمینی هستند.
در صورتی که لینک دانلود تا 15دقیقه پس از درخواست آماده نشد، از بخش پشتیبانی پیگیری نمایید.

محتواها

23 محتوای ویدئویی 13 محتوای Pdf

زیرنویس‌

انگلیسی و فارسی-ماشین

کیفیت ویدئوها‌

فقط 720p

فایل تمرینی‌

ندارد

آزمون‌

ندارد

دانلود مشاهده آنلاین

تلگرام توییتر واتساپ

آموزش یادگیری ماشینی مقیاس پذیر روی داده های بزرگ با استفاده از اسپارک آپاچی

آموزش Scalable Machine Learning on Big Data using Apache Spark

دانلود فایل فشرده

درخواست لینک دانلود