Технологія обробки Big Data з використанням фреймворку Apache Spark

Чапчай Максим Ігорович

Технологія обробки Big Data з використанням фреймворку Apache Spark

Files

Primary Chapchai Maksym.pdf (2.3 MB)

Date

2022-06-30

Authors

Чапчай Максим Ігорович

Publisher

Львівський торговельно-економічний університет

Abstract

У дипломному проєкті досліджено проблематику обробки великих обсягів даних (Big Data) та можливості її розв’язання за допомогою фреймворку Apache Spark. Актуальність роботи зумовлена стрімким зростанням кількості даних, що генеруються в сучасному цифровому середовищі, а також необхідністю ефективних, масштабованих і продуктивних інструментів для їх зберігання та аналізу. Об’єктом дослідження є фреймворк Apache Spark, а предметом — можливості уніфікованих інструментів цього фреймворку для обробки довільних даних. У роботі проаналізовано еволюцію методів обробки великих даних, причини появи Apache Spark та проблеми, які він покликаний вирішувати. Розглянуто архітектуру фреймворку, його основні принципи роботи, зокрема швидкість обчислень, модульність і зручність використання. Особливу увагу приділено внутрішнім механізмам оптимізації та управління обчисленнями, таким як Catalyst Optimizer, Tungsten, паралелізація обробки та ефективне використання пам’яті. У практичній частині продемонстровано роботу з різними форматами даних, порівняно ефективність різних підходів до виконання запитів у Spark Core та Spark SQL, а також розглянуто типові проблеми, що виникають під час розробки та експлуатації Spark-застосунків. Результати роботи мають практичну цінність і можуть бути використані для успішного впровадження Apache Spark у задачах обробки великих даних, а також як навчальний матеріал для фахівців, які починають працювати з даним фреймворком.

Description

Кваліфікаційна робота на здобуття вищої освіти ступеня "бакалавр" за освітньо-професійною програмою "Комп'ютерні науки" зі спеціальності 122 "Комп'ютерні науки". – Львівський торговельно-економічний університет. Львів. 2022.

Keywords

Big Data, Apache Spark, обробка великих даних, паралельні обчислення, Spark SQL

URI

https://dspace.lute.lviv.ua/handle/123456789/1440

Collections

Бакалаврські кваліфікаційні роботи

Full item page

Технологія обробки Big Data з використанням фреймворку Apache Spark

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By