Технологія обробки Big Data з використанням фреймворку Apache Spark

dc.contributor.authorЧапчай Максим Ігорович
dc.date.accessioned2025-12-29T14:49:44Z
dc.date.issued2022-06-30
dc.descriptionКваліфікаційна робота на здобуття вищої освіти ступеня "бакалавр" за освітньо-професійною програмою "Комп'ютерні науки" зі спеціальності 122 "Комп'ютерні науки". – Львівський торговельно-економічний університет. Львів. 2022.
dc.description.abstractУ дипломному проєкті досліджено проблематику обробки великих обсягів даних (Big Data) та можливості її розв’язання за допомогою фреймворку Apache Spark. Актуальність роботи зумовлена стрімким зростанням кількості даних, що генеруються в сучасному цифровому середовищі, а також необхідністю ефективних, масштабованих і продуктивних інструментів для їх зберігання та аналізу. Об’єктом дослідження є фреймворк Apache Spark, а предметом — можливості уніфікованих інструментів цього фреймворку для обробки довільних даних. У роботі проаналізовано еволюцію методів обробки великих даних, причини появи Apache Spark та проблеми, які він покликаний вирішувати. Розглянуто архітектуру фреймворку, його основні принципи роботи, зокрема швидкість обчислень, модульність і зручність використання. Особливу увагу приділено внутрішнім механізмам оптимізації та управління обчисленнями, таким як Catalyst Optimizer, Tungsten, паралелізація обробки та ефективне використання пам’яті. У практичній частині продемонстровано роботу з різними форматами даних, порівняно ефективність різних підходів до виконання запитів у Spark Core та Spark SQL, а також розглянуто типові проблеми, що виникають під час розробки та експлуатації Spark-застосунків. Результати роботи мають практичну цінність і можуть бути використані для успішного впровадження Apache Spark у задачах обробки великих даних, а також як навчальний матеріал для фахівців, які починають працювати з даним фреймворком.
dc.identifier.urihttps://dspace.lute.lviv.ua/handle/123456789/1440
dc.language.isoother
dc.publisherЛьвівський торговельно-економічний університет
dc.subjectBig Data
dc.subjectApache Spark
dc.subjectобробка великих даних
dc.subjectпаралельні обчислення
dc.subjectSpark SQL
dc.titleТехнологія обробки Big Data з використанням фреймворку Apache Spark
dc.title.alternativeBig Data processing technology using the Apache Spark framework
dc.typeThesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Chapchai Maksym.pdf
Size:
2.3 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: