Технологія обробки Big Data з використанням фреймворку Apache Spark
| dc.contributor.author | Чапчай Максим Ігорович | |
| dc.date.accessioned | 2025-12-29T14:49:44Z | |
| dc.date.issued | 2022-06-30 | |
| dc.description | Кваліфікаційна робота на здобуття вищої освіти ступеня "бакалавр" за освітньо-професійною програмою "Комп'ютерні науки" зі спеціальності 122 "Комп'ютерні науки". – Львівський торговельно-економічний університет. Львів. 2022. | |
| dc.description.abstract | У дипломному проєкті досліджено проблематику обробки великих обсягів даних (Big Data) та можливості її розв’язання за допомогою фреймворку Apache Spark. Актуальність роботи зумовлена стрімким зростанням кількості даних, що генеруються в сучасному цифровому середовищі, а також необхідністю ефективних, масштабованих і продуктивних інструментів для їх зберігання та аналізу. Об’єктом дослідження є фреймворк Apache Spark, а предметом — можливості уніфікованих інструментів цього фреймворку для обробки довільних даних. У роботі проаналізовано еволюцію методів обробки великих даних, причини появи Apache Spark та проблеми, які він покликаний вирішувати. Розглянуто архітектуру фреймворку, його основні принципи роботи, зокрема швидкість обчислень, модульність і зручність використання. Особливу увагу приділено внутрішнім механізмам оптимізації та управління обчисленнями, таким як Catalyst Optimizer, Tungsten, паралелізація обробки та ефективне використання пам’яті. У практичній частині продемонстровано роботу з різними форматами даних, порівняно ефективність різних підходів до виконання запитів у Spark Core та Spark SQL, а також розглянуто типові проблеми, що виникають під час розробки та експлуатації Spark-застосунків. Результати роботи мають практичну цінність і можуть бути використані для успішного впровадження Apache Spark у задачах обробки великих даних, а також як навчальний матеріал для фахівців, які починають працювати з даним фреймворком. | |
| dc.identifier.uri | https://dspace.lute.lviv.ua/handle/123456789/1440 | |
| dc.language.iso | other | |
| dc.publisher | Львівський торговельно-економічний університет | |
| dc.subject | Big Data | |
| dc.subject | Apache Spark | |
| dc.subject | обробка великих даних | |
| dc.subject | паралельні обчислення | |
| dc.subject | Spark SQL | |
| dc.title | Технологія обробки Big Data з використанням фреймворку Apache Spark | |
| dc.title.alternative | Big Data processing technology using the Apache Spark framework | |
| dc.type | Thesis |