Scientific journal
International Journal of Experimental Education
ISSN 2618–7159
ИФ РИНЦ = 0,425

1
1
2136 KB

Большие данные – новый значимый элемент в информационной структуре современного общества [1]. Именно поэтому, технологии и методы их анализа настолько значимы [3].

В зависимости от целей, которые ставятся перед анализом больших данных [6], можно выделить следующие его основные разновидности:

1. Информационно-поисковый и визуальный анализ. Не приобретая новых знаний о предмете, мы получаем возможность рассмотреть его с разных точек зрения и по частям. Это достигается выдачей конкретного запроса к реляционной базе данных [4]. Такой вид анализа мало применим к большим данным, так как разброс вариаций для конкретного запроса будет в итоге слишком велик.

2. Оперативно-аналитический анализ или OLAP (OnLine Analytical Processing). В OLAP данные агрегируются до любой степени обобщения по любому интересующему разрезу [5]. В данном случае уже есть возможность обнаружить закономерности и тенденции в данных, которые иначе были бы не видны. Практически OLAP вводит нас в сферу обобщенных данных.

3. Интеллектуальный анализ или Data Mining. Этот тип анализа направлен на выявление скрытых закономерностей в данных (повторяющихся шаблонов или кластеров данных), то есть, моделей, лежащих в основе структуры данных и дающих возможность лучше понимать данные и предсказывать их поведение. Именно Data Mining представляет собой непосредственное обнаружение знаний [4].

Майер-Шенбергер В. и Кукьер К. в качестве базового подхода к анализу больших данных выделяют корреляционный анализ [1]. Именно он, по их мнению, лежит в основе прогностической аналитики, которая использует большие данные. Сущность ее содержится в ответе на вопрос «Что?», но при этом она не всегда в состоянии ответить на вопрос «Почему?». Метод корреляций оказался мало применим и обладал слабой эффективностью при анализе малых объемов данных, но оказался лучшим подходом для анализа больших объемов информации, где точность на фоне огромной выборки теряет свое значение.

Большие данные, как отмечают исследователи, и не предполагают обязательный поиск причин – они рассчитаны на выявление зависимостей, которые могут быть основаны на косвенных взаимосвязях: «Для рассматриваемой задачи знание почему может быть полезно, но не столь важно. А вот знание что приводит к конкретным действиям» [2].