Научный журнал
Международный журнал экспериментального образования
ISSN 2618–7159
ИФ РИНЦ = 0,425

ТЕХНОЛОГИИ И МЕТОДЫ АНАЛИЗА БОЛЬШИХ ДАННЫХ

Назаренко М.А. 1
1 ФГБОУ ВО «Московский государственный университет информационных технологий радиотехники и электроники»
1. Майер-Шенбергер В., Кукьер К. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим / Пер. с англ. Инны Гайдюк. – М.: Манн, Иванов и Фербер. – 2014. – С. 56.
2. Назаренко М.А., Адаменко А.О., Киреева Н.В. Принципы менеджмента качества и системы доработки или внесения изменений во внедренное программное обеспечение // Успехи современного естествознания. – 2013. – № 7. – С. 177-178.
3. Назаренко М.А. Особенности европейской интеграции в сфере профессионального образования // Мир науки, культуры, образования. – 2013. – № 5. – С. 50-53.
4. Найдич А. Большие данные: насколько они большие? // Компьютер Пресс. – 2012. – № 12. – С. 22-29.
5. Черняк Л. Большие Данные – новая теория и практика // Открытые системы. – № 10. – 2011.
6. Фетисова М.М., Корешкова А.Б., Горшкова Е.С., Алябьева Т.А. Современные методы управления персоналом и пути их совершенствования // Успехи современного естествознания – 2013. – № 11. – С. 195–196.

Большие данные – новый значимый элемент в информационной структуре современного общества [1]. Именно поэтому, технологии и методы их анализа настолько значимы [3].

В зависимости от целей, которые ставятся перед анализом больших данных [6], можно выделить следующие его основные разновидности:

1. Информационно-поисковый и визуальный анализ. Не приобретая новых знаний о предмете, мы получаем возможность рассмотреть его с разных точек зрения и по частям. Это достигается выдачей конкретного запроса к реляционной базе данных [4]. Такой вид анализа мало применим к большим данным, так как разброс вариаций для конкретного запроса будет в итоге слишком велик.

2. Оперативно-аналитический анализ или OLAP (OnLine Analytical Processing). В OLAP данные агрегируются до любой степени обобщения по любому интересующему разрезу [5]. В данном случае уже есть возможность обнаружить закономерности и тенденции в данных, которые иначе были бы не видны. Практически OLAP вводит нас в сферу обобщенных данных.

3. Интеллектуальный анализ или Data Mining. Этот тип анализа направлен на выявление скрытых закономерностей в данных (повторяющихся шаблонов или кластеров данных), то есть, моделей, лежащих в основе структуры данных и дающих возможность лучше понимать данные и предсказывать их поведение. Именно Data Mining представляет собой непосредственное обнаружение знаний [4].

Майер-Шенбергер В. и Кукьер К. в качестве базового подхода к анализу больших данных выделяют корреляционный анализ [1]. Именно он, по их мнению, лежит в основе прогностической аналитики, которая использует большие данные. Сущность ее содержится в ответе на вопрос «Что?», но при этом она не всегда в состоянии ответить на вопрос «Почему?». Метод корреляций оказался мало применим и обладал слабой эффективностью при анализе малых объемов данных, но оказался лучшим подходом для анализа больших объемов информации, где точность на фоне огромной выборки теряет свое значение.

Большие данные, как отмечают исследователи, и не предполагают обязательный поиск причин – они рассчитаны на выявление зависимостей, которые могут быть основаны на косвенных взаимосвязях: «Для рассматриваемой задачи знание почему может быть полезно, но не столь важно. А вот знание что приводит к конкретным действиям» [2].


Библиографическая ссылка

Назаренко М.А. ТЕХНОЛОГИИ И МЕТОДЫ АНАЛИЗА БОЛЬШИХ ДАННЫХ // Международный журнал экспериментального образования. – 2015. – № 11-1. – С. 40-41;
URL: https://expeducation.ru/ru/article/view?id=8288 (дата обращения: 23.11.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674