Аналитика Больших Данных
Большие данные — это область, которая рассматривает способы анализа, систематического извлечения информации из или иного обращения с наборами данных, которые слишком велики или сложны для обработки традиционным программным обеспечением для обработки данных. Данные с множеством полей (столбцов) предлагают большую статистическую мощность, в то время как данные с большей сложностью (большим количеством атрибутов или столбцов) могут приводить к более высокому уровню ложных открытий. Проблемы анализа больших данных включают захват данных, хранение данных, анализ данных, поиск, обмен, передачу, визуализацию, запросы, обновление, конфиденциальность информации и источники данных. Изначально большие данные ассоциировались с тремя ключевыми концепциями: объем, разнообразие и скорость. Анализ больших данных представляет собой проблемы с выборкой, что ранее позволяло проводить только наблюдения и выборки. Поэтому большие данные часто включают данные, размеры которых превышают возможности традиционного программного обеспечения для обработки в приемлемое время и с приемлемой ценностью. Текущее использование термина "большие данные", как правило, относится к использованию предиктивной аналитики, аналитики поведения пользователей или некоторых других передовых методов анализа данных, которые извлекают ценность из больших данных, и редко относится к определенному размеру набора данных.