Какво представлява складирането на данни?
Съхранението на данни е електронното съхранение на голям обем информация от бизнес или организация. Съхранението на данни е жизненоважен компонент на бизнес анализа, който използва аналитични техники за бизнес данни.
Концепцията за съхранение на данни е въведена през 1988 г. от изследователите на IBM Бари Девлин и Пол Мърфи. Необходимостта от складиране на данни се разви, тъй като компютърните системи станаха по-сложни и обработваха нарастващи количества данни. Ключова книга за съхранението на данни е „Изграждането на хранилището на данни на WH Inmon“ на WH Inmon, която за първи път е публикувана през 1990 г. и оттогава е препечатвана няколко пъти.
Как работи складирането на данни
Складирането на данни се използва за осигуряване на по-добра представа за резултатите на дадена компания чрез сравняване на данни, консолидирани от множество разнородни източници. Склад за данни е предназначен да изпълнява заявки и анализи на исторически данни, получени от транзакционни източници.
След като данните са включени в склада, те не се променят и не могат да бъдат променяни, тъй като складът на данни извършва анализи на вече възникнали събития, като се фокусира върху промените в данните във времето. Съхранените данни трябва да се съхраняват по начин, който е сигурен, надежден, лесен за извличане и лесен за управление.
Има определени стъпки, които се предприемат за създаване на склад за данни. Първата стъпка е извличане на данни, което включва събиране на големи количества данни от множество изходни точки. След като данните са компилирани, той преминава през почистване на данни, процесът на комбиниране на данните за грешки и коригиране или изключване на открити грешки.
След това изчистените данни се преобразуват от формат на база данни в склад. След като се съхраняват в склада, данните преминават през сортиране, консолидиране, обобщаване и т.н., така че да бъдат по-координирани и по-лесни за използване. С течение на времето в склада се добавят повече данни, тъй като множеството източници на данни се актуализират.
Ключови заведения
- Съхранението на данни е електронното съхранение на голям обем информация от бизнес или организация. Складът за данни е предназначен да изпълнява заявки и анализ на исторически данни, получени от транзакционни източници за целите на бизнес разузнаването и извличането на данни. Съхраняването на данни се използва за осигуряване на по-голямо вникване в работата на една компания чрез сравняване на данни, консолидирани от множество разнородни източници.
Специални съображения: Извличане на данни
Бизнесът може да съхранява данни за използване в проучването и извличането на данни, търсейки модели на информация, които ще им помогнат да подобрят своите бизнес процеси. Добрата система за съхранение на данни може също така да улесни достъпа на различни отдели в рамките на една компания до друг.
Например, склад за данни може да позволи на компанията лесно да оцени данните на екипа по продажбите и да помогне да вземе решения за това как да подобри продажбите или да оптимизира отдела. Бизнесът може да избере да се съсредоточи върху навиците си на харчене на клиентите, за да позиционира по-добре своите продукти и да увеличи продажбите.
С съхраняването на данни компанията може да събере исторически данни за разходите на своите клиенти през последните години, да речем, 20 години - и да извърши анализи на тези данни. Получената информация би могла да даде представа за предпочитанията на своите потребители; времето на ден, месец или година с по-големи продажби; или най-висок разход на клиент за годината.
Ефективното съхранение и управление на данни също е това, което прави възможно процесите, като иницииране на резервации за пътуване и използване на автоматизирани каси.
Процесът на извличане на данни се разделя на пет стъпки:
- Организациите събират данни и ги зареждат в своите хранилища за данни. След това те съхраняват и управляват данните, или на вътрешни сървъри или в облака. Бизнес анализаторите, управленските екипи и специалистите по информационни технологии имат достъп до данните и определят как искат да ги организират. След това приложният софтуер сортира данните въз основа на резултатите на потребителя Крайният потребител най-накрая представя данните в лесен за споделяне формат, като например графика или таблица.
Складиране на данни срещу бази данни
Съхранението на данни не е непременно същото понятие като стандартната база данни. База данни е транзакционна система, която е настроена да наблюдава и актуализира данни в реално време, за да има само най-новите данни. Склад за данни е програмиран за агрегиране на структурирани данни за определен период от време. Например, база данни може да има само най-скорошния адрес на клиент, докато складът на данни може да има всички адреси, на които клиентът е живял през последните 10 години.