Назад | Перейти на главную страницу

Что такое очистка данных в контексте базы данных?

Даже после прочтения Очистка данных в Википедии я все еще не понимаю, что такое очистка данных, когда этот термин используется для базы данных.

Это формальный технический директор что есть предопределенный способ очистки данных? Если да, то какое ключевое слово мне следует исследовать?

-- или --

Это Общее или простой термин для простой очистки несогласованных данных в базе данных?

Что такое очистка данных?

В контексте базы данных это исправление данных, которые соответствуют схеме, но ошибочны на более высоком уровне, например недействительные номера кредитных карт и SSN, повторяющиеся записи, несоответствие формата и т. д.

Это общий, расплывчатый термин, который приобретает конкретное значение только в контексте конкретного случая.

Я создал подпрограммы «очистки данных» для периодической проверки и исправления проблем с базой данных, которые могут оказаться непрактичными для проверки в режиме реального времени (т. Е. Проверять наличие ошибок, несоответствий или дубликатов при вводе данных). Процедура очистки может исправить определенные типы ошибок, такие как проверка соответствия записи почтового индекса городу / штату или, возможно, поиск вариантов имени клиента (повторяющийся клиент) с учетом адреса.

Иногда, когда база данных ненормализована (по соображениям производительности), процедура очистки может проверять базу данных в периоды "непиковой нагрузки", чтобы убедиться, что данные остаются согласованными.