Особенности обработки больших объемов данных Основная секция
Доклад принят в Программу конференции
Тезисы
- Не хранение, а обработка. Небольшой объем базовых операций, большой объем обрабатываемых за одну операцию данных (до нескольких гигабайт, десятки-сотни миллионов записей).
- Отказ от баз данных. Причина - высокие накладные расходы с ростом обрабатываемых объемов, трудности выполнения ряда операций.
- Выбор форматов хранения - dat или txt (внутренний двоичный или текстовый). Преимущества и недостатки каждого.
- Выбор рабочих инструментов. Почему unix shell?
- Полезные эффекты простых операций
- Точки ускорения.