Apache Sqoop Cookbook - PDF

Скачать полную версию книги "Apache Sqoop Cookbook - PDF"

Apache Sqoop Cookbook by Kathleen Ting
Интеграция данных из нескольких источников необходима в эпоху больших данных, но это может быть сложной и трудоемкой задачей. Эта удобная поваренная книга содержит десятки готовых к использованию рецептов по использованию Apache Sqoop, приложения с интерфейсом командной строки, которое оптимизирует передачу данных между реляционными базами данных и Hadoop.

Sqoop одновременно и мощный, и непонятный, но с помощью формата "проблема-решение-дискуссия" этой книги рецептов вы быстро научитесь развертывать и затем применять Sqoop в своей среде. Авторы приводят примеры баз данных MySQL, Oracle и PostgreSQL на GitHub, которые вы можете легко адаптировать для SQL Server, Netezza, Teradata или других реляционных систем.

- Перенос данных из одной таблицы базы данных в экосистему Hadoop
- Поддерживайте синхронизацию данных таблицы и Hadoop путем постепенного импорта данных
- Импорт данных из более чем одной таблицы базы данных
- Настраивайте передаваемые данные, вызывая различные функции базы данных
- Экспортируйте сгенерированные, обработанные или резервные данные из Hadoop в вашу базу данных.
- Запуск Sqoop в рамках Oozie, специализированного планировщика рабочих процессов Hadoop.
- Загрузка данных в хранилище данных Hadoop (Hive) или базу данных (HBase).
- Решение проблем с установкой, подключением и синтаксисом, характерных для конкретных поставщиков баз данных.


73
Просмотры
0
Лайкнули

Лицензии:

  • CC BY-NC-SA 3.0 PH
  • Ссылка автора не требуется

Поделиться в сетях

Информация о книге:

Комментарии (0) Добавить

Кликните на изображение чтобы обновить код, если он неразборчив
Комментариев пока нет. Ваш комментарий будет первым!