Big Data Glossary: A Guide to the New Generation of Data Tools - PDF

Скачать полную версию книги "Big Data Glossary: A Guide to the New Generation of Data Tools - PDF"

Big Data Glossary: A Guide to the New Generation of Data Tools by Pete Warden
Чтобы помочь вам сориентироваться в большом количестве доступных новых инструментов для работы с данными, в этом руководстве описаны 60 самых последних новинок, от баз данных NoSQL и подходов MapReduce до инструментов машинного обучения и визуализации. Описания основаны на непосредственном опыте использования этих инструментов в производственной среде.

Удобный глоссарий также включает главу с ключевыми терминами, которые помогают определить многие из этих категорий инструментов:
- Базы данных NoSQL - базы данных, ориентированные на документы, использующие интерфейс ключ/значение, а не SQL.
- MapReduce - инструменты, поддерживающие распределенные вычисления на больших массивах данных
- Хранилища - технологии для хранения данных распределенным способом
- Серверы - способы аренды вычислительных мощностей на удаленных машинах
- Обработка - инструменты для извлечения ценной информации из больших наборов данных
- Обработка естественного языка - методы извлечения информации из текста, созданного человеком
- Машинное обучение - инструменты, которые автоматически выполняют анализ данных, основываясь на результатах однократного анализа
- Визуализация - приложения, которые представляют значимые данные в графическом виде
- Сбор - методы очистки грязных открытых источников данных
- Сериализация - методы преобразования структуры данных или состояния объекта в хранимый формат


45
Просмотры
0
Лайкнули

Лицензии:

  • CC BY-NC-SA 3.0 PH
  • Ссылка автора не требуется

Поделиться в сетях

Информация о книге:

Комментарии (0) Добавить

Кликните на изображение чтобы обновить код, если он неразборчив
Комментариев пока нет. Ваш комментарий будет первым!