Data Science at the Command Line - PDF

Download Full Version of the eBook "Data Science at the Command Line - PDF"

Data Science at the Command Line: Facing the Future with Time-Tested Tools by Jeroen Janssens
Это практическое руководство демонстрирует, как гибкость командной строки может помочь вам стать более эффективным и продуктивным исследователем данных. Вы узнаете, как сочетать небольшие, но мощные инструменты командной строки для быстрого получения, очистки, изучения и моделирования данных.

Для начала работы - будь то Windows, OS X или Linux - автор Йерун Янссенс представляет Data Science Toolbox, простую в установке виртуальную среду, содержащую более 80 инструментов командной строки.

Узнайте, почему командная строка - это гибкая, масштабируемая и расширяемая технология. Даже если вы уже умеете обрабатывать данные с помощью, скажем, Python или R, вы значительно улучшите свой рабочий процесс в области науки о данных, используя возможности командной строки.

- Получение данных с веб-сайтов, API, баз данных и электронных таблиц.
- Выполнять операции по очистке обычного текста, CSV, HTML/XML и JSON.
- Изучайте данные, вычисляйте описательную статистику и создавайте визуализации.
- Управляйте рабочим процессом в области науки о данных с помощью Drake.
- Создавайте многократно используемые инструменты из однострочных предложений и существующего кода на Python или R.
- Распараллеливайте и распространяйте конвейеры обработки больших объемов данных с помощью GNU Parallel.
- Моделируйте данные с помощью алгоритмов уменьшения размерности, кластеризации, регрессии и классификации.


52
Views
0
Likes

Licenses:

  • CC BY-NC-SA 3.0 PH
  • The author's reference is not required

Share on networks

eBooks Details:

Comments (0) Add

Кликните на изображение чтобы обновить код, если он неразборчив
No comments yet. Your comment will be the first!