Data Science. Наука о данных с нуля

обложка книги
Data Science. Наука о данных с нуля

Книга  позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она написана так, что способствует погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине.
В объемах, достаточных для начала работы в области Data Science, книга содержит интенсивный курс языка Python, элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки данных. Даны основы машинного обучения. Описаны различные математические модели и их реализация по методу k ближайших соседей, наивной байесовской классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации. Рассказано о работе с рекомендательными системами, описаны приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.

Отзывы:

Достоинства
Простой и понятный язык. Простые примеры.
Недостатки
Книга, в основном, посвящена использованию конкретного инструмента (Python) для решения задач Data Science. Крайне скупо раскрыт математический аппарат и математические основы (в формате привычного математического описания). Как следствие – переходы от постановки задачи к реализации в языке программирования не всегда очевидны и понятны.

Достоинства
Книга написана очень доступным языком, с хорошими примерами для начинающих изучение науки о данных.

Достоинства
Обучение системе аналитики, краткое руководство по Python
Недостатки
Немного несовершенно построенная книга
Комментарий
O’Relly как всегда на высоте! Книга очень познавательна для тех, кто бы хотел заняться системной аналитикой с использованием языка Python. Единственное что вызывает вопрос – первая глава, на мой взгляд, не совсем правильно поставленная вначале
Итого (мнение читателя с Хабра)

Поскольку на текущий момент все мои знания о Data Science ограничиваются этой книгой и курсами от Cognitive class (СС), то для начала с ними и сравню.

Не знаю может фактор родного языка, может, то, что в отличие от курсов СС автор хотя бы нормально оси на графиках подписал в примерах, но в плане общего представления книга дала намного больше, при тех же затратах времени (и там и там 2 чистых дня), не смотря на отсутствие видео, лабораторных, экзаменов и так далее. И даже отсутствие «сертификатов» и «бейджиков» ничуть не дает плюсов CC (ибо грош им цена).

Сможет ли полный новичок, что-то понять об основных подходах в области науки о данных? Скорее да, чем нет. Сможет ли он по окончанию книги сразу сделать что-то путное, скорее нет, чем да. Все же, наверное, будет плохой практикой применять для постоянной работы те примеры, что указаны в книге, а значит необходимо выучить основные библиотеки для анализа данных (сам автор тоже об этом говорит по ходу изложения материала). Причем могу предположить, что будет полезно однажды вернуться к примерам «с нуля», когда уже набьется рука на готовых библиотеках.

Полезна ли книга новичку? Я думаю, что да. Наверное, если представить, что ваш мозг дискутирует сам с собой, то можно получить что-то вроде «окон Овертона», ну то есть вначале само осознание того, что надо вникать в какое-нибудь понятие типа дисперсии или регрессии, или нейронных сетей, кажется недопустимым, но с каждым разом потихонечку приходишь к мысли, что это не так и страшно.

Поэтому в качестве экскурсии в мир Data Science книга вполне подойдет, по крайней мере, в процессе прочтения интерес к вопросу только возрастает и думаю, что при прохождении более основательных учебных курсов будет намного проще более детально рассмотреть ранее изученные с помощью данной книги концепции.

Скачать PDF:

[su_members login_url=”https://aifactory.ru/”]Скачать PDF[/su_members]

Скачать, читать, купить на Ozon.ru

Общий рейтинг записи
Оцените запись:
[Всего: 3 Средняя оценка: 2.3]

Добавить комментарий