- Руководства по пользованию программами
- Операционные системы и утилиты для ПК
- Интернет
- Графика. Дизайн. Проектирование
- Программы и утилиты для цифровых устройств
- Железо ПК
- Информатика
- Сети и коммуникации
- Бухгалтерия
- Базы данных
- Анализ данных
- Электронная бухгалтерия
- Машинное обучение. Анализ данных
- Менеджмент в IT
Отзывы на книгу: Сбор данных в Интернете на языке R; ДМК Пресс, 2017
- Издатель: ДМК-Пресс
- ISBN: 978-5-97060-459-5
EAN: 9785970604595
- Книги: Программирование
- ID:1777798
Отзывы (6)
- Alexander Baklanov — 16 Декабря 2017
Не вполне согласен с Raniod’ом. Некоторые книги интересно читать, не зная основ. Язык R не изучают на каждом углу. Отсюда, книга – на крепкую четверку. Прочитаю – поставлю выше. Все, что относится к BI, нужно брать при реальном количестве полезной информации более 10% (выше ошибки опыта).
- Ilyasikm — 30 Октября 2019
Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!
- Илья Слугин — 21 Октября 2021
Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.
Только для опытных пользователей R, которым надо работать с сайтами.
Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что - ranlod — 23 Августа 2017
Данную книгу не стоит считать «полным» руководством по сбору данных в интернете. Она скорее как базовый справочник по технологиям сбора с помощью R, поскольку в книге даны простые примеры по каждому пакету, чуть более сложные или спецефичные ситуации всё равно придётся гуглить на иностранных ресурсах, некоторые аспекты выгрузки вообще пропущенны, напр управление куками и их сохранение. Книга лишь позволит быстро сориентировать какой пакет стоит использовать.
Кстати из 280 стр только 180 относятся к сбору данных, первые 100 стр это рассказывание про синтаксис R, не очень понятно зачем они нужны, т.к человек интересующийся выгрузкой из сети с помощью R по определению уже знает синтаксис, раз задаётся такими прикладными вопросами. Эти 180 стр можно вдумчиво прочитать за 2 вечера.
В общем поставлю 4 из 5 и то из-за того что на русском и даёт быстрое представление о способах выгрузки, без гугления на иностранных ресурсах. Но объективно, по содержанию, это скорее 3 за 180 стр, особенно если по цене бумажного варианта(900 р) - Vadim Volokzhanin — 29 Апреля 2017
Книга в концентрированном виде информация об извлечении данных преимущественно из сети Internet по средствам языка R. В самом начале книги идет отсылка к BI (Business Intelligence) не как значению «бизнес-анализ» в широком смысле слова, а к значению «бизнес-разведка». Значение слова «разведка» (Intelligence) следует рассматривать не столько как слежение за конкурентами, сколько как отслеживание собственных внутренних бизнес-процессов организации. Автор справедливо замечает, что сбор данных это основа для «data mining» в общем смысле данного определения.
Отличием книги является наличие в каждой главе списка литературы, откуда можно узнать более детальную информацию по темам главы. - Иван — 23 Ноября 2016
Годная книга, масса примеров (ВКонтакте, Твиттер, Фейсбук, Всемирный банк...). На сайте автора (гуглим по названию книги) есть код и куча дополнений к тексту. Выкладываю оглавление
Добавить отзыв
Сравнить цены
Последняя известная цена от 14 р. до 83 р. в 9 магазинах
Вы можете поискать его на других площадках:
Магазин | Цена | Наличие |
---|---|---|
Описание
Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.
Смотри также о книге.
О книге
Параметр | Значение |
---|---|
Автор(ы) | Храмов Дмитрий Александрович |
Переплет | 200.00mm x 140.00mm x 16.00mm |
Издатель | ДМК Пресс |
Год издания | 2017 |
Возрастные ограничения | 12 |
Кол-во страниц | 282 |
Вес, в граммах | 290 |
Издательство | ДМК Пресс |
Тип обложки | мягкая |
Количество страниц | 282 |
Назначение | для технических ВУЗов |
Количество книг | 1 |
Оформление обложки | лакировка |
Автор | Храмов Дмитрий Александрович |
Формат | 20 x 14.1 x 1.3 |
Раздел | Программирование |
ISBN | 978-5-97060-459-5 |
Вес | 0.29кг |
Размеры | 21,50 см × 14,50 см × 1,40 см |
Обложка | мягкая обложка |
Язык издания | rus |
Страниц | 280 |
Переплёт | мягкий |
Тематика | Программирование |
Возрастное ограничение | 16+ |
Книги: Программирование ДМК-Пресс
Категория 11 р. - 17 р.
Книги: Программирование
Категория 11 р. - 17 р.
Книги: Программирование: другие издатели
- 1С-Паблишинг
- BHV
- Bhv-cпб
- John Wiley & Sons Limited
- Бином
- Бомбора
- БХВ
- БХВ-Петербург
- Вильямс
- Диалектика
- Диалектика-Вильямс
- ДМК Пресс
- ДМК Пресс, ДМК Пресс
- ДМК-Пресс
- Издательский дом "Питер"
- Издательство «Просвещение»
- Издательство ЛАНЬ
- Инфра-Инженерия
- ИНФРА-М
- Кнорус
- Лаборатория знаний
- Лань
- Лори
- МГТУ им. Н. Э. Баумана (национальный исследовательский университет)
- МГТУ им. Н.Э. Баумана
- Наука и Техника
- Новосибирский государственный технический университет
- Новый издательский дом
- ПИТЕР
- Прогресс книга
- Прометей
- Символ-Плюс
- Солон-пресс
- Форум
- Эксмо