- Руководства по пользованию программами
- Операционные системы и утилиты для ПК
- Интернет
- Графика. Дизайн. Проектирование
- Программы и утилиты для цифровых устройств
- Железо ПК
- Информатика
- Сети и коммуникации
- Бухгалтерия
- Базы данных
- Анализ данных
- Электронная бухгалтерия
- Машинное обучение. Анализ данных
- Менеджмент в IT
Отзывы на книгу: Современный скрапинг веб-сайтов с помощью Python; Издательский дом "Питер", 2021
- Издатель: Издательский дом "Питер"
- ISBN: 978-5-4461-1693-5
EAN: 9785446116935
- Книги: Программирование
- ID:7324324
Отзывы (4)
- Хапенков Дмитрий — 26 Марта 2021
Пишу, как человек, который занимался парсингом больше 10 лет, но на других языках. Решил взять, чтобы сразу привыкнуть к инструментам на питоне, ну и вдруг чего новое бы узнал.
Честно говоря, книга несколько неоднозначна. В целом, основные моменты парсинга упомянуты, как введение в тему - нормально. Но многое упомянуто вскользь. Регулярные выражения вообще привели краткий список символов, но многие регулярно используемые нюансы, вроде изменения поведения внутри [] упомянуты вообще только в примерах, т.е. если вы не в курсе, придется догадываться.
Меньше всего понравился код. Да, даже в коротких книжных примерах есть скобки после if (что в питоне не принято), при чем где-то есть, где-то нет, как будто писали, как хотели. Есть изменение входящих в функции параметров. Есть противоречие описанным идеям и их реализации. В общем, если вы прям совсем не шарите в питоне и будете ориентироваться на приведенные примеры, они скорее будут вредны.
Поэтому могу рекомендовать тем у кого же есть полгода-год конкретного опыта и нет опыта в парсинге - это будет идеальная аудитория для книги. Для остальных - в принципе, норм, но есть свои но. - Александр Филонов — 3 Сентября 2021
Книга дельная, но есть немного устаревшая информация. Однако это не критично, все нюансы легко гуглятся в рунете. Знание линукса не нужны, по крайней мере в первой части книги точно. До второй пока не дошел)
- 764785007 — 27 Апреля 2021
Интересная книга!
Открывает окно в мир технологий используемых в скрапинге.
Для полноценного применения представленных решений необходимо конечно же знание в следующих областях: как минимум вы должны быть знакомы с ОС Linux, MySQL и Python.
Изложение материала последовательное и поэтому не вызывает никаких трудностей в восприятии изложенного материала.
В целом доволен результатом, полученным после прочтения. Рекомендую. - Дмитрий Павлов-Теремок — 4 Октября 2023
В целом книга полезна, но даёт довольно скромную информацию. И в самой книге написано, и в целом преподносится, что нас научат парсить динамические сайты и вызывать скрипты JS. Эт ложь, немного расскажут про Ajax сайты, что есть запросы, которые можно изучить и тогда...При этом я ожидал хотя бы описания парсинга сложных сайтов через консоль, что отслеживать, вот примеры - нет такого. Простые случаи вам прям дотошно расскажут, но не такие сложные детали. Спойлер - в книге просто посоветуют селениум. Сомнительно, но тоже можно использовать. Расскажут, как парсить ворд, csv, немного про многоточность и многопроцессность...Нет, в целом, это очень интересно и полезно для общего развития, но мы тут вроде как должны сайты парсить?! А википедии парсить можно и из википедии научиться. Если вы новичок и только хотите научиться парсингу, то подойдёт и будет интересно. Если ваша цель именно улучшить навыки парсинга и найти новые фичи - проходите мимо. Прям если коротко, то по стеку технологии книги советы : знать как работать с БД, selenium webdriver, немного затронут многопоточку...и всё в целом)
Добавить отзыв
Сравнить цены
Последняя известная цена от 19 р. до 95 р. в 6 магазинах
Вы можете поискать его на других площадках:
Магазин | Цена | Наличие |
---|---|---|
Описание
Если программирование напоминает волшебство, то веб-скрапинг - это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
2-е международное издание.
Смотри также о книге.
О книге
Параметр | Значение |
---|---|
Автор(ы) | Райан Митчелл |
Издатель | Издательский дом "Питер" |
Год издания | 2021 |
Переплет | Мягкий переплёт |
Возрастные ограничения | 16 |
Кол-во страниц | 336 |
Серия | Бестселлеры O`Reilly |
Раздел | Программирование |
ISBN | 978-5-4461-1693-5 |
Возрастное ограничение | 16+ |
Количество страниц | 336 |
Формат | 165x231мм |
Вес | 0.45кг |
Тип обложки | мягкая |
Количество книг | 1 |
Издательство | ООО "Прогресс книга" |
Бумага | офсет |
Книги: Программирование Издательский дом "Питер"
Категория 15 р. - 22 р.
Книги: Программирование
Категория 15 р. - 22 р.
Книги: Программирование: другие издатели
- 1С-Паблишинг
- BHV
- Bhv-cпб
- John Wiley & Sons Limited
- Бином
- Бомбора
- БХВ
- БХВ-Петербург
- Вильямс
- Диалектика
- Диалектика-Вильямс
- ДМК Пресс
- ДМК Пресс, ДМК Пресс
- ДМК-Пресс
- Издательский дом "Питер"
- Издательство «Просвещение»
- Издательство ЛАНЬ
- Инфра-Инженерия
- ИНФРА-М
- Кнорус
- Лаборатория знаний
- Лань
- Лори
- МГТУ им. Н. Э. Баумана (национальный исследовательский университет)
- МГТУ им. Н.Э. Баумана
- Наука и Техника
- Новосибирский государственный технический университет
- Новый издательский дом
- ПИТЕР
- Прогресс книга
- Прометей
- Символ-Плюс
- Солон-пресс
- Форум
- Эксмо