Как грабить корованы

Руслан Сафин и Александр Козько

15 мая 2016

В то время, когда наши космические корабли бороздят просторы Вселенной, а проекты с модным словом BigData растут как на дрожжах, остро встает вопрос — откуда и как эту самую BigData брать?

В нашем докладе мы расскажем о способах парсинга/краулинга/среза и прочего получения дейстивтельно большого количества информации из интернета. Рассмотрим различные способы решения ситуаций, когда сайты ограничивают или блокируют автоматический краулинг.

Ведь без данных, и BigData — не BigData.
blog comments powered by Disqus