Наиболее распространенные Юзер агенты для парсинга
Агенты пользователя являются важной частью парсинга. Для того чтобы собрать точную и релевантную информацию из интернета, строки агентов пользователя должны быть правильно настроены. Агенты пользователя могут определять, какую информацию целевой веб-сайт отправляет пользователю и как отображается содержимое.

Сбор данных для SEO, маркетинга, мониторинга конкурентов и других бизнес-целей требует тщательной подготовки. Получение прокси-серверов, настройка агентов пользователя и обход блокировок необходимы для успешного парсинга.


Узнайте, что такое агент пользователя и почему он так важен для парсинга. Узнайте о наиболее распространенных агентах пользователя и их типах в зависимости от различных устройств. Прочитав эту статью, вы сможете настроить агенты пользователя и получить наиболее точные и релевантные данные, необходимые для вашего бизнеса.
Что такое user agent?
У каждого браузера есть агент пользователя. Он представляет пользователя в интернете, предоставляя информацию о нем, такую как браузер, операционная система, тип устройства и программное обеспечение. Предоставлять эту информацию вручную каждый раз при подключении к интернету было бы крайне неэффективно. Именно поэтому каждый браузер, подключенный к интернету, имеет агента пользователя.

Например, агент пользователя может выглядеть следующим образом:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/105.0.0.0 Safari/537.36

Пользовательские агенты помогают веб-сайтам адаптировать свое содержимое к различным веб-браузерам и операционным системам.
Почему юзер агенты важны?
Агенты пользователя очень важны, поскольку они отличают браузеры друг от друга и гарантируют, что каждый пользователь получает правильно отображаемое содержимое.

Строки агентов пользователя включаются в HTTP-заголовок веб-сайта при подключении к веб-сайту. Идентификация пользователей на основе их агентов пользователя позволяет веб-сайтам предоставлять различные версии контента через один и тот же адрес URL.

Например, когда вы вводите URL-адрес, веб-сервер проверяет ваш агент пользователя и предоставляет вам соответствующий веб-сайт. Если вы хотите зайти на тот же сайт через мобильное устройство, вам не нужно вводить другой URL. Один и тот же URL предоставляет вам разные версии сайта в браузерах мобильных и компьютерных устройств.

Чтобы привести еще один пример того, почему пользовательские агенты важны, представьте разные форматы изображений. Веб-сайт может предоставлять изображения в форматах PNG и GIF и отображать их в зависимости от агентов пользователя. Версия GIF будет отображаться пользователям с версией MS Internet Explorer, которая не может показывать изображения PNG. В то же время версия изображения PNG будет отображаться в более современных версиях браузеров.

Вот почему агенты пользователя важны, ведь без них пользователи не получат ожидаемый контент.
Каковы различные типы пользовательских агентов?
Строки агентов пользователя позволяют серверам веб-сайтов идентифицировать устройства (среди прочего), запрашивающие онлайн-контент. Юзер агент сообщает сайту, какое устройство посещает сайт, и эта информация затем используется для определения того, какое содержимое должно быть возвращено.

Ниже приведен список юзер агентов для различных типов устройств.

User agent Android
Мобильные юзер агент Android зависят от устройства мобильного телефона. Устройствами Android могут быть Samsung, Sony, Nexus и другие телефоны, использующие ОС Android для мобильных устройств. Поскольку Android основан на ядре Linux, пользовательский агент всегда будет содержать Linux. Например, юзер агент для телефона Samsung Galaxy S22 будет выглядеть следующим образом:

Mozilla/5.0 (Linux; Android 12; SM-S906N Build/QP1A.190711.020; wv) AppleWebKit/537.36 (KHTML, как Gecko) Version/4.0 Chrome/80.0.3987.119 Mobile Safari/537.36

User agent iPhone
Apple передает различную информацию через пользовательские агенты. В отличие от устройств Android, Apple не использует номера версий, которые позволили бы различать разные модели iPhone. Вот пример пользовательского агента iPhone 13 Pro Max:

Mozilla/5.0 (iPhone14,3; U; CPU iPhone OS 15_0, как Mac OS X) AppleWebKit/602.1.50 (KHTML, как Gecko) Version/10.0 Mobile/19A346 Safari/602.1

User agent MS Windows
Мобильные устройства Microsoft Windows также имеют свои собственные агенты пользователя. Например, это может быть агент пользователя Microsoft Lumia 650:

Mozilla/5.0 (Windows Phone 10.0; Android 6.0.1; Microsoft; RM-1152) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/52.0.2743.116 Mobile Safari/537.36 Edge/15.15254

User agent планшетов
Агенты пользователя планшета зависят от используемой на устройстве ОС и модели планшета. Например, агент пользователя для планшета Sony Xperia Z4 может выглядеть следующим образом:

Mozilla/5.0 (Linux; Android 6.0.1; SGP771 Build/32.2.A.0.253; wv) AppleWebKit/537.36 (KHTML, как Gecko) Version/4.0 Chrome/52.0.2743.98 Safari/537.36

User agent для настольных ПК
Агенты пользователя настольных компьютеров могут иметь огромное количество различных комбинаций. Они зависят от устройства, ОС, браузера и т.д. Вот как может выглядеть агент пользователя для компьютера на базе MacOS X, подключающегося через браузер Safari:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/601.3.9 (KHTML, как Gecko) Version/9.0.2 Safari/601.3.9


Список наиболее распространенных пользовательских агентов
Для сбора различной информации при веб-скрейпинге необходимо использовать наиболее распространенные агенты пользователя. При использовании одного агента пользователя вы можете получить другую информацию, чем при использовании другой строки агента пользователя. Здесь перечислены последние и наиболее распространенные агенты пользователя для различных веб-браузеров и операционных систем:

Агент пользователя Chrome в Windows 10
В настоящее время это самый популярный пользовательский агент:

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/106.0.0.0 Safari/537.36

Пользовательский агент Chrome на macOS
Наиболее распространенный агент пользователя на macOS:

Mozilla/5.0 (Macintosh; Intel Mac OS X 12_6) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/106.0.0.0 Safari/537.36

Пользовательский агент Chrome в Linux
Новейший и самый популярный пользовательский агент Linux:

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/106.0.0.0 Safari/537.36

Пользовательские агенты Chrome на Android
Последняя версия пользовательского агента Android с браузером Chrome выглядит следующим образом:

Mozilla/5.0 (Linux; Android 10) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/106.0.5249.79 Mobile Safari/537.36

В настоящее время это наиболее распространенные агенты пользователя, но список может меняться. Вы можете найти обновляемый список самых популярных агентов пользователя в интернете.
Как изменить агент пользователя?
Вы можете изменить строку агента пользователя и создать впечатление, что отправляете запросы на целевой сайт из другого браузера или устройства, чем вы являетесь на самом деле. Способ изменения агента пользователя зависит от вашего браузера.

Ниже представлена информация о том, как изменить строку агента пользователя в Chrome, наиболее распространенном веб-браузере.
  • Нажмите на меню в браузере Chrome.
  • Перейдите в раздел «Дополнительные инструменты», а затем «Инструменты разработчика».
  • На вкладке «Консоль» нажмите на меню (если вы не видите консоль, нажмите на меню и выберите «Показать консоль»).
  • Выберите «Условия сети» и найдите опцию «Пользовательский агент»,
  • Снимите флажок «Выбирать автоматически» и выберите агент пользователя из списка.

Вы можете установить свой юзер агент. Однако пользовательская строка юзер агента будет действовать только до тех пор, пока открыты «Инструменты разработчика», и только на текущей вкладке.
Заключение
У каждого интернет-пользователя, имеющего устройство и браузер, есть пользовательский агент. Эта строка помогает целевому веб-сайту идентифицировать пользователя и возвращать адаптированный контент, который отображает содержимое правильным образом. Это может означать отображение определенных форматов изображений, языка и т. д.

При парсинге часто требуется собрать информацию из разных мест и для разных устройств. Эта информация может быть использована для SEO, электронной коммерции или мониторинга конкурентов. Настройка пользовательского агента может помочь вам получить необходимые данные.