
Список диапазонов IP адресов Google по инструментам по сборам данных на сайте
Обязательный белый список IP-адресов Google + Яндекс
IP-адреса поисковой системы Bing
Юзерагенты Google
User-Agent |
Назначение |
Учитывает Robots.txt |
| Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) | Googlebot Smartphone: Индексирует страницы для мобильной версии Google Поиска | Да (Токен: Googlebot) |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36 | Googlebot Desktop: Индексирует страницы для десктопной версии Google Поиска | Да (Токен: Googlebot) |
| Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) | Googlebot (редко): Общий краулер для Google Поиска | Да (Токен: Googlebot) |
| Googlebot/2.1 (+http://www.google.com/bot.html) | Googlebot (редко): Общий краулер для Google Поиска | Да (Токен: Googlebot) |
| Googlebot-Image/1.0 | Индексирует изображения для Google Картинок и связанных функций | Да (Токен: Googlebot-Image, Googlebot) |
| Googlebot-Video/1.0 | Индексирует видео для функций Google Поиска, связанных с видео | Да (Токен: Googlebot-Video, Googlebot) |
| (Использует строки Googlebot) | Googlebot News: Индексирует контент для Google Новостей. Отдельной строки User-Agent нет | Да (Токен: Googlebot-News, Googlebot) |
| Mozilla/5.0 (X11; Linux x86_64; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Safari/537.36 | Storebot-Google Desktop: Индексирует данные для платформ Google Покупок | Да (Токен: Storebot-Google) |
| Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 | Storebot-Google Mobile: Индексирует данные для платформ Google Покупок (мобильная версия) | Да (Токен: Storebot-Google) |
| Mozilla/5.0 (compatible; Google-InspectionTool/1.0;) | Google-InspectionTool Desktop: Используется для тестирования в Search Console (например, проверка URL, расширенных результатов) | Да (Токен: Google-InspectionTool, Googlebot) |
| Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Google-InspectionTool/1.0;) | Google-InspectionTool Mobile: Используется для тестирования в Search Console (мобильная версия) | Да (Токен: Google-InspectionTool, Googlebot) |
| Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; GoogleOther) | GoogleOther Mobile: Универсальный краулер для внутренних исследований, не привязан к конкретным продуктам | Да (Токен: GoogleOther) |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GoogleOther) Chrome/W.X.Y.Z Safari/537.36 | GoogleOther Desktop: Универсальный краулер для внутренних исследований | Да (Токен: GoogleOther) |
| GoogleOther-Image/1.0 | Индексирует изображения для внутренних исследований, не привязан к конкретным продуктам | Да (Токен: GoogleOther-Image, GoogleOther) |
| GoogleOther-Video/1.0 | Индексирует видео для внутренних исследований, не привязан к конкретным продуктам | Да (Токен: GoogleOther-Video, GoogleOther) |
| Google-CloudVertexBot | Индексирует данные для создания агентов на основе Vertex AI по запросу владельцев сайтов | Да (Токен: Google-CloudVertexBot, Googlebot) |
| (Использует строки Googlebot) | Google-Extended: Управляет сканированием для обучения моделей Gemini и обоснования в приложениях Gemini и Vertex AI | Да (Токен: Google-Extended) |
Известные ИИ боты и поисковые системы
User-Agent |
Назначение |
Учитывает Robots.txt |
| Mozilla/5.0 (compatible; Bytespider/1.0; +http://www.bytedance.com/bot.html) | Веб-краулер ByteDance для сбора данных для поиска TikTok, AI-подписей CapCut и заголовков Toutiao | Да |
| Mozilla/5.0 (compatible; Applebot/1.0; +http://www.apple.com/bot.html) | Краулер Apple для индексации контента для Siri, Spotlight и предложений в Safari | Да |
| Mozilla/5.0 (compatible; YandexNews/4.0; +http://yandex.com/bots) | Индексирует новостной контент для поисковой системы Yandex | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ChatGPT-User/1.0; +https://openai.com/bot) | Выполняет запросы, инициированные пользователем в ChatGPT для получения реального времени контента | Иногда нет |
| Mozilla/5.0 (compatible; Diffbot/0.1; +http://www.diffbot.com/our-apis/crawler/) | Краулит URL для инструмента веб-спайдеринга Diffbot для применения API извлечения | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot) | Собирает данные для обучения AI-моделей OpenAI, таких как GPT | Да |
| Mozilla/5.0 (compatible; AI2Bot/1.0; +https://allenai.org/) | Исследует домены для поиска контента для обучения открытых языковых моделей | Да |
| Mozilla/5.0 (iPhone; CPU iPhone OS 8_1 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12B411 Safari/600.1.4 (compatible; YandexMobileBot/3.0; +http://yandex.com/bots) | Мобильный бот для индексации контента в Yandex | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ChatGPT-User/2.0; +https://openai.com/bot) | Аналогично ChatGPT-User/1.0, для действий пользователей в ChatGPT | Иногда нет |
| ClaudeBot/1.0; +https://www.anthropic.com | Краулит веб для обучения AI-модели Anthropic Claude | Да |
| Mozilla/5.0 (compatible; DeepseekBot/1.0; +https://www.deepseek.com/bot) | Краулер для DeepSeek AI, вероятно, для обучения моделей | Да |
| Mozilla/5.0 (compatible; YandexWebmaster/2.0; +http://yandex.com/bots) | Проверяет доступность сайта и индексацию для инструментов Yandex Webmaster | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Google-Extended/1.0; +https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers) | Используется для обучения AI-моделей Google, таких как Gemini | Да |
| MistralAI-User/1.0 | Обслуживает действия пользователей в AI-ассистенте Mistral LeChat | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Gemini-Deep-Research/1.0) | Получает контент для функции Deep Research в Google Gemini | Нет |
| Mozilla/5.0 (compatible; Cotoyogi/1.0) | Собирает данные для управления и обучения AI-моделей | Да |
| Mozilla/5.0 (compatible; YouBot (+http://www.you.com)) | Краулер для AI-поисковика You.com | Да |
| Mozilla/5.0 (compatible; TimpiBot/1.0) | Индексирует контент для поисковой системы Timpi | Да |
| LinkedInBot/1.0 (compatible; Mozilla/5.0; Jakarta Commons-HttpClient/3.1 +http://www.linkedin.com) | Краулит контент для предпросмотров и функций LinkedIn | Да |
| Mozilla/5.0 (compatible; Google-InspectionTool/1.0;) | Используется для инструментов тестирования поиска Google, таких как инспекция URL | Да |
| Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) | Основной краулер Yandex для веб-индексации | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Bard-AI/1.0; +https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers) | Вероятно, для AI Google Bard (теперь Gemini) | Да |
| Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php) | Краулит общий контент для предпросмотров в приложениях Meta | Иногда нет |
| Mozilla/5.0 (compatible; Google-NotebookLM/1.0; +https://notebooklm.google.com/) | Получает источники для инструмента Google NotebookLM | Нет |
| Timpibot/0.8 (+http://www.timpi.io) | Краулер для децентрализованной поисковой системы Timpi | Да |
| TerraCottahttps://github.com/CeramicTeam/CeramicTerracotta | Веб-краулер, уважающий robots.txt | Нет |
| Mozilla/5.0 (compatible; YouBot/1.0; +https://you.com/bot) | Краулер для AI-поиска You.com | Да |
| Mozilla/5.0 (compatible; RunPod-Bot/1.0; +https://runpod.io/) | Краулер для платформы AI RunPod | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/bot) | Отображает веб-сайты в результатах поиска Perplexity AI | Да |
| Mozilla/5.0 (compatible; DuckAssistBot/1.0; +http://www.duckduckgo.com/bot.html) | Краулер для AI-фич DuckDuckGo | Да |
| meta-webindexer/1.1 | Улучшает качество поисковых результатов Meta AI | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ClaudeBot/1.0; +claudebot@anthropic.com) | Краулер для AI Anthropic Claude | Да |
| Mozilla/5.0 (compatible; Devin/1.0) | AI-ассистент от Devin AI | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ChatGPT-Browser/1.0; +https://openai.com/bot) | Взаимодействия на основе браузера в ChatGPT | Да |
| Mozilla/5.0 (compatible; Webzio-Extended/1.0) | Поддерживает репозиторий данных веб-краулинга для обучения AI | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; OAI-SearchBot/1.0; +https://openai.com/searchbot) | Поисковый бот для OpenAI | Да |
| CCBot/2.0 | Краулит для открытого репозитория Common Crawl | Да |
| Mozilla/5.0 (compatible; IbouBot/1.0; [email protected]; +https://ibou.io/iboubot.html) | Краулит для базы данных поисковой системы, не для обучения AI | Да |
| Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 | Стандартный веб-браузер Chrome, не бот | Н/Д |
| Mozilla/5.0 (compatible; xAI-Bot/1.0; +https://x.ai/) | Краулер для xAI (Grok) | Да |
| Mozilla/5.0 (compatible; Applebot-Extended/1.0; +http://www.apple.com/bot.html) | Обучает AI-модели Apple | Да |
| Mozilla/5.0 (compatible; Cohere-Command/1.0; +https://cohere.com/) | Краулер для Cohere AI | Да |
| Mozilla/5.0 (compatible; Crawlspace/1.0) | Краулер для обучения AI | Да |
| Meta-ExternalAgent/1.0 (+https://developers.facebook.com/docs/sharing/bot) | Краулит для обучения AI-моделей Meta и индексации | Иногда нет |
| Mozilla/5.0 (compatible; Replicate-Bot/1.0; +https://replicate.com/) | Запускает и донастраивает AI-модели | Да |
| Mozilla/5.0 (compatible; DuckAssistBot/1.0; +https://duckduckgo.com/duckassist) | Помогает в AI-функциях DuckDuckGo | Да |
| Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots) | Индексирует изображения для Yandex | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Anthropic-Claude/1.0; +https://www.anthropic.com) | Краулер для AI Anthropic Claude | Да |
| Mozilla/5.0 (compatible; bigsur.ai/1.0) | Краулер для обучения AI | Да |
| Mozilla/5.0 (compatible; anthropic-ai/1.0; +http://www.anthropic.com/bot.html) | Скрапит данные для обучения AI Anthropic | Да |
| Mozilla/5.0 (compatible; claude-web/1.0; +http://www.anthropic.com/bot.html) | Устаревший краулер для Claude | Да |
| Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729; Diffbot/0.1; +http://www.diffbot.com) | Старый краулер Diffbot для извлечения данных | Да |
| Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots) | Собирает аналитику для Yandex.Metrica | Да |
| Mozilla/5.0 (compatible; ImagesiftBot/1.0) | Скрапит изображения для веб-интеллекта | Да |
| Mozilla/5.0 (compatible; Kangaroo Bot/1.0) | Скачивает данные для австралийских AI-моделей | Нет |
| Mozilla/5.0 (compatible; FacebookBot/1.0; +http://www.facebook.com/bot.html) | Краулит для функций Facebook | Да |
| Mozilla/5.0 (compatible; CCBot/1.0; +http://www.commoncrawl.org/bot.html) | Краулит для датасета Common Crawl | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Gemini-AI/1.0; +https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers) | Вероятно, для AI Google Gemini | Да |
| Mozilla/5.0 (compatible; Groq-Bot/1.0; +https://groq.com/) | Краулер для AI-инференса Groq | Да |
| Mozilla/5.0 (compatible; YandexFavicons/1.0; +http://yandex.com/bots) | Получает фавиконы для Yandex | Да |
| Mozilla/5.0 (compatible; cohere-ai/1.0; +http://www.cohere.ai/bot.html) | Скрапит для обучения AI Cohere | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm) Chrome/W.X.Y.Z Safari/537.36 Edg/W.X.Y.Z | Краулер поиска Bing | Да |
| Mozilla/5.0 (compatible; Applebot-Extended/1.0) | Обучает AI-модели Apple | Да |
| Mozilla/5.0 (compatible; HuggingFace-Bot/1.0; +https://huggingface.co/) | Краулер для Hugging Face AI | Да |
| Mozilla/5.0 (compatible; meta-externalagent/1.1 (+https://developers.facebook.com/docs/sharing/webmasters/crawler)) | Краулит для внешнего агента Meta | Да |
| Mozilla/5.0 (compatible; omgili/1.0; +http://www.omgili.com/bot.html) | Получает данные из веб для insights | Да |
| Googlebot-Video/1.0 | Индексирует видео для Google | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot) | Краулит для Perplexity AI | Не указано |
| Mozilla/5.0 (compatible; MistralAI-User/1.0; +https://mistral.ai/bot) | Действия пользователей в Mistral AI | Да |
| Mozilla/5.0 (compatible; Bytespider; [email protected]) | Аналогично Bytespider | Да |
| Amazonbot/0.1 (+https://developer.amazon.com/support/amazonbot) | Улучшает продукты Amazon и AI | Да |
| Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) | Основной веб-краулер Google | Да |
| Googlebot-Image/1.0 | Индексирует изображения для Google | Да |
| Mozilla/5.0 (compatible; AI2Bot/1.0; +http://www.allenai.org/crawler) | Краулит для данных обучения AllenAI | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Claude-Web/1.0; +https://www.anthropic.com) | Устаревший веб-краулер Claude | Да |
| Mozilla/5.0 (compatible; Google-CloudVertexBot/1.0; +https://cloud.google.com/vertex-ai) | Строит AI-модели для Vertex AI | Да |
| Mozilla/5.0 (compatible; Together-Bot/1.0; +https://together.ai/) | Краулер для платформы Together AI | Да |
| Mozilla/5.0 (compatible; Brightbot/1.0) | Скрапит для AI поддержки клиентов на веб-сайтах | Да |
| Mozilla/5.0 (compatible; PanguBot/1.0) | Скачивает данные для обучения LLM Huawei PanGu | Нет |
| Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot) | Аналогично Amazonbot | Да |
| Mozilla/5.0 (compatible; Andibot/1.0) | Поисковая система с использованием генеративного AI | Да |
| Mozilla/5.0 (compatible; Character-AI/1.0; +https://character.ai/) | Краулер для Character.AI | Да |
| Mozilla/5.0 (compatible; Cohere-AI/1.0; +https://cohere.com/) | Краулер для Cohere AI | Да |
| Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Perplexity-User/1.0; +https://perplexity.ai/bot) | Действия пользователей в Perplexity AI | Не указано |
| Mozilla/5.0 (compatible; FirecrawlAgent/1.0) | Краулер для сбора данных для AI-моделей | Да |
Оригинал материала взят у Станислав Кириченко
Подписывайтесь на наш канал в Телеграм! https://t.me/siteanalyzer
Оцените статью
5/5
2Другие статьи


262
