Первые случаи утечек информации через индексацию поисковыми системами начали проявляться ещё в начале 2000-х годов, когда многие компании и пользователи начали активно использовать онлайн-сервисы для хранения и обмена файлами. Это стало довольно распространенной проблемой, поскольку многие пользователи не понимали или игнорировали настройки приватности своих файлов.

Одним из ранних и наиболее известных случаев утечки информации через индексацию был случай с социальной сетью Facebook, который произошел в конце 2000-х годов. В те времена множество пользователей Facebook не были осведомлены о том, что их личные фотографии и другие материалы могли быть найдены через поисковые системы из-за настроек по умолчанию в социальной сети.

Сейчас, в 2024, казалось бы, все должно быть по другому? К сожалению это не так. Пользователи всё ещё плохо осведомлены в области информационной безопасности и небрежно относятся к своей персональной, порой даже конфиденциальной, информации.

Тема поиска по “Доркам” невероятно старая, но оказывается, всё ещё актуальная.

Поисковые запросы, использующие оператор “site:”, могут раскрывать конфиденциальные данные, если эти данные не были правильно защищены. Наш пример с Google Drive показывает, как информация может быть индексирована поисковыми системами, даже если пользователь не намеревался делиться ей публично.

Облачные хранилища

Нам стало интересно, можно ли, используя только поисковые системы, получить файлы пользователей, хранящиеся в облаках.

Сравнивать защищенность будем на примере трех поисковиков.

Начнем с Яндекс диска.

Яндекс Диск (2/10)

https://disk.yandex.ru

Казалось бы, все предусмотрено. Robots.txt настроены, ссылки файлов пользователей ну никак не могут попасть в поисковую выдачу.

И если искать ссылки Яндекс диска в самом Яндексе, их действительно нет…

site:disk.yandex.ru

Но Google, кажется, никто об этом не предупредил - 129000 результатов.

Bing - 3080 результатов.

Очень много проиндексированных ссылок. 2/10.

Google Диск (0/10)

Причем с самим гугл диском ситуация еще хуже. Он не боится индексировать даже своих пользователей.

site:drive.google.com/file/

Итак, Google - 1290000 результатов (рекорд нашей статьи по облачным хранилищам).

Попадаются даже gov документы.

Bing - 5220 результатов.

Если поискать по ключевым словам, можно найти что-нибудь интересное.

Google приятно удивил. Защита 0 ключей виндовс из 10.

МТС Вторая память (10/10)

Лидер нашего топа, проиндексированных ссылок - 0. Будем надеяться, это потому что их ссылки динамические, пользователям приходит уведомление о “сливе” ссылки или что-то в этом роде, а не потому что их сервисом никто не пользуется.

site:memory.mts.ru

Яндекс - своих не сдает

Google - 3 результата.

Bing - 3 результата.

Даже пришлось перепроверить в duckduckgo, мало ли. Но там тоже оказалось пусто.

Респект МТС-у, даже залью туда свой конфиденциальный файл с доступом по ссылке. Посмотрим как быстро она проиндексируется.

https://memory.mts.ru/s/sg25ALGpNUe3YDIz7eYd-Q

10/10

Облако Билайн (9/10)

Билайн почти также хорош, как МТС, видимо всё-таки Российские облака еще не проиндексированы.

site:cloudbeeline.ru/public/

Яндекс - cвоих не сдает (ну кроме одной бедной ссылочки)

Google - 8 результатов.

Bing - 7 результатов.

В целом, неплохо, 9 слитых аниме из 10.

TeraBox (3/10)

site:terabox.com/sharing/

Яндекс - видимо недавно узнал про существование terabox, только начал индексировать.

Google - 10600 результатов.

Bing - 2340 результатов.

Довольно много всего проиндексировано. Ставлю 3 onlyfans.mp4 из 10.

Облако Mail.ru (7/10)

site:thumb.cloud.mail.ru/weblink/

Яндекс - своих не сдает.

Google - 132 результата.

Bing - 60 результатов.

Неплохо mail, неплохо. 7 фоток Анапа 2012 из 10.

Onedrive (6/10)

Google - 583 результата.

Bing - Отказывается стрелять себе в ногу.

Яндекс - что-то пошло не так.

Onedrive проиграл только гуглу, приемлемо.

Mega (8/10)

site:mega.nz/folder/

Google - 29300 результатов.

Яндекс - не смог продвинуться дальше /help/

Bing - Вообще проиграл.

При этом, стоит обратить внимание, что большинство проиндексированных гуглом директорий были защищены паролем. Это значительно повышает безопасность информации и не может не радовать.

8 запароленных директорий из 10.

MediaFire (4/10)

site:mediafire.com

Google - Своих не сдает (внезапно).

Bing - 1350 результатов.

4 DMCA из 10

Сравнение

Если сопоставить общее количество проиндексированных ссылок для каждого сервиса, то получается примерно такая картина:

Бонус

С облачными хранилищами всё примерно понятно, но для белого хакера там редко попадается что-то действительно полезное (данные пользователей нас не интересуют). Под полезным я имею ввиду какие-нибудь хакерские статьи, эксплоиты, райтапы и тому подобное.

Тут на помощь приходят Pastebin и Telegra.ph.

Pastebin.com

site:pastebin.com

Pastebin - это сайт, где вы можете хранить любой текст в Интернете для простого обмена. Сайт в основном используется программистами для хранения кусков кода или информации о конфигурации.

Звучит довольно полезно, не правда ли? Но из-за специфики ресурса, ссылки живут не так долго, как хотелось бы. Конечно это нам не сильно мешает

Просто настраиваем поисковую выдачу на показ результатов за последние сутки/неделю/месяц.

И по ключевым словам (или без них, как хотите) ищем интересующую нас информацию. Вот например 5 дней назад кто-то написал неплохой парсер на python.

Если же вы ищите иного рода информацию, для pastebin существует список заранее подготовленных дорков.

Telegraph (500/10)

Отлично, мы налутали себе кучу фаззеров, эксплоитов и других полезных штук c pastebin, но что теперь с этим делать? Как использовать?

В качестве одного из вариантов поиска гайдов, статей и методичек, может быть обращение к одному из сервисов телеграма - Телеграфу.

Telegraph - Анонимная блог-платформа, бесплатный издательский инструмент, созданный компанией Telegram.

site:telegra.ph

Google - 16800000 результатов.

Bing - 152000 результатов.

500 вкуснейших бёдрышек из 10.

Мы, кстати, частенько использую эту фишку, чтобы искать статьи нужных нам исследователей.

site:telegra.ph "@cherepawwka"

Автоматизация сбора ссылок

Мы разработали плагин для Firefox, который автоматически собирает ссылки из результатов поисковых запросов. Этот инструмент подходит для пентестов, BB и поиска информации на сайтах через поисковые системы, включая Google, Yandex, Bing и DuckDuckGo. Он обходит капчу и помогает быстро находить нужную информацию.

Скачать плагин можно по ссылке:

https://addons.mozilla.org/en-US/firefox/addon/search-links-scraper/

Принцип работы следующий:

Если вы находитесь в поисковой системе Google, Яндекс, Bing или Duckduckgo, плагин будет ожидать подгрузки контента, и если он заметит теги которые выдаются в поисковой выдаче, сохранит их

Итоги

Режим “доступ по ссылке” = публичный доступ

Многие пользователи не осознают смысл термина “доступ по ссылке” и ошибочно полагают, что их файлы, находящиеся в этом режиме, все еще остаются приватными и недоступными для других. Однако на практике это означает, что их файлы зачастую становятся публично доступными через предоставленную ссылку.