Как быстро найти нужную вам информацию? Конечно же, зайти в одну из поисковых систем. Но как искать данные, которые поисковик не индексирует? Секретами поиска в глубинной сети поделился журналист и исследователь из Берлина Альбрехт Уде (Albrecht Ude). Он проводит тренинги о поиске в интернете, конфиденциальности и безопасности в сети для журналистов и издательств, а также является членом немецкой ассоциации журналистов-расследователей Netzwerk Recherche.
Все данные в интернете Уде условно разделяет на две части: «поверхностный интернет» (то есть, то, что можно найти через поисковые системы) и deep web (это бОльшая часть данных в интернете, которая невидима для поисковиков). В частности, это часть данных из социальных сетей, закрытые форумы, запароленные сайты и миллионы баз данных. Чаще всего через поисковые системы можно найти лишь стартовые страницы таких баз данных, но не их контент. По мнению Уде, через поисковики можно найти лишь около 4% информации, тогда как оставшиеся 96% – подводная часть айсберга – это данные из скрытого глубинного интернета.
Советы для поиска информации в Deep Web
- Меняйте ракурс поиска в обычном поисковике. Подумайте не только о самом предмете поиска, но и о том, где такой контент может находиться и к каким категориям данных он относится. Если вы ищите в интернете контакты человека, подумайте, в каких базах данных может быть информация о нем. Необходимо понять, кто может быть заинтересован в создании и наполнении базы с нужными вам данными. Например, если вам нужны контакты архитектора из Гамбурга, можно искать в Google не только его имя, но и базу данных всех архитекторов Гамбурга.
- При поиске баз данных, добавьте в поисковый запрос фразу database OR directory OR catalogue OR list. Но помните, что таким образом стоит искать только саму базу данных, а не конкретную информацию из нее.
- Для поиска списков с англоязычными базами данных, введите в поиск фразу “a * z database”.
- Проверяйте раздел «Ссылки» под статьями в Wikipedia – там можно найти перечни некоторых нужных вам баз данных. Помните, что некоторые категории в Wikipedia тоже ведут к информации о базах данных. Например: https://en.wikipedia.org/wiki/Category:Databases , https://en.wikipedia.org/wiki/Category:Digital_libraries , https://en.wikipedia.org/wiki/Category:Scholarly_databases.
- Помните о городских и университетских библиотеках: они могут иметь доступ к различным научным базам данных по подписке. А еще в библиотеках можно получить доступ к научным работам и проверить на плагиат диссертации интересующих вас людей.
Полезные сайты для поиска в Deep Web
- Startpage.com – поисковая система, которая использует данные поиска Google, но не передает поисковику информацию о пользователе.
- bibliothek.uni-regensburg.de/dbinfo – большой каталог баз данных на разные темы.
- Archive.is – сервис, позволяющий заархивировать страницу в интернете по состоянию на определенный момент. Полезно регулярно делать такой бекап в ходе расследования, чтобы иметь доказательства на случай удаления страницы.
- Iana.org – сайт, на котором можно проверить владельца домена.
- Worldcat.org – крупнейший каталог книг, их авторов и издателей.
- Cve.mitre.org – база утечек данных в интернете.
- Ted.europa.eu – Tenders electronic daily – крупнейшая база тендеров Европейского Союза.
- Doaj.org – база данных научных изданий.
Нужно больше советов для расследований? Заходите в ресурсный центр GIJN на русском.
Катерина Каплюк – журналистка-расследовательница из Украины. Работала в различных изданиях, таких как «Украинская правда», «Forbes Украина», Kyiv Post, Deutsche Welle, Радио Свобода. Победительница национальных и международных конкурсов журналистских расследований, член команды Yanukovych Leaks, завоевавшей награду “Проливая свет” в 2015. Владеет английским и немецким языками.