Deep Web: как найти информацию, которую не видит Google

Альбрехт Уде

Как быстро найти нужную вам информацию? Конечно же, зайти в одну из поисковых систем. Но как искать данные, которые поисковик не индексирует? Секретами поиска в глубинной сети поделился журналист и исследователь из Берлина Альбрехт Уде (Albrecht Ude). Он проводит тренинги о поиске в интернете, конфиденциальности и безопасности в сети для журналистов и издательств, а также является членом немецкой ассоциации журналистов-расследователей Netzwerk Recherche.

Все данные в интернете Уде условно разделяет на две части: «поверхностный интернет» (то есть, то, что можно найти через поисковые системы) и deep web (это бОльшая часть данных в интернете, которая невидима для поисковиков). В частности, это часть данных из социальных сетей, закрытые форумы, запароленные сайты и миллионы баз данных. Чаще всего через поисковые системы можно найти лишь стартовые страницы таких баз данных, но не их контент. По мнению Уде, через поисковики можно найти лишь около 4% информации, тогда как оставшиеся 96% – подводная часть айсберга – это данные из скрытого глубинного интернета.

Советы для поиска информации в Deep Web

Меняйте ракурс поиска в обычном поисковике. Подумайте не только о самом предмете поиска, но и о том, где такой контент может находиться и к каким категориям данных он относится. Если вы ищите в интернете контакты человека, подумайте, в каких базах данных может быть информация о нем. Необходимо понять, кто может быть заинтересован в создании и наполнении базы с нужными вам данными. Например, если вам нужны контакты архитектора из Гамбурга, можно искать в Google не только его имя, но и базу данных всех архитекторов Гамбурга.
При поиске баз данных, добавьте в поисковый запрос фразу database OR directory OR catalogue OR list. Но помните, что таким образом стоит искать только саму базу данных, а не конкретную информацию из нее.
Для поиска списков с англоязычными базами данных, введите в поиск фразу “a * z database”.
Проверяйте раздел «Ссылки» под статьями в Wikipedia – там можно найти перечни некоторых нужных вам баз данных. Помните, что некоторые категории в Wikipedia тоже ведут к информации о базах данных. Например: https://en.wikipedia.org/wiki/Category:Databases , https://en.wikipedia.org/wiki/Category:Digital_libraries , https://en.wikipedia.org/wiki/Category:Scholarly_databases.
Помните о городских и университетских библиотеках: они могут иметь доступ к различным научным базам данных по подписке. А еще в библиотеках можно получить доступ к научным работам и проверить на плагиат диссертации интересующих вас людей.

Полезные сайты для поиска в Deep Web

Startpage.com – поисковая система, которая использует данные поиска Google, но не передает поисковику информацию о пользователе.
bibliothek.uni-regensburg.de/dbinfo – большой каталог баз данных на разные темы.
Archive.is – сервис, позволяющий заархивировать страницу в интернете по состоянию на определенный момент. Полезно регулярно делать такой бекап в ходе расследования, чтобы иметь доказательства на случай удаления страницы.
Iana.org – сайт, на котором можно проверить владельца домена.
Worldcat.org – крупнейший каталог книг, их авторов и издателей.
Cve.mitre.org – база утечек данных в интернете.
Ted.europa.eu – Tenders electronic daily – крупнейшая база тендеров Европейского Союза.
Doaj.org – база данных научных изданий.

Нужно больше советов для расследований? Заходите в ресурсный центр GIJN на русском.

Катерина Каплюк – журналистка-расследовательница из Украины. Работала в различных изданиях, таких как «Украинская правда», «Forbes Украина», Kyiv Post, Deutsche Welle, Радио Свобода. Победительница национальных и международных конкурсов журналистских расследований, член команды Yanukovych Leaks, завоевавшей награду “Проливая свет” в 2015. Владеет английским и немецким языками.

Global Investigative Journalism Conference 2019 -

News

Deep Web: как найти информацию, которую не видит Google

By Катерина Каплюк | September 27, 2019

Советы для поиска информации в Deep Web

Полезные сайты для поиска в Deep Web

Leave a Reply Cancel reply