О базе данных

Ландромат Тройка
Расследование

Проект «Ландромат Тройка» основан на гигантсокй утечке банковских данных. Это реквизиты сотен счетов, через которые прошли десятки тысяч трансакций. Общее число трансакций превышает 1,3 миллиона, а их сумма составляет порядка 470 миллиардов долларов.

Изображение: OCCRP

4 марта 2019 г.

Проект «Ландромат Тройка» основан на гигантсокй утечке банковских данных. Это реквизиты сотен счетов, через которые прошли десятки тысяч трансакций. Общее число трансакций превышает 1,3 миллиона, а их сумма составляет порядка 470 миллиардов долларов.

OCCRP и 15min.lt объединили информацию из множества источников. А чтобы лучше понимать ключевые факты, OCCRP дополнил их материалами из собственной базы данных.

Данные о трансакциях подтверждают десятки тысяч корпоративных документов, договоров, счетов и электронных писем. Вся эта информация дает прекрасное представление о деятельности избранных клиентов двух уже не существующих литовских банков — Ukio и Snoras AB. Более чем за 10 лет через их счета прошли миллиарды долларов, евро, швейцарских франков и рублей. Основная часть операций пришлась на период с 2003 по 2013 год. В 2013-м литовские власти закрыли оба банка.

Международное расследование продолжалось несколько месяцев. Чтобы облегчить работу, OCCRP поделился данными с журналистами более чем в 20 партнерских организациях. Целостной картины удалось добиться с помощью двух многоуровневых систем анализа, распознавания, упорядочивания и представления данных.

Документы пропустили через новейшую систему обработки и поиска информации Aleph. Этот инструмент был разработан и создан силами OCCRP, он позволяет журналистам с легкостью получать доступ, искать и просматривать большие объемы документов в самых разных форматах. Заинтересованные читатели могут самостоятельно изучить общедоступные материалы на сайте data.occrp.org и ознакомиться с открытым исходным кодом базы данных и другой документацией, пройдя по ссылке https://github.com/alephdata/aleph.

Просочившиеся документы о банковских операциях были очень неоднородными: более 20 видов оформления и форматов файлов на литовском и английском языках пришлось обрабатывать вручную. OCCRP использовал уникальный набор методов синтаксического анализа, чтобы структурировать зачастую беспорядочные и запутанные данные о финансовых операциях. Также путем сложных манипуляций были упорядочены названия компаний, адреса и номера банковских счетов, а суммы трансакций были пересчитаны в единой валюте. Полученные структурированные данные объединили и передали следователям через базу данных postgresql. Мы надеемся, что учли большинство различий в названиях и других расхождений, но ни одна система не может безупречно обработать все данные, поэтому все общие суммы следует рассматривать как приблизительные.

Журналисты, желающие получить доступ к документам или данным о банковских операциях, могут связаться с нами по адресу [email protected].