Архив
Поиск
Press digest
26 ноября 2021 г.
13 мая 2004 г.

Деклан Бутлер | Nature

Вымаранные слова восстановлены

Студентка расшифровала меморандум по Ираку

Вооружившись электронным словарем и программой для анализа текстов, студентка компьютерного факультета Университета Дублина Клер Уилан сумела восстановить слова, вымаранные в рассекреченных документах, чтобы защитить разведывательные источники.

Она и ее научный руководитель, Дэвид Нэккач, шифровальщик компании Gemplus, выпускающей банковские карты, взялись за два важных документа. Один из них - меморандум, подготовленный для президента США Джорджа Буша и рассекреченный в апреле по запросу комиссии, расследующей теракты 11 сентября 2001 года. Второй - меморандум американского министерства обороны о тех, кто помогал Ираку "военизировать" гражданские вертолеты Hughes.

Все началось, когда Нэккач увидел на Пасху по телевидению меморандум Буша. "Мне было скучно, и я искал задачу для Клер. Она любит трудные задачи, я подумал, что, дав ей эту, я обеспечу себе спокойную жизнь на неделю", - говорит Нэккач. Уилан справилась с заданием даже быстрее.

Восстановить вымаранные слова было легко, сказала она Nature. "Программа оптического распознавания идентифицировала шрифт, в данном случае - Arial, и его размер. Зная эти параметры, можно судить о длине слова. Затем берутся все слова, имеющиеся в словаре, и подсчитывается, могут ли они заполнить данное пространство. Погрешность составляет три пикселя".

Компьютеризованный поиск по словарю дал 1530 результатов для слова в таком предложении: "Оперативник "Египетского исламского джихада" в то же самое время сообщил службе XXXXXXXX, что Бен Ладен планирует использовать доступ в США для нанесения террористического удара". Грамматический анализатор свел количество результатов до 346 слов, употребление которых делало предложение осмысленным.

При беглом просмотре человек удалил такие, слова как "ацетон", после чего осталось семь вариантов: "угандийский", "украинский", "египетский", "незваный", "убыточный", "задолжавший" и "неофициальный". Наиболее вероятным было слово "египетский" говорит Нэккач. Такой же анализ меморандума министерства обороны идентифицировал Южную Корею как наиболее вероятного поставщика вертолетных технологий в Ирак.

Специалисты по разведке говорят, что эта методика вызывает у них озабоченность, и им придется подумать об изменении процедур. По мнению одного из экспертов, возникновение слухов о возможных соответствиях создает не меньший риск, чем публикация полного текста без купюр.

Нэккач согласен с тем, что, хотя методика представляется достаточно эффективной для отдельных слов, вымарывание двух-трех слов подряд ограничивает ее применение.

Нэккач и Уилан представили результаты своей работы на конференции специалистов по безопасности Eurocrypt 2004, прошедшей в начале мая в Швейцарии. Они рассказали о ней не на официальном заседании, а на неофициальной вечерней встрече, где участники говорят о незавершенных исследованиях. "Мы получили приз за лучший рассказ", - говорит Нэккач.

Источник: Nature


facebook
Rating@Mail.ru
Inopressa: Иностранная пресса о событиях в России и в мире
Политика конфиденциальности
Связаться с редакцией
Все текстовые материалы сайта Inopressa.ru доступны по лицензии:
Creative Commons Attribution 4.0 International, если не указано иное.
© 1999-2024 InoPressa.ru