Статьи по дате

The Wall Street Journal | 23 января 2007 г.

Положение дел в США можно проследить по президентским выступлениям

Аарон Раткофф

Во вторник вечером в своем доклад о положении в стране президент Буш, вероятно, упомянет о мятежниках. Возможно, не один раз.

Буш, однако, будет не первым американским лидером, который произнесет это слово на всю страну. В 1861 году в своем докладе о положении в стране президент Линкольн осудил "мятежников, открыто восставших против законопослушных граждан, которые даже теперь приносят великие жертвы". Эту цитату можно было бы позаимствовать для завтрашнего обращения.

Проследив за эволюцией основных президентских речей, можно сделать еще множество интересных наблюдений, и для этого не нужно быть профессиональным историком.

Чираг Мехта, 26-летний IT-менеджер из Санкт-Петербурга, штат Флорида, создал программу, с помощью которой проанализировал большую часть президентских выступлений - в том числе докладов о положении дел в стране, речей на инаугурации и при объявлении войны - с самого момента возникновения нашего государства. Его интернет-приложение, представленное в блоге на сайте Chir.ag, обрабатывает наиболее значительные президентские речи (собранные в интернете на таких ресурсах, как сайт Британской энциклопедии) и отбирает в каждой из них 100 наиболее часто встречающихся терминов.

Достаточно сдвигать ползунок слева направо, и перед нами разворачивается вся история президентства, которая показывает 100 наиболее часто используемых слов в каждой из речей.

Эти слова показаны в виде "облака тегов" - этот метод индексирования широко используется в блогах и на прочих интернет-сайтах второго поколения. Облако тегов - список наиболее часто используемых терминов в алфавитном порядке - позволяет читателю с одного взгляда отфильтровать информацию.

В "Облаке тегов выступлений президентов США", созданном Мехтой, размер букв, которыми написано слово, зависит от частоты его употребления в каждой конкретной речи. Более крупный шрифт означает более активное употребление. Различные цвета показывают, как долго используется данный термин: светлым оттенком выделены новые слова из президентского лексикона, затасканные слова - тускло-коричневым, регулярно используемые - бежевым.

Большинство похожих слов, например, "террорист" и "терроризм", программа воспринимает в качестве единого термина. Неудивительно, что в недавних речах президента Буша слово "Ирак" написано большими светлыми буквами. В самой последней речи, где он призывал к отправке дополнительных солдат в Ирак, впервые в облаке тегов появились слова "Анбар" и "шииты" - они написаны белым цветом.

Ослепительно белые слова

"Одна из основных тенденций, которые я заметил, - то, что президенты отходят от слов, обозначающих конкретные действия, и теперь больше говорят об абстрактных понятиях, - рассказывает Мехта. - Когда дело доходит до Никсона и Линдона Джонсона, то они все время говорят о "готовности".

С течением времени слово "война" становится бежевым и не исчезает - оно появляется во всех речах, обработанных Мехтой. Лишь в двух речах это слово не входит в сотню самых употребимых терминов: в инаугурационной речи Джорджа Вашингтона в 1789 году и в речи Франклина Рузвельта в 1935 году о социальном обеспечении. Конечно, президенту необходимо произнести слово более одного раза за речь, чтобы оно попало в первую сотню и его начали сравнивать с предыдущими выступлениями.

Цветовые обозначения показывают главные вехи в истории Америки. Переключитесь на 1812 год, и там появятся слова "война" и "британцы" - большие, написанные ослепительно белым цветом. В 1958 году благодаря президенту Эйзенхауэру ярко-белыми становятся слова "баллистический" и "ракеты", а за семь лет до этого при Трумэне так же появился "коммунизм".

Столь же ясно цвет показывает, как президент Буш начал использовать слово "терроризм". Пугающее белым цветом, это слово появляется в облаке, соответствующем речи Буша 20 сентября 2001 года, в которой он объявил войну против террора - и в последующие пять лет это слово во всех речах остается примерно тех же огромных размеров.

Поверхностное ознакомление с президентской "тег-линией", как ее называет мистер Мехта, навевает самые разные мысли. Один из любимых примеров Мехты - "сношение". "Не думаю, что Буш будет использовать это слово в своем докладе о положении в стране, - прогнозирует он, - однако в ранней истории выступлений оно было достаточно популярным".

В декабре 1825 года президент Адамс, описывая отношения между США и Европой, сказал: "В то же время наши сношения со всеми государствами были мирными и дружественными, так будет и в дальнейшем".

"Судно" - еще одно слово, характерное для президентского словаря, забытое представителями нынешних администраций. В докладе о положении в стране Томаса Джефферсона от 1802 года "судно" четко лидирует. Например, Джефферсон жаловался, что европейская торговая политика "фактически призвана запретить нам ввозить туда нашу собственную продукцию на собственных судах".

"Конституция" была одним из любимых президентских слов в начале XIX века, однако в XX веке оно практически исчезает. "Семья" из большого слова превращается в громадное, когда на смену рейгановским 1980-м приходят клинтоновские 1990-е.

"Краткий пересказ истории"

Автор программы признает, что он не профессиональный историк. "Я не так уж много знаю об истории США, - соглашается он, - для меня это был скорее краткий пересказ истории". Впервые он написал программу по составлению облака тегов, чтобы индексировать собственный блог.

"Я узнал, что в 2004 году, когда я переехал во Флориду, в моей жизни важным стало слово "ураган", - рассказывает он. Затем он решил использовать программу, чтобы создать "то, что действительно будет интересно людям".

Он запустил свое облако тегов из президентских речей незадолго до ноябрьских выборов. По его словам, за первые две недели страница набрала больше миллиона посещений. Сейчас, по словам создателя, страницу ежедневно посещают от 500 до 1000 человек. Программа для составления облака тегов распространяется бесплатно на сайте Мехты по лицензии Creative Commons.

Работает она просто, рассказывает автор: достаточно скопировать текст в генератор "тег-линии". Он отсекает популярные слова вроде "я" или "и", объединяет похожие слова вроде "Ирак" и "иракцы", а затем в виде облака представляет наиболее часто употребляемые термины. Затем программа сравнивает последнюю речь со всеми более ранними и выявляет, какие слова появились впервые, а которые используются давно, и присваивает им цветовое обозначение.

Мехта применяет свою программу и для других задач. В декабре репортер газеты Seattle Post-Intelligencer Тодд Бишоп попросил Мехту об использовании этой же технологии для исследования истории Microsoft. В результате он суммировал историю трех десятилетий - основные выступления, интервью и внутреннюю переписку.

Однако он не планирует оставлять свой президентский архив. Как обещает Мехта, облако тегов по докладу о положении в стране, намеченному на вечер вторника, появится спустя 10 минут после публикации речи на сайте Белого дома.

Источник: The Wall Street Journal


facebook

Inopressa: Иностранная пресса о событиях в России и в мире
При любом использовании материалов сайта гиперссылка (hyperlink) на InoPressa.ru обязательна.
Обратная связь: редакция / отдел рекламы
Подписка на новости (RSS)
Информация об ограничениях
© 1999-2024 InoPressa.ru