Группа аспирантов из американского Университета Дрекселя на конференции 29C3 в Берлине представила способ установить автора анонимной публикации путем лингвистического анализа материалов, опубликованных в Сети, сообщает SC Magazine Australia.
Исследователи предлагают исследовать материалы - это могут быть "твиты", электронные письма, сообщения из мессенджеров или посты из форумов - с точки зрения статистической стилистики, выявляя в них закономерности и общие черты.
Одним из главных ориентиров, позволяющих вычислить человека, являются служебные слова, которые он использует в переписке, утверждает Садиа Афроз (Sadia Afroz), одна из разработчиков метода. Служебные слова используются не для обозначения предметов, а для выражения отношений между другими членами предложения.
Затруднить поиск могут использование автором "альтернативного алфавита" или языка, отличного от английского (создатели метода, напомним, являются американцами), однако текст, переведенный автоматическим переводчиком, также может успешно выступать материалом для анализа.
Инструмент для установления авторства текста, созданный исследователями, получил название JStylo. Программа существует в виде альфа-версии; ее разработка еще не завершена.
JStylo способна успешно выявить автора текста лишь при соблюдении ряда условий, уточняет The New York Times. Во-первых, круг "подозреваемых" должен быть ограничен пятьюдесятью людьми или менее. Во-вторых, на каждого "подозреваемого" должен быть собран языковой материал - тексты совокупной длиной не менее 6500 слов. В-третьих, длина текста, авторство которого нужно установить, должна превышать 500 слов.
Когда разработка JStylo будет завершена, инструмент сможет использоваться для выявления личностей злоумышленников - хакеров, взломщиков программ, создателей вирусов, операторов ботнетов. Материалом для анализа станут сообщения, оставленные ими на тематических форумах.
Одновременно с JStylo исследователи разрабатывают инструмент Anonymouth, задача которого состоит в обратном - помочь авторам "зашифровать" свои сообщения, оформив их в нехарактерном стиле: например, введя дополнительные предложения, изменив слова или переставив знаки препинания.
По материалам lenta.ru
Другие новости по теме
Воробьев нашел в Подмосковье нелегальную добычу полезных ископаемых
Умер лауреат Нобелевской премии по экономике Джеймс Бьюкенен
Медведев: тарифы ЖКХ не всегда растут объективно
Пенсионный фонд потребовал у Chrysler провести IPO
Цены на продукты питания в 2012 году упали
Власти США начали охоту на Herbalife
В мире производится вдвое больше еды, чем необходимо
"Индекс страха" на биржах упал до минимума с начала кризиса
Внеплановая публикация отчета обрушила акции Marks & Spencer
Миллер объявил об удвоении СПГ-мощностей на Ямале
Американцы глумятся над подписью нового министра финансов - "сумасшедшая соломинка"
Онищенко готов провести с грузинскими компаниями переговоры о поставках вина
В 2013 году сварить овсянку станет накладнее - овес нынче дорог, зато сахар дешевле
Правительство запретит квалифицированным иностранцам работать в рознице
Белый дом назвал монету в триллион долларов спекуляцией
Россия поднялась на пять мест в рейтинге экономической свободы
|