Список «слов-целей» для распознания речи
Список «слов-целей» для распознания речи
Сотрудники Отдела II рассматривают свои технические трюки как святыню. Чтобы защитить ее, им подходят любые средства. В случае необходимости они прибегают к «вынужденной лжи» и дезинформации. Так они со всей серьезностью утверждают, что в радиотехнической разведке и разведке средствами связи ни одна спецслужба мира не располагает компьютером для распознания речи и голоса, который сам на основе введенных ключевых слов дает приказ на запись определенных разговоров. Контр-адмирал Герхард Гюллих, который до весны 1996 года занимал один из руководящих постов в БНД, всегда в своих интервью использовал выражение «пылесос в эфире», ссылаясь на банки данных слов. Но Гюллих ошибался, утверждают сегодня в Пуллахе, банки данных слов есть мол только для прочтения факсов, телексов и компьютерной передачи данных, но не для телефонных бесед. Якобы только факсы, телексы и электронная почта могут прочесываться компьютерами с банками данных слов-целей только по комбинациям букв или цифр (например, в номерах заказов). Удивительно: американское АНБ еще в 50-х годах ввело в строй свой первый компьютер с банком данных слов для прочтения телексов. А около десяти лет назад компьютеры по распознанию речи АНБ начали работать и на подслушивании телефонных разговоров. А в связи с роспуском Министерства Госбезопасности ГДР в здании «Штази» на улице Норманненштрассе в Восточном Берлине были найдены тысячи магнитофонных пленок, на которых были записаны разговоры с Западным Берлином и свободной частью Германии, отобранные с помощью компьютера для распознания языка. Неужели это развитие прошло незамеченным мимо БНД? Или «Штази» превосходила БНД по технической оснащенности?
Возможно, БНД стоило бы более разумно перераспределить однажды свои деньги и понаблюдать за адвокатом Рольфом Шалленом из Дюссельдорфа. Специалист по законодательству о медицинских страховых кассах сначала использовал свой компьютер, которому можно диктовать, лишь в качестве замены своей секретарши на время ее отпуска. А теперь Шаллен и его коллега Франк Михельс регулярно диктуют целые письма своему компьютеру с системой распознания речи. Очень популярно электронное распознание речи и у медиков и лаборантов. Полная программа для использования в ПК стоит у IBM или Dragon Systems чуть меньше 3000 марок. Программа IBM Voice Type Simply Speaking с аксессуарами и микрофоном — даже всего 2000 марок. Через нее можно не только управлять основной функцией эксплуатируемой системы, но и всеми дополнительными функциями. По адресу в «Интернете» http://www.software.ibm.com/voicetype можно узнать все подробности о распознании речи. IBM использует в рекламе этого продукта лозунг: «Вместо надоедливого печатания — просто диктуйте!» Вольфганг Карбштайн, шеф отдела по системам распознания языка в IBM Германии хочет сделать распознание речи компьютерами привлекательным и для отдельных пользователей в немецких бюро. Журнал «DM» в июньском номере 1997 года пишет о гражданских программах по распознанию речи: «Smart Word 2.5 хоть и содержит в памяти постоянный набор из всего 10 тысяч основных слов, может быть перенастроен на требуемый вокабуляр из словаря объемом в 120 тысяч слов.» В этих программах, которые, как можно предположить, намного хуже тех, что использует БНД, квота ошибок весьма невелика. «С помощью сложных статистических методов компьютер анализирует вероятность возможных идентифицируемых комбинаций слов. Программное обеспечение при этом не полагается только на одну комбинацию при идентификации слов, а содержит много альтернативных формулировок. Так в тесте журнала «DM», к примеру, из распознанного сначала немецкого предложения «Das Haus rennt» («Дом бежит») получилось в течение секунды куда более логичное «Das Haus brennt» («Дом горит»). И не только это. Даже акустические совпадения вроде омонимов — так языковеды называют одинаково звучащие слова с различным значением — благодаря многоступенчатому процессу анализа обычно правильно идентифицируются.» И самый новый телефон «Телекома» «Speech AB» оснащен этим. Вершиной этого аппарата, который стоит 369 марок, является возможность управлять голосом им и встроенным автоответчиком с помощью заранее введенных команд. В июньском (1997) номере журнала о телекоммуникационной технике «Коннект» на стр. 75 так пишется о распознавании языка мобильными телефонами: «Как обычно, в системах распознавания речи системы первого поколения понимали лишь речь своего собственного владельца. Современные телефоны понимают речь, независимо от того, кто именно говорит.» Никто не может всерьез поверить в то, что такое развитие технологии прошло незамеченным мимо БНД.
Но в отделе технической разведки прилагают все усилия к тому, чтобы выставить Службу перед общественностью технически отсталой. В области международных телефонных переговоров там якобы все еще работают по «китайскому методу», то есть около 50 сотрудников посменно занимаются только подслушиванием чужих телефонов. (Для сравнения: в Швейцарии спецслужба использует в этих целях 35 профессиональных «слухачей», которые за год обходятся в 5 миллионов швейцарских франков.) Бедняги, по-видимому, не читают специальных журналов. Иначе они не упустили бы сообщение о том, что исследовательский центр фирмы «Филипс» в Ахене уже с 1995 года любому заинтересовавшемуся новичку круглые сутки за телефонным номером 0241–604020 представляет компьютер для распознания языка, чьи способности уже давно никто не может опровергнуть. Машину «Филипса» нельзя сбить с толку разговорной речью с жаргонными словечками, с диалектами она тоже справляется.
«Филипс» и «Сименс» являются пионерами электронного распознавания речи. «Сименс», например, разработал новую программу диктовки для медиков. Пока доктор говорит, компьютер уже пишет. («Слушающие» программы — это, например, Speechprocessing у «Philips» за 7000 марок, Dragon Dictate 2.2. за 1885 марок, Voicetype 3.02 от IBM за 1500 марок, Smartword 2.5 от Dragon Dictate за 299 марок и Voice Type — Simply Speaking всего за 199 марок).
Конечно, и сейчас, как и прежде, каждый записанный БНД разговор в конечном счете будет слушать человек — в реальном масштабе времени. Масштабное подслушивание телефонных разговоров требует поэтому много времени и интенсивной работы персонала. Это ограничивает любопытство БНД. Чтобы ежедневно прослушивать хотя бы половину всех международных переговоров в Германии, для БНД в каждой смене должны работать около 30 тысяч «слухачей». Но компьютеры по распознаванию речи проводят предварительный отбор. 50 работающих «по китайскому методу» сотрудников в Пуллахе должны в этом случае слушать лишь те отобранные пленки, в которых встречаются интересующие БНД т. н. «слова-цели», т. е. ключевые слова из мира наркоторговли, контрабанды оружием и элементами оружия массового поражения или терроризма. Словарь «слов-целей» этой программы БНД, понятное дело, держится в секрете и «в случае необходимости» дополняется. Не только тот, кто в разговоре использует слово «Калашников», может быть уверен, что компьютер стартует автоматическую запись. Гораздо важнее слова, известные только узкому кругу лиц, вроде «мостазафин» (иранская организация, занимающаяся закупками оружия для этой исламской страны), «солнцевская» (российская мафиозная группировка, занимающаяся торговлей наркотиками), «бойцы» (бывшие российские фронтовики-«афганцы»), или «сунь е он» (китайская мафиозная «триада»). Это только немногие слова из современного списка БНД. Кроме стандартно запрограммированных слов из банка данных БНД, вроде «Стингер», «амфетамин», «СУ-27» там есть и новые, которые помогают при определении опасностей и могут наводить разведчиков на след.
Такое развитие выглядит проблематичным, в первую очередь, для журналистов. Почти все большие газеты, а также радио и телевидение располагают сетью иностранных корреспондентов. В ходе их острых расследований они, несомненно, упоминают в телефонных разговорах те слова, за которыми охотится БНД, и которые активируют компьютер. Журналисты таким образом становятся жертвами сбора сведений в список спецслужб. Если корреспондент за границей занимается вопросами расследования дел о торговле оружием, наркотиками или отмывке денег, то он не сможет избежать использования ключевых для БНД слов. Тогда редакционной тайны больше уже просто не существует.
При надзоре за телефонными переговорами БНД сотрудничает с «Телекомом» и другими телефонными компаниями. Можно предположить, что им за это платят, как это делается и в других странах. О приватизированном британском «Телекоме», в частности, известно, что он получает 10 миллионов фунтов стерлингов от правительства за запись и контроль телефонных разговоров. Специалист по разведке англичанин Стивен Доррил называет это «выгодным делом».