Примерное время чтения: 3 минуты
570

Google Ngram Viewer: Сталин популярнее Ленина, а слово Интернет появилось в конце 19 века

Крупнейший мировой поисковик прогнал через свои фильтры все литературное наследие человечества за последние 200 лет. Что из этого получилось, рассказывается в очередном выпуске научно-популярной программы «Инфомания», которая выходит на канале СТС.

«Откуда в 19-м веке слово „интернет“?» — недоумевают пользователи нового сервиса Books Ngram Viewer, которые обнаружили первые сообщения о глобальной Сети в далеких 1890-х годах. «В любой системе есть погрешности», — честно отвечают разработчики Google. Впрочем, они тут же добавляют, что у слова «интернет» имеется одно устаревшее значение и предлагают пользователям его найти. Праздные блоггеры бьются над этой задачей уже больше месяца. Лингвистическую программу на платформе поисковика Google запустили гарвардские ученые. Они закачали на сервер около 5 миллионов книг, опубликованных за период c 1800 по 2009 год. Любой желающий теперь может проследить, с какой частотой определенные слова упоминались на протяжении веков.

Поиск доступен на семи языках: английском, французском, немецком, испанском, иврите, русском и упрощенном китайском. Особое место отведено английскому — он здесь подразделяется на «общий», «художественный», «британский» и «американский». Система позволяет проводить сопоставительный анализ — к примеру, Ленин упоминается в литературе на русском языке гораздо чаще, чем Сталин, в том числе и после 2000 года, что легко можно проследить на графике, если ввести эти фамилии через запятую в строку поиска. По этой причине сервис привлек внимание серьезных исследователей — человеку и целой жизни не хватит, чтобы проанализировать 5 миллионов источников, а компьютерная программа проделывает эту операцию за несколько секунд.

Под онлайн-сервис в Гарварде придумали и целую науку, которую решили назвать «культуромикой». Дело в том, что отсканированные книги в основном посвящены вопросам культуры и общества, здесь нет технической литературы. Измерять частоту упоминаний ученые предложили в «миллидарвинах» — согласно графикам Books Ngram Viewer, по популярности Дарвин обгоняет самого Эйнштейна.

Для основной массы пользователей интернета новая услуга от Google стала очередным развлечением, помогающим развеять тоску офисных будней. К примеру, многие юзеры принялись забивать в поиск названия популярных социальных сетей. Английский язык более гибкий и восприимчивый к нововведениям, чем русский: слово Facebook, например, стало нарицательным и даже образовало устоявшуюся глагольную форму, официально включенную в онлайн-словари. «She learned that her current employer Facebooked her before hiring her» — «Она узнала, что нынешний работодатель профэйсбучил ее, прежде чем взять на работу», — гласит пример употребления в одной из словарных статей.

Смотрите также:

Оцените материал
Оставить комментарий (0)

Также вам может быть интересно

Топ 5 читаемых



Самое интересное в регионах