Том Стоки - директор по продуктам компании Google. Присоединившись к ней в 2005 году, он стал членом команд, которые работали над iGoogle, Google Reader, Историей веб-поиска и другими продуктами, направленными на персонализацию поиска. Сейчас Стоки занимается поиском, клиентскими и внутренними сервисами в Европе. Мы получили возможность взять небольшое интервью у Тома, пока он находился в Москве.
Расскажите о своей текущей роли в компании Google. Ранее вы работали над продуктами для разработчиков, теперь занимаетесь поиском и клиентскими сервисами, как получился такой переход и чем примечательная новая работа?
Т.С.: Я работал над продуктами для разработчиков примерно три года, а потом открылось новое место в Европе, и я просто решил переехать в Цюрих. Основное отличие между работами заключается в том, что я теперь думаю не об инфраструктуре, которая стоит за сервисами, а о конечных пользователях, причем о тех, которые живут вне США.
Пожалуй, самый главный вопрос – Caffeine. Что это такое, почему было необходимо и как это влияет на результаты поиска?
Т.С.: Перед тем как я подробнее расскажу про Caffeine, я бы хотел в общих чертах объяснить принцип работы поисковой системы. Она исследует интернет при помощи специальных программных роботов - пауков. Они заходят на сайты, индексируют их содержимое: основную информацию, ключевые слова, ссылки и т.п. На базе этих данных создается индекс. Затем создается так называемый обратный индекс: какие страницы являются самыми популярными по определенному ключевому слову.
Caffeine – это новая система индексирования сайтов, которую Google запустил в начале июня. Раньше мы использовали так называемый пакетный процесс обработки поисковых запросов и каждые несколько недель создавали новый индекс интернета. В течение этих недель индекс не менялся, и это являлось некоторым недостатком.
Что сделал Caffeine? Он фактически взял принцип индексирования страниц, который ранее происходил раз в несколько недель, и теперь осуществляет этот процесс постоянно. По мере возникновения новой страницы она тут же индексируется.
Для конечного пользователя это означает, что обновление информации происходит на 50 процентов быстрее.
Есть ли какой-то показательный запрос, который иллюстрирует это улучшение?
Т.С.: Давайте возьмем такой запрос: «Сеть по вопросам государственного управления». Он должен привести нас на сайт www.gosbook.ru, который был запущен 7 июля. В выдаче Google этот сайт появился очень быстро, в других системах его может не быть до сих пор (на момент расшифровки интервью, 21 июля, сайт по данному запросу действительно не показывался нигде, кроме Google, - прим. ред.).
Точно также мы можем ввести «site:aif.ru» и увидеть, сколько минут назад этот сайт был обновлен.
Говорят, что с внедрением Caffeine специалистам по поисковой оптимизации придется заново изучать алгоритмы работы поиска и заново придумывать стратегии подъема сайтов. Это правда?
Т.С.: Это не совсем так. У нас есть специальные руководства для веб-мастеров и они не меняются. Мы акцентируем внимание на тех же самых главных вещах, например, самая важная информация должна стоять в заголовке. Эти правила не изменились.
Известно, что в Google существует «служба контроля качества поиска». Как и кто занимается анализом работы Google на локальных рынках? Другими словами, кто отвечает за качество поиска Google в российской зоне интернета?
Т.С.: Наша поисковая команда распределена по всему миру. Кто-то работает и отвечает за Россию из московского офиса, кто-то из Маунтин-Вью или Цюриха. В некоторых случаях, например, когда проводятся мероприятия против спама, изменения в поиск вводятся на глобальном уровне. Они влияют на все языки и регионы. Но есть и изменения, которые специфичны для русского языка или России. Эти вещи обсуждаются в Москве.
Google начал реализовывать концепцию поиска в реальном времени, например, по сообщениям из Twitter. Что еще входит в эту концепцию?
Т.С.: Давайте возьмем для примера запрос, касающийся недавнего нефтяного розлива. Google не только покажет сообщения из Twitter, но и выдаст отдельным списком ссылки, которые встречаются в этих сообщениях. Там будут отображаться новые или обновленные новостные сайты. Помимо Twitter, мы работаем с FriendFeed, Facebook и блоговыми сервисами.
А что с российскими социальными сетями?
Т.С.: Российских сетей пока нет. Мы пока не готовы делать какие-то объявления, могу лишь сказать, что мы работаем, и будем совершенствовать все несовершенное.
Когда был запущен Bing, The Wall Street Journal назвал его «более привлекательным, чем Google». Воспринимаете ли вы Bing, как серьезного конкурента?
Т.С.: Мы ко всем конкурентам относимся серьезно. Особенно, если они принадлежат таким большим компаниям, как Microsoft. Но в реальной жизни мы обнаружили, что более сильными конкурентами на самом деле являются более мелкие компании.
Можно привести пример такой мелкой компании?
Т.С.: Лучше я не буду таких примеров давать. Но я могу назвать области: есть компании, которые работают над семантическим поиском и над сервисами "вопрос-ответ". Они концентрируются на этих исследовательских областях компьютерных наук. Естественно мы тоже уделяем много внимания этим областям, но мы не концентрируемся на конкуренции в краткосрочном периоде.
А как насчет сервисов, использующих для поиска рекомендации, рейтинги и советы реальных пользователей? «Социальный» поиск – это угроза для «традиционного» поиска?
Т.С.: Я рассматриваю это не как угрозу, а как область, где мы можем работать над улучшениями. Действительно, существуют определенные типы запросов (например, информация о новом фильме или ресторане), на которые лучшим, релевантным ответом будет рекомендация друзей. По этой причине мы примерно год назад запустили «социальный поиск» и теперь занимаемся его улучшением.
Как это работает: вы привязываете к своему аккаунту на Google ваш Twitter, FriendFeed и другие подобные сервисы. Это позволяет нам искать нужную вам информацию в сообщениях ваших друзей и учитывать ее в поисковой выдаче. Эта функция запущена пока только в США, и она не очень явная, поскольку является экспериментальной, но мы работаем над ней. Сервис Google Buzz, кстати, помогаем нам в этом.
Весной этого года из поисковой выдачи Google исчезли кнопки «Promote» и «Remove». Вместо них появились звездочки. Почему это произошло? Кнопками пользовались неправильно или не пользовались вообще?
Т.С.: Мы провели много внутренних исследований, касающихся, в том числе, этих кнопочек, и обнаружили, что люди хотят отмечать результаты, но не хотят пересортировывать выдачу. Я также думаю, что пользователям было не совсем понятно значение «Promote» и «Remove». А звездочки – это то, что легко понять и то, что люди действительно хотят.
Поставленная мною звездочка как-то влияет на результаты поиска другого человека по похожему запросу?
Т.С.: Нет, она влияет только на ваш поиск. Если вы отмечаете звездочкой результат, то потом по похожему запросу эта ссылка будет подниматься выше. Сейчас поиск - это не только ссылки на сайты, но и примечания, которые вы добавляете к ним.
Как изменится интерфейс Google в будущем? На чем разработчики акцентируют свое внимание? Будет ли Google всегда придерживаться концепции «визуальной простоты»?
Т.С.: Да, абсолютно. Когда мы говорим о простоте, мы используем матрицу «время - результат»: сколько времени требуется пользователю с момента начала поиска до момента получения результата. Например, недавно появившаяся левая боковая панель служит именно для ускорения поиска. Она позволяет изменять параметры запроса, не набирая его вручную заново.
В зависимости от запроса содержимое панели немного меняется, например, если я ищу цветы, то на ней появятся «Изображения» и «Новости», а если фотокамеру, то еще и пункты «Купить» и «Карты». Выглядит, возможно, немного более сложно, но нам показалось это интуитивно понятным. Мы не ошиблись: в большинстве наших тестов среднее время, уходящее на получение результата, сократилось.
Визуальный поиск через Google Goggles – это почти «дополненная реальность». Надо ли полагать, что Google активно движется в эту сторону?
Т.С.: Мы только начинам двигаться в этом направлении и пока особо не акцентируем своем внимание на дополненной реальности как таковой. Мы фокусируемся на подготовке базовой информации, которую потом можно использовать для создания приложений для дополненной реальности. Например, на нашем сервисе Street View вы можете найти отметки, на которых перечислены компании, находящихся в конкретном здании.
Давайте поговорим о будущем. Куда движутся технологии поиска?
Т.С.: Я бы ответил двумя путями. Первый - как мы в принципе воспринимаем развитие поиска. Он движется в нескольких ключевых направлениях, в которые мы будем постоянно инвестировать. Первое направление - это полнота. Мы будем получать все больший объем информации от тех источников, с которыми раньше невозможно было работать. Это книги, карты и т.д. Другое направление – это релевантность информации. Частью этого как раз является Caffeine – в него было вложено много усилий. На нем разработка не остановилась: в среднем мы вносим 2-3 изменения в каждый алгоритм каждую неделю.
Наконец, третье направление – это пользовательский опыт. Возможно, вы слышали о том, что мы регулярно проводим самые разнообразные эксперименты. В каждый конкретный момент времени их может быть от 50 до 200. Мы меняем интерфейс для небольшого процента пользователей, иногда они отмечают эти маленькие изменения, иногда нет. Но мы можем для себя отметить, быстрее ли они находят то, что ищут.
Постепенно мы распространяем эти изменения на всех пользователей. Примерно два-три раза в неделю появляется что-то новенькое. Более масштабные вещи, например, колонку слева, мы начали тестировать еще в 2006 году. Начинали с небольшого количества пользователей, смотрели на их реакцию. И когда мы поняли, что она действительно полезна и матрица начала демонстрировать сокращение времени поиска, мы запустили колонку для всех.
Другой тренд, который уже налицо - это мобильный поиск. Этот рынок растет быстрыми темпами, мы обнаруживаем все новые и новые пути, как люди используют телефоны, ищут через них. Например, это голосовой поиск.
Он работает следующим образом: пользователь произносит запрос, программа создает аудиофайл, отправляет на сервер, сервер разбивает его на фононимы, транслирует в текст, а затем по тексту делает поиск. И все это менее чем за секунду.
Для разработчиков мы сделали возможным использовать эту систему распознавания в своих приложениях. Сейчас она работает с английским, китайским, японским, испанском, итальянском, немецком и французским языками. Русского пока нет, но нужно понимать, что создание «голосовой модели» - это очень длительный процесс. Мы приглашаем тысячи людей, ставим их в самые разные акустически условия и заставляем говорить, как можно больше. Это требует времени, но это часть той области, на которой мы будем фокусироваться.