ИнтервьюРазработчица Google
о том, что и как люди ищут
в интернете
Рассказываем, почему сегодня можно разговаривать с Google на том же языке, что и с лучшим другом, и поисковик вас поймет
Каждый день мы ищем ответы на вопросы о том, как стать счастливыми, или почему вода подо льдом не замерзает. Не последнюю роль в формировании нашего подхода к данным сыграли поисковые системы, в том числе Google, который в России уже восемь лет. Wonderzine поговорил с разработчицей Анной Кондратьевой, которая сейчас работает в подразделении поиска в московском офисе Google. Она рассказала, как за декаду изменился язык, на котором мы разговариваем с поисковиками, почему не стоит бояться контекстной рекламы и почему голосовым поиском люди пользуются только в одиночестве.
Интервью: Элина Чеббоча
Анна Кондратьева
разработчица Google
С МОМЕНТА, КАК GOOGLE ПРИШЕЛ В РОССИЮ, ПРОШЛО ВОСЕМЬ ЛЕТ. ВЫ НАВЕРНЯКА, КАК И ВСЕ ПОИСКОВЫЕ СИСТЕМЫ, ИНДЕКСИРУЕТЕ СОДЕРЖАНИЕ ИНТЕРНЕТА. И У ВАС НАВЕРНЯКА ЕСТЬ КАКИЕ-ТО ДАННЫЕ, КАК ИЗМЕНИЛИСЬ ЗАПРОСЫ С МОМЕНТА ПРИХОДА GOOGLE И В НАШЕ ВРЕМЯ. ЧТО СЕЙЧАС ИЩУТ БОЛЬШЕ ВСЕГО?
В первую очередь изменились не только поисковые запросы — изменились поисковые системы, и довольно сильно. Эти перемены всегда взаимосвязаны: какие-то функции появляются в поисковой системе, люди понимают, что они там есть, и начинают этим пользоваться. Иногда изменения приходят с другой стороны, то есть по запросу пользователя. Эта система эволюционирует постоянно. На заре развития поисковых систем всё было устроено очень просто: вы вводили слова, которые хотели увидеть, и вам находили документы, которые содержат эти слова. Сейчас поисковые системы намного сложнее: у нас есть карты, у нас есть видео, у нас есть непосредственные ответы на вопросы. Мы стараемся понимать, о чём именно спросил пользователь.
В конце 2012 года Google запустил в России принципиально новый сервис — «Knowledge Graph», по-русски он называется «Сеть знаний». Это база данных, но не индекс ключевых слов и адресов, а набор статей, связанных между собой семантическими ссылками, граф фактов и связей между ними. Благодаря такой структуре Google не просто пытается найти информацию, дословно соответствующую запросу, а способен прямо ответить на вопрос пользователя. Если, например, пользователь спрашивает про какого-то актера, мы стараемся выдать максимум информации об этом актере сразу — рассказать, чем он знаменит, каково его семейное положение, какие его фильмы наиболее популярны, с какими актерами он снимался. То есть это гораздо более сложная система, нежели простое соответствие одних слов другим словам.
И пользователи, в свою очередь, начинают общаться с поисковой системой более свободно — они начинают задавать вопросы, как если бы они спрашивали своего друга, который очень много знает. Они не говорят как раньше...
КУПИТЬ КОЛБАСУ.
Купить колбасу — это тоже очень сложный запрос! Когда вы говорите «купить колбасу» система должна понять, что «колбаса» — это продукт, и что, говоря «купить», вы подразумеваете какое-то действие и, скорее всего, хотите увидеть какой-нибудь магазин. Вряд ли вы хотите купить колбасу в интернете, скорее всего, вы хотите знать, где поблизости есть продуктовый магазин, который открыт прямо сейчас. То есть это совсем не так просто, как могло бы показаться.
ТО ЕСТЬ ВЫ ПОДСТРАИВАЕТЕСЬ ПОД ЗАПРОСЫ ПОЛЬЗОВАТЕЛЯ ИЛИ ВСЁ ПРОИСХОДИТ НАОБОРОТ? К ПРИМЕРУ, ЕСЛИ Я ХОЧУ УВИДЕТЬ, КАК ВЫГЛЯДИТ ДОЧКА РАЙАНА ГОСЛИНГА И ЕВЫ МЕНДЕС, МНЕ ДОСТАТОЧНО ВВЕСТИ ИХ ИМЕНА В ПОИСКОВИК.
Верно, и если вы введете их, то в выпадающих подсказках увидите, что этим интересуется огромное количество человек.
А РАНЬШЕ, НА ЗАРЕ РАЗВИТИЯ ПОИСКОВИКОВ ИЛИ, НАПРИМЕР, ВО ВРЕМЯ СУЩЕСТВОВАНИЯ «РАМБЛЕРА» И ЕГО БЫТИЯ ВСЁ ЕЩЕ ПОИСКОВОЙ СИСТЕМОЙ, МНЕ ТРЕБОВАЛОСЬ БЫ ВВЕСТИ ПОЛНОСТЬЮ ВЕСЬ МОЙ ЗАПРОС: РАЙАН ГОСЛИНГ, ЕВА МЕНДЕС, 15 СЕНТЯБРЯ, ВЕЧЕР, США, ДОЧЬ.
И с огромной вероятностью раньше вы бы увидели исключительно страницу Википедии, а не новость о рождении ребенка. Хотя ее тогда не было, так что это был бы какой-нибудь IMDB. То есть сейчас мы подстраиваемся под пользователей, стараемся всё больше и больше понимать их намерения. Не просто выдавать простейшие соответствия, а понимать, что именно человек хочет увидеть, и решать проблемы, которые у него возникают. Одновременно обратный процесс тоже верен. Если люди понимают, что у нас есть карты и на этих картах можно поискать все кафе в округе, они начинают это делать чаще. Это ситуация, когда спрос и предложение находят друг друга.
Есть шутка про то, что можно залезть на YouTube,
чтобы посмотреть, как варить борщ, а через полчаса оказаться во вселенной Стивена Хокинга
Сейчас в медиасреде распространен такой тренд, как explanatory journalism. Фактически журналисты забирают у Google его функцию. Если ты сейчас хочешь разобраться в какой-то сложной ситуации, достаточно прочитать одну статью, а не задавать 150 запросов в Google. Вы не боитесь, что из-за этой тенденции со временем поисковики превратятся просто в сборник бытовых знаний? То есть через десять лет люди будут приходить в Google только затем, чтобы что-то купить и найти что-то конкретное.
Любая система, которая находит ответ на вопрос, в той или иной мере является поисковой системой. Противоположной является ситуация, когда у вас нет вопроса, а вам предлагают информацию, полагая, что она может быть вам интересна. Например, журнал сам дает нам знания, мы не инициируем этот процесс. Журналист предлагает информацию, не зная, нужна она человеку или нет. Поиск устроен наоборот — там пользователь является активной стороной, он начинает инициировать этот процесс своим запросом. Это очень персональная и очень многофункциональная система. Потому что даже у одного человека спектр запросов огромен в течение небольшого количества времени.
Есть шутка про то, что можно залезть на YouTube, чтобы посмотреть, как варить борщ, а через полчаса оказаться во вселенной Стивена Хокинга и смотреть видео про то, как устроены черные дыры. У каждого человека набор вещей, который ему интересен, просто огромен — как у целого народа и всего человечества. Соответственно, журналистика, которая предлагает информацию для некоторой группы пользователей, не может полностью удовлетворить интересы людей из остальных групп. Поисковый запрос выдает мгновенную информацию на то, что интересует вас прямо сейчас, в эту секунду.
Мы уже отвыкли и не помним, как это было, когда поисковой системы и интернета не было. Мы не помним этого момента: когда мы хотели узнать, кто был женой какого-нибудь известного человека или исторического персонажа, то надо было идти в библиотеку, искать эту книжку — это был очень сложный и очень долгий процесс. Сейчас мы делаем это настолько быстро, что даже не задумываемся о том, какая технология за этим стоит. Настолько это стало обыденно, что мы не понимаем, насколько это на самом деле важно, насколько дополняет наш мир, насколько ускоряет наши возможности к обучению и получению информации.
Сколько в среднем раз в день обращается человек в Google?
Google в среднем обрабатывает 40 тысяч запросов в секунду. Мы, конечно, не можем сказать, сколько раз тот или иной человек обращается к Google.
отличаются ли чем-нибудь мужские и женские запросы в Google?
Если посмотреть внимательно, особенно на несколько запросов подряд, то, наверное, можно предположить, чьи это были запросы. Если спрашивают, как готовить пирог, то, скорее всего, это все-таки женщина, а если спрашивают, как варить сосиски, то, вероятнее всего, мужчина. Но это, конечно, очень поверхностная оценка, на самом деле мы не знаем, кто стоит за тем или иным запросом. Мы очень аккуратно относимся к личным данным пользователя. К примеру, ни я, ни один из инженеров не может узнать, какой человек что искал, — это совершенно невозможно.
Недавно была серия статей, что Google знает про вас то, что вы сами про себя не знаете. Честно говоря, у меня у самой создается такое впечатление иногда. Когда вы анализируете мои поисковые запросы, а потом на основании этого выдаете мне контекстную рекламу, я думаю: блин, Большой брат следит за мной.
Когда пользователи предоставляют нам данные, например, регистрируя аккаунт Google, мы используем их, чтобы улучшить работу сервисов и сделать их еще удобнее. Благодаря этим данным мы показываем вам более релевантные результаты поиска и рекламу и обеспечиваем возможность легко делиться информацией. При этом мы всегда заботимся о том, чтобы пользователи понимали, как используются данные, а также каким образом можно защитить свою конфиденциальность. В частности, каждый пользователь может управлять определенными типами сведений в аккаунте Google с помощью «Личного кабинета», настраивать внешний вид своего профиля Google с помощью редактора, управлять доступом других лиц к данным и так далее.
Реклама — это совершенно отдельная система, которая работает без вмешательства людей. То есть всю информацию, которую она обрабатывает, она никому не показывает. Поэтому мы, как инженеры поиска, не имеем никакого доступа к этим данным. Всё, что происходит в Вегасе, остается в Вегасе. Соответственно, всё, что происходит в рекламе, остается исключительно в рекламе. Не существует способа, который бы позволял хоть какую-то информацию оттуда извлечь. Реклама может догадываться, что вы женщина. Но никто никаким образом эту информацию использовать не может. Это принципиальная позиция компании, потому что это плохо для нас и плохо для пользователей. Кроме того, пользователь может изменять настройки своих рекламных предпочтений, в том числе категории интересов, а также отказываться от определенных рекламных услуг Google.
Как я понимаю, вы непосредственно занимаетесь голосовым поиском. Я никогда не видела, чтобы кто-то пользовался голосовым поиском, ни разу вообще. Разве что когда люди за рулем и им срочно нужно узнать адрес.
Дело в том, что когда кто-то на тебя смотрит, то это менее естественно — разговаривать с телефоном. В публичных местах люди предпочитают сохранить свою приватность и больше общаться с телефоном не через голос. Но есть ситуации, когда это совершенно необходимо. В качестве примера — как раз который вы привели, при вождении автомобиля. Я не вожу и не знаю, как у нас с этим, но в США, к примеру, это нарушение закона, если человек активирует свой телефон во время вождения. Если человеку что-то нужно во время того, как он ведет машину, то единственный способ — это пользоваться голосовым поиском, другого способа просто не дано. И это правильно, потому что бывают ситуации, когда ты просто не можешь держать телефон в руках. Плюс бывают ситуации, когда тебе что-то нужно получить быстро, потому что набирать сложнее и медленнее, чем спросить голосом. Бывают люди слабовидящие, бывают те, кому просто сложно попадать в эти маленькие клавиши.
Все-таки голосовой поиск — это сравнительно новая функция, которая появилась не так давно, пользователи продолжают ее открывать, они продолжают изучать, как это работает. Они продолжают находить для себя ситуации, в которых это было бы удобнее. Потому что всего лишь 15 лет пользователи ищут что-то в интернете, забивая текст в поисковые окна, и за эти 15 лет они выработали привычку. В ситуациях, когда было бы удобнее спросить телефон прямо так, они этого не делают, потому что сила привычки перевешивает. Требуется какое-то время на адаптацию, на понимание того, как вписать новые сценарии в привычные. Но, несомненно, голосовых запросов становится больше, люди учатся это использовать в самых разных ситуациях.
Если спрашивают, как готовить пирог, то, скорее всего, это женщина. А если спрашивают, как варить сосиски, то, вероятнее всего, мужчина
Вы изучаете взаимодействие пользователя с поисковой системой. Вроде понятно, но если поподробнее — вы изучаете, что пользователь хочет увидеть в поисковике?
Да. Фактически я изучаю, что он хочет получить. Даже необязательно то, что он хочет увидеть, а какую реакцию пользователь ожидает от поисковика. Потому что чем дальше, тем более естественным становится язык взаимодействия. Например, одно то, что можно, отправляясь в путешествие, спросить, сколько градусов в Милане, а потом спросить «а который там час», и поисковая система поймет, что вы интересуетесь временем в Милане, — это уже напоминает то, как один человек разговаривает с другим человеком. Это более естественная речь, которая заставляет нас меньше отвлекаться на построение фразы.
То есть чем более естественная речь, чем более естественные ответы на естественном языке мы в состоянии предоставить, тем больше мы делаем этот процесс взаимодействия человека с теми знаниями, которые содержатся в интернете, гладким и прозрачным. Человеку не надо думать, какие слова выбрать, какой подобрать запрос. То есть мы делаем так, чтобы человек общался с поисковиком так, как он общается с другом или приятелем детства. Соответственно, я занимаюсь тем, чтобы понимать, о чём люди спрашивают, и отвечать им так, чтобы это не звучало топорно.
сотрудничаете ли вы с лингвистами ДЛЯ ИЗУЧЕНИЯ ТОГО, КАК МЕНЯЕТСЯ ЯЗЫК?
Несомненно, лингвисты нужны. Но дело в том, что любой человек, владеющий своим родным языком, понимает, когда с ним разговаривают на правильном языке. Даже если кто-то ошибается и строит фразу неправильно, мы всегда понимаем, что является грамотным русским языком. Поэтому, конечно, у нас есть свои лингвисты, у нас есть люди с опытом компьютерной лингвистики. Разумеется, у нас лежит стопка книжек, которые могут подсказать, как строить фразу в наиболее сложных случаях, когда мы, вроде бы образованные люди, оказываемся в тупике.
С точки зрения лингвистики, с момента прихода Google в Россию как изменились запросы человека, какая сейчас идет тенденция?
Язык стал более понятным, более устным, так сказать. Запросы стали разговорными. Когда в 2004–2005-м все операционные системы были в своем детском периоде, пользователь пытался сформулировать запросы в поисковые системы на птичьем языке, на поисковом языке, не на естественном. Они привыкли использовать слова в именительном падеже, не согласовывать фразы, то есть, по сути, просто называть набор слов, который бы они хотели увидеть в документах. Если раньше вы бы сказали «прогноз погоды Москва», то сейчас вы можете сказать «прогноз погоды в Москве», «какая погода в Москве?», и это звучит как нормальный вопрос. Во-вторых, поиск за это время оброс дополнительными сервисами. Появились видео, карты, появился поиск по картинкам, люди начинают искать адреса. В конце концов, теперь человек может спросить «Почему вода не замерзает подо льдом?» и получить ответ.
Getty Images запустили проект Lean In — это такая библиотека картинок, изображающих женщин самых разных профессий. его цель — разрушить стереотипы о женщинах. у Google есть похожие проекты?
На самом деле Google делает очень много для того, чтобы девушки приходили в IT и строили успешную карьеру в этой области. Например, Google основал стипендию имени Аниты Борг, которая присуждается ежегодно наиболее сильным девушкам — студенткам в области компьютерных наук. А в марте этого года Google запустил серию мероприятий «Women Techmakers» — более 100 встреч в 52 странах мира, во время которых девушки могли посетить мастер-классы по планированию карьеры и обменяться опытом с ведущими женщинами-экспертами в технологической отрасли. Да и у нас в компании довольно много женщин-инженеров, которые занимают высокие позиции.
Как изменилась лично ваша жизнь за время работы в Google?
В первую очередь я привыкла к комфортной рабочей обстановке. Она включает в себя и людей, с которыми я работаю, и проекты, которые мы делаем, и то, как эта работа организована; доступность огромного количества информации и вычислительных мощностей, да и просто бытовые условия в офисе. В чём-то здешняя атмосфера похожа на атмосферу студенческого кампуса с его минимумом иерархии, с множеством планов и идей и с большим количеством разнообразных знаний и интересов.